Сколько роликов опубликовано на YouTube и какой их процент генерирует большинство просмотров?

27 декабря, 2023  16:31

Оценить настоящий объем интернет-платформы довольно сложно, однако доцент кафедры государственной политики, коммуникаций и информации Массачусетского технологического института (MIT), сооснователь блог-агрегатора Global Voices, интернет-активист и блогер Итан Цукерман и его коллеги посчитали, что на видео-платформе YouTube опубликовано более 13,3 миллиарда роликов. При этом, большинство просмотров генерируют лишь 4% из этих роликов, большинство других же остаются незамеченными.

Сложность оценки размера YouTube заключается в том, что, несмотря на наличие хорошо задокументированного API, нет надежного способа получить случайную, репрезентативную выборку на этой платформе. Поэтому в большинстве исследований на YouTube изучается либо коллекция видеороликов (все ролики на каналах выбранного набора пользователей), либо ролики, найденные по рекомендациям. Проблема в том, что ни один из этих подходов не позволяет рассчитать размер YouTube, то есть подсчитать количество опубликованных на платформе роликов.

Для решения этой проблемы исследователи обратились к Джейсону Баумгартнеру, создателю проекта по парсингу Reddit под названием PushShift и обладателю обширных знаний в сфере работы с недокументированными API для сбора данных.

Джейсон предложил с помощью инструмента InnerTube создавать случайные URL-адреса YouTube (которые выглядят следующим образом — https://www.youtube.com/watch?v=vXPJVwwEmiM, где изменяются значения после «watch?v=») и проверять, действительно ли они существуют.

Благодаря этому подходу им удалось подсчитать, что на платформе существует более 13 миллиардов видео: ученые подсчитали, что существует 264 возможных URL-адресов YouTube (примерно 18,4 квинтиллиона ссылок). Если предположить, что на YouTube существует 1 млрд роликов, то в случае набора URL наугад удавалось бы получать верный адрес только в одной из 18,4 млрд попыток. Исследователи назвали этот метод «пьяный дозвон», после оптимизации которого за несколько месяцев им удалось выявить 10 000 действительно случайных роликов на платформе.

«Попадание» в ходе исследования фиксировалось примерно каждые 50 000 наборов. В итоге исследователям удалось подсчитать, что объём YouTube составляет 13 235 821 970 видео. Это и другие статистические значения каждые несколько недель обновляются на площадке tubestat.org.

Исследователи также выяснили, что «средний» ролик на площадке имеет лишь 39 просмотров. А к просмотрю платформа обычно предлагает ролики, существенно отличающиеся от «средних» и имеющие не менее чем 10 000 просмотров. А таких роликов — примерно 4% от всего контента, размещенного на платформе.


 
 
 
 
  • Архив