Этим вопросом недавно задались пользователи Quora. Автор самого популярного ответа в треде, специалист по платежным системам Файсал Хан (Faisal Khan) провел подробный расчет и выяснил, что на прочтение всего интернета целиком (точнее, всего контента на английском языке) понадобится 226 532 года при скорости чтения в 250 слов в минуту.
Таким был ход его вычислений.
Прежде всего, для ответа на этот вопрос необходимо сделать несколько допущений и принять ряд базовых правил:
Теперь необходимо разобраться с тем, насколько велик такой объем данных. Все будет зависеть от того, какое количество источников мы будем рассматривать. Для того чтобы лучше представить количество данных в интернете, давайте взглянем на некоторые источники.
Отсюда понадобятся следующие данные:
1. Количество твитов.
2. Число постов в Tumblr.
3. Число созданных вебсайтов.
4. Количество блогпостов.
К ним мы вернемся чуть позже, а пока определимся с другими источниками.
Pingdom опубликовал отличный отчет «Интернет 2012 в цифрах» (Internet 2012 innumbers). Отсюда нам будут нужны следующие факты:
1. 634 миллиона сайтов.
2. 87,8 млн — число блогов Tumblr.
3. 59,4 млн — число блогов на Wordpress.
4. 246 млн — число доменных имен.
5. 163 млрд твитов (на июль 2012) с момента запуска Twitter.
6. Более 200 млн пользователей LinkedIn (согласно информации с сайта соцсети).
Tumblr публикует собственную статистику, которую можно найти на странице About | Tumblrсайта. На 10 марта 2013 года данные по количеству постов таковы:
WorldWideWebSize.com, проиндексированная Google версия интернета выглядит вот так:
Project Gutenberg) является одной из важнейших причин этому. Однако количество книг, доступных на этом сайте, не превышает 42 000, а Open Libraryдает бесплатный доступ к более чем 1 миллиону книг.
И, конечно, нельзя забывать о Wikipedia… Вот статистика по этому сайту от Active Counters:
Wikipedia: Statistics
Чтобы визуализировать, можно представить, как бы выглядели все эти данные в напечатанном виде:
Иллюстрация показывает, как могли бы выглядеть статьи Wikipedia, если их распечатать, сшить в книгу и сложить в штабеля. При размере каждого тома в 25 см в высоту, 5 см в ширину (160 000 слов или 8 000 000 знаков)
Источник: Wikipedia: Size of Wikipedia
Займемся классификацией и упорядочиванием цифр.
Мы будем измерять следующие области контента:
Все эти предположения нашли свое отражение в расчётах, представленных ниже:
Источники контента и их размер:
Cossa.ru