Цифровая сыворотка правды: «Все лгут» Сета Стивенса-Давидовица

370
K.Fund Media
Почему люди откровенны наедине с поисковой страницей в интернете и что из этого можно извлечь

Да, это еще одна книга о больших данных (Big Data) – как, например, «Просчитать будущее» Эрика Сигеля. Что поделать, тенденция!

Чем же хороша именно «Все лгут. Поисковики, Big Data и интернет знают о вас всё»?

Во-первых, она свеженькая, написана в 2017-м, русский перевод издательство «Эксмо» выпустило в начале 2018-го. Там даже избрание Дональда Трампа успели проанализировать с точки зрения статистики.

Во-вторых, автор – специалист Google по Data Science и по совместительству – журналист The New York Times (надеемся, не только поэтому газета включила книгу в список бестселлеров). Поэтому пишет он легко, ярко, с юмором и изо всех сил пытается убедить читателя, что Big Data – это просто.

В-третьих, он рассказывает еще и о том, чего эта новая технология не может и на чем спотыкается.

Скажи мне, что ты ищешь в интернете…

Исследовал же Сет Стивенс-Давидовиц прежде всего поисковые запросы в Google. Они, дескать, гораздо информативнее любых социологических исследований и даже записей в соцсетях. Логика примерно следующая. Во время соцопросов люди склонны давать социально приемлемые ответы, преувеличивать, прибегать к самообману и прочее (отсюда и название книги).

История поиска в интернете может сказать о вас больше, чем вы думаете. rankmediaagency.com

В тексте есть шикарный пример. Исходя из данных социсследований гетеросексуальных женщин, в США ежегодно используется 1,1 млрд презервативов.

Данные гетеросексуальных мужчин дают другую цифру – 1,6 млрд, хотя, по идее, тут должно быть совпадение. Но если верить исследовательской компании Nielsen, в Штатах ежегодно продается менее 0,6 млрд «изделий №2». Так что о сексе врут и мужчины, и женщины, но по-разному.

В океане вранья: 6 фактов из книги Дэниела Левитина «Путеводитель по лжи»

В соцсетях люди тоже не всегда правдивы: «Facebook – это средство для того, чтобы похвастаться друзьям о том, как в моей жизни все хорошо». А вот когда человек что-то ищет в поисковике, у него есть стимул для откровенности. При опросе респондент может и не признаться, что у него депрессия, расистские взгляды или редкие сексуальные фантазии. Но в Google он лезет как раз за тем, что его интересует – за информацией об антидепрессантах или за шуточками про «ниггеров».

Сила больших данных

Анализ таких запросов позволяет определить приближение эпидемии гриппа: поисковые фразы «симптомы гриппа» и «боль в мышцах» – важные показатели распространения заболевания. Или, скажем, понять, стоит ли верить во фрейдизм. По Стивенсу-Давидовицу, не слишком: «опечатки по Фрейду» действительно существуют, люди вместо pedestrian («тротуар») иногда набирают penistrian, но такие ошибки встречаются не чаще других, без сексуальной окраски.

Facebook – это средство для того, чтобы похвастаться друзьям о том, как в моей жизни все хорошо

И да, американцы часто видят во сне бананы (второе место среди снящихся плодов) – но лишь потому, что в Штатах это второй по продаваемости фрукт.

Хотя кое в чем – если анализировать запросы в Google – старик Зигмунд, похоже, был прав. Эти технологии позволяют отследить – эффективнее полицейских отчетов – рост домашнего насилия в семьях, уровень безработицы или связь между учебным заведением и последующей карьерой выпускника. При этом, конечно, нужно, чтобы у безработных был доступ к компьютерам с интернетом (тут Штаты, пожалуй, от Украины в чем-то отличаются).

Судя по анализу поисковых запросов в сети, Фрейд в чем-то прав. partiallyexaminedlife.com

А вот, скажем, поведение курса акций эта новая магия предсказать не может. В частности, потому, что в финкомпаниях уже активно применяют самые разные компьютерные модели, влияющие на рынок (искажающие его).

Наконец, в ряде случаев вместе с большими данными Стивенс-Давидовиц рекомендует использовать «малые данные» – то есть поговорить с живым человеком, который разбирается в вопросе и способен увидеть то, что проглядел ослепленный терабайтами цифр алгоритм. Потому что «все врут» – даже компьютеры. И даже Сет Стивенс-Давидовиц. Но не всегда.

Поделиться: