В океане вранья: 6 фактов из книги Дэниела Левитина «Путеводитель по лжи»

61
bbc.co.uk
В чём ошибаются эксперты, как очаровать инвестора, почему таблица лучше формулы и чем на самом деле занимался Шерлок Холмс

Труд Дэниела Левитина можно было бы назвать иначе – «Как лгать при помощи статистики». Но книга с таким заголовком была написана Дареллом Хаффом еще в 1954 году и до сих пор не устарела. Однако «Путеводитель по лжи. Критическое мышление в эпоху постправды» опирается на более современные примеры (русский перевод выпустило издательство МИФ, и даже датировало его 2018 годом). Да и воспринимается легче.

Автор – нейробиолог, психолог, профессор Университета Макгилла в Монреале (Канада). Из-под его пера вышли бестселлеры This is Your Brain on Music и The Organized Mind. Видимо, из-за психологической подготовки он много внимания уделяет не только цифрам и графикам, но и их интерпретации, формулировкам, акцентам в изложении информации, а от формул отказывается почти полностью (иногда, пожалуй, зря).


Поэтому книга легко воспринимается даже человеком, с детства напуганным школьной математикой.
К. Fund Media выбрал шесть самых полезных наблюдений и рекомендаций.

1

Усреднение – страшная штука

Левитин показывает, как можно «поиграть со средним» и какие ошибки при этом совершить.

«Допустим, вы прочли, что среднее число детей в семье, живущей где-то в пригороде, равно трём. Скорее всего вы сделаете вывод, что в среднем у ребенка должно быть двое братьев и сестер» (то есть брат и сестра, или две сестры, или два брата).

Но это неверно, потому что усреднение происходит по разным группам: семья с десятью детьми учитывается один раз в семейной статистике и десять раз, когда считают количество братьев и сестёр на одного ребенка. По этой же логике средний сотрудник не получает среднюю зарплату, а среднее дерево не растёт в среднем лесу.

2

Подать информацию можно по-разному даже без вранья

Предположим, что некий инвестор подумывает, не построить ли ему фабрику одежды в штате Юта. Чтобы убедить его, нужна статистика по рождаемости. А статистические данные не слишком показательны.

Юта выглядит лучше, чем Аляска и Монтана, но хуже, чем Калифорния или Техас. А если указывать не общее количество рождённых, а относительное – на тысячу населения? Не помогает – Юта теряется среди прочих.

«Вы можете поиграть с количеством величин в каждой категории – я имею в виду полоски в самом низу, от серого до совсем чёрного».
Получилось!

По словам профессора, тут помогло то, что в Юте действительно высокий уровень рождаемости. Но считать можно и иначе – выбирая в качестве базы количество новорожденных на квадратную милю или на магазин сети Walmart. При должной фантазии можно найти аргументы в пользу любого из 50 штатов.

3

Большинство экспертов-предметников плохо знают статистику

Автор приводит печальный пример. Британка Салли Кларк была привлечена к суду по обвинению в убийстве. Её первый ребенок умер от СВДС (синдром внезапной детской смерти), такой же диагноз был первоначально поставлен и после того, как умер второй младенец.

Врач, выступавший на стороне обвинения, доказывал, что вероятность такого совпадения крайне низка

Дескать, СВДС возникает в одном случае из 8543. Чтобы получить вероятность двух таких смертей в одной семье, нужно якобы возвести в квадрат 1/8543 и получить «один к 73 млн». Значит, надо подозревать убийство. Увы, доктор знал педиатрию, но не знал статистики. Формула перемножения вероятностей работает для независимых событий, а дети в одной семье могут быть носителями одного и того же генетического заболевания, и «независимость» пропадает.

4

Больше выборка – точнее результат

При тестировании гибридного авто у одного маркетолога получилось проехать 129 км на 4,5 л топлива, у другого – только 97. Кто врёт? Да оба правы. Кому-то повезло – ехал по ровной дороге, в хорошую погоду, может, даже с попутным ветром. Один тест ничего не решает, высока вероятность «статистического выброса», то есть случайного отклонения от нормы. Чем больше попыток, тем результат точнее. Но на них может не быть денег. Или компания – производитель гибридных авто нарочно указывает самый лучший, а не усредненный результат.

5

Рисуйте таблички

Из книги в книгу кочует один медицинский пример. «Вероятность того, что у женщины есть рак молочной железы, равна 0,8%. Если рак есть, то вероятность того, что маммография его покажет, равна 90%. Если рака нет, то маммография может дать положительный результат с вероятностью 7%. Женщина прошла маммографию, результат положительный. Какова вероятность, что у неё в самом деле рак?»

Наш мозг плохо приспособлен к работе с процентами. Левитин рекомендует от них переходить к конкретным цифрам. Скажем, представить себе группу из 10 тыс. женщин и разложить её в так называемой четырехчастной таблице. Не будем пересказывать весь алгоритм построения. Заметим только, что в нижнем правом углу расположено суммарное количество женщин, а число 80 в той же правой колонке вверху – это те 80, у которых, увы, есть рак (получается умножением общего количества на вероятность 0,8%). А правильный ответ на вопрос: даже при положительной маммографии вероятность рака 9,4%.

6

Условные вероятности не работают в обратном направлении

Вероятность того, что у меня повышенная температура при условии, что у меня корь, не равна вероятности того, что у меня в самом деле корь при условии, что у меня жар. Корь в самом деле сопровождается высокой температурой (вероятность высокая), но жар бывает при многих других болезнях. Увы, люди часто путаются, что становится причиной медицинских и судебных ошибок – в книге есть душераздирающие примеры.

 

P.S. Шерлок Холмс не занимался дедукцией. Ибо дедукция – это логическое движение от общего к частному. А Холмс идет от деталей, на их базе строит некую теорию («ручка и блокнот лежат слева от телефона, поэтому, скорее всего, погибший – левша»), но его заключения далеко не всегда безупречны.

«Из всего бесконечного множества самых разнообразных теорий, которые могли бы что-нибудь объяснить, мы выбираем ту, что наиболее вероятна». Это называется абдукцией.

Поделиться: