В океані брехні: 6 фактів з книги Деніела Левітіна «Путеводитель по лжи»

118
bbc.co.uk
У чому помиляються експерти, як зачарувати інвестора, чому таблиця краща за формули і чим насправді займався Шерлок Холмс

Працю Деніела Левітіна можна було б назвати інакше – «Як брехати за допомогою статистики». Але книга з таким заголовком була написана Дареллом Хаффом ще в 1954 році й досі не застаріла. Однак «Путеводитель по лжи. Критическое мышление в эпоху постправды» спирається на сучасніші приклади (російський переклад випустило видавництво МИФ і навіть датувало його 2018 роком). Та й сприймається легше.

Автор – нейробіолог, психолог, професор Університету Макгілла в Монреалі (Канада). З-під його пера вийшли бестселери This is Your Brain on Music і The Organized Mind. Мабуть, через психологічну підготовку він багато уваги приділяє не лише цифрам і графікам, а й їхній інтерпретації, формулюванням, акцентам у викладі інформації, а від формул відмовляється майже повністю (іноді, мабуть, дарма).


Тому книга легко сприймається навіть людиною, з дитинства наляканою шкільною математикою.
К. Fund Media вибрав шість найкорисніших спостережень і рекомендацій.

1

Усереднення – страшна штука

Левітін показує, як можна «пограти із середнім» і яких помилок при цьому припуститися.

«Припустимо, ви прочитали, що середнє число дітей в сім’ї, що живе десь у передмісті, дорівнює трьом. Швидше за все ви зробите висновок, що в середньому у дитини має бути двоє братів і сестер (тобто брат і сестра, або дві сестри, або два брата).

Але це неправильно, тому що усереднення відбувається по різних групах: сім’я з десятьма дітьми враховується один раз в сімейній статистиці і десять разів, коли рахують кількість братів і сестер на одну дитину. За цією ж логікою середній працівник не отримує середню зарплату, а середнє дерево не росте в середньому лісі.

2

Подати інформацію можна по-різному навіть без брехні

Уявімо, що якийсь інвестор міркує, чи не побудувати йому фабрику одягу в штаті Юта. Щоб переконати його, потрібна статистика щодо народжуваності. А статистичні дані не дуже показові.

Юта виглядає краще, ніж Аляска і Монтана, але гірше, ніж Каліфорнія або Техас. А якщо вказувати не загальну кількість народжених, а відносну – на тисячу населення? Не допомагає – Юта губиться серед інших.


Ви можете пограти з кількістю величин в кожній категорії – я маю на увазі смужки в самому низу, від сірого до зовсім чорного».
Вийшло!

За словами професора, тут допомогло те, що в Юті дійсно високий рівень народжуваності. Але вважати можна й інакше — вибираючи в якості бази кількість новонароджених на квадратну милю або на магазин мережі Walmart. При належній фантазії можна знайти аргументи на користь будь-якого з 50 штатів.

3

Більшість експертів-предметників погано знають статистику

Автор наводить сумний приклад. Британку Саллі Кларк притягнули до суду за звинуваченням у вбивстві. Її перша дитина померла від СРДС (синдром раптової дитячої смерті), такий самий діагноз спочатку поставили і після того, як померло друге немовля.

Лікар, який виступав на стороні обвинувачення, доводив, що ймовірність такого збігу вкрай низька

Мовляв, СРДС виникає в одному випадку з 8543. Щоб отримати можливість двох таких смертей в одній родині, потрібно нібито звести у квадрат 1/8543 і отримати «один до 73 млн». Отже, треба підозрювати вбивство. На жаль, доктор знав педіатрію, але не знав статистики. Формула множення ймовірностей працює для незалежних подій, а діти в одній сім’ї можуть бути носіями одного і того самого генетичного захворювання, і «незалежність» зникає.

4

Більша вибірка – точніший результат

Під час тестування гібридного авто в одного маркетолога вийшло проїхати 129 км на 4,5 л палива, в іншого – лише 97. Хто бреше? Насправді обидва мають рацію. Комусь пощастило – їхав рівною дорогою, в гарну погоду, може, навіть із попутним вітром. Один тест нічого не вирішує, є висока ймовірність «статистичного викиду», тобто випадкового відхилення від норми. Що більше спроб, то точніший результат. Але на них може не бути грошей. Або компанія – виробник гібридних авто навмисне вказує найкращий, а не усереднений результат.

5

Малюйте таблички

З книги у книгу переходить один медичний приклад. «Імовірність того, що у жінки є рак молочної залози, дорівнює 0,8%. Якщо рак є, то ймовірність того, що мамографія його покаже, дорівнює 90%. Якщо раку немає, то мамографія може дати позитивний результат з імовірністю 7%. Жінка пройшла мамографію, результат позитивний. Яка ймовірність, що у неї справді рак?»

Наш мозок погано пристосований до роботи з відсотками. Левітін рекомендує від них переходити до конкретних цифр. Скажімо, уявити собі групу з 10 тис. жінок і розкласти її у так званій чотиричасній таблиці. Не будемо переповідати весь алгоритм побудови. Зауважимо лише, що в нижньому правому куті розташовано сумарну кількість жінок, а число 80 в тій самій правій колонці вгорі – це ті 80, у яких, на жаль, є рак (отримується множенням загальної кількості на ймовірність 0,8%). А правильна відповідь на запитання: навіть за позитивної мамографії ймовірність раку 9,4%.

6

Умовні ймовірності не працюють у зворотному напрямку

Імовірність того, що у мене підвищена температура за умови, що у мене кір, не дорівнює ймовірності того, що у мене справді кір за умови, що у мене жар. Кір справді супроводжується високою температурою (ймовірність висока), але жар буває при багатьох інших хворобах. На жаль, люди часто плутаються, що стає причиною медичних і судових помилок – в книзі є страшні приклади.

 

P.S. Шерлок Холмс не займався дедукцією. Бо дедукція –це логічний рух від загального до конкретного. А Холмс йде від деталей, на їх базі будує якусь теорію («ручка і блокнот лежать зліва від телефону, тому, швидше за все, загиблий – шульга»), але його висновки далеко не завжди бездоганні.

«З усієї нескінченної кількості найрізноманітніших теорій, які могли б щось пояснити, ми вибираємо ту, що є найбільш імовірною». Це називається абдукцією.

Поділитися: