Как статистика может обманывать: три задачи о коварных данных
Колумнист The Guardian Алекс Беллос предложил читателям три задачи о том, как статистика может вводить в заблуждение. Вот их разбор с неожиданными решениями.
Казалось бы, если в двух опросах поддержка политики среди мужчин выше, чем среди женщин, то и в целом мужчины должны поддерживать её чаще. Но не тут-то было. Александр Беллос, автор головоломок в The Guardian, на примерах показывает, как легко попасть в ловушку цифр.
Парадокс Симпсона: когда сумма не равна частям
Вторая задача – классический пример парадокса Симпсона. Две компании, Smith Surveys и Jones Polls, опросили по 125 человек. Smith выявил: среди мужчин поддерживают политику 21 из 25 (84%), среди женщин – 80 из 100 (80%). Jones дал другие цифры: среди мужчин – 22 из 100 (22%), среди женщин – 5 из 25 (20%). В каждом опросе поддержка мужчин выше, но если сложить данные, получается: мужчины – 43 из 125 (34%), женщины – 85 из 125 (68%). То есть на самом деле политику чаще поддерживают женщины.
Причина в том, что Smith опросил много женщин в группе, где поддержка в целом высока, а Jones – много мужчин в группе с низкой поддержкой. При объединении веса групп меняют картину. Этот эффект называется парадоксом Симпсона и часто встречается в реальных исследованиях.
Как улучшить оценки всем, но снизить среднее?
Первая головоломка касалась успеваемости. В школе два класса. В первый год медианная оценка – C. На второй год вводят новую программу, и медиана падает до D. Как такое возможно, если каждый ученик улучшил свой результат?
Ответ заключается в изменении состава классов. Пусть в первый год в первом классе все получили C, во втором – E (и учеников в первом классе на одного больше, чтобы медиана была C). Во второй год все C стали B, а все E – D. Но если во второй класс пришли два новых ученика, получивших D или ниже, медиана всей когорты смещается вниз. Статистика не учитывает новых учеников – и создаёт ложное впечатление.
Беллос подчёркивает: часто цифры обманывают нас именно из-за неполноты информации. Если не знать, что состав группы изменился, выводы будут ошибочными.
Языковые игры: «Anguish Languish» и победитель
Третья часть – конкурс «Anguish Languish», где английские фразы превращаются в похожие по звучанию, но бессмысленные строки. Например, «Starmer’s gone» стало «Star myrrh scone». Победителем стал Эдвард Барретт с рифмой: «Mary had a little lamb» превратилась в «Myriad Al tell ’em, eats fleas worse wight ass know». Автор книги «You Don’t Know What You’re Missing» Кит Йейтс вручил победителю экземпляр.
Эти головоломки – не просто развлечение. Они напоминают, как легко ошибиться, полагаясь на интуицию в анализе данных. Будь то опросы, школьные оценки или даже статистика в новостях – всегда стоит проверять, что скрывается за цифрами.
Комментарии
0 всего