Байесов подход к сверхъестественному

Как можно достоверно посчитать вероятность чуда?

Байесов подход к сверхъестественному

Знаменитый английский философ Дэвид Юм утверждал, что не может быть практически никаких доказательств существования чудес, основанных на показаниях людей. Под чудом Юм подразумевал нарушение законов природы, нечто, что не должно было произойти, но произошло.

Его аргументацию можно кратко свести к следующему псевдо-силлогизму:

  1. Следует доверять только показаниям, если есть уверенность в том, что тот, кто сообщает их, заслуживает доверия.
  2. Даже если мы доверяем свидетелю, мы должны учитывать, что люди часто принимают ложь за истину. Или выдают ложь за истину специально в качестве шутки или сознательной лжи.
  3. Но даже если оба первых критерия пройдены, то нам необходимо, чтобы вероятность того, что люди говорят правду, была выше, чем вероятность того, что люди просто ошибаются или сознательно лгут. Иными словами: должно казаться, что логичнее поверить в чудо, нежели в то, что все свидетели ошибаются.
  4. Следовательно, не стоит верить в чудеса.

В своё время, с этой аргументацией спорили как современник Юма Томас Рид, так и более поздние философы, например, Иммануил Кант. Их работы заслуживают всяческого уважения и интереса, однако я не хотел бы сейчас фокусироваться на них по следующей причине: несмотря на всю глубину их мысли, она есть всё равно их субъективное мнение, к которому пытливый ум образованного человека может найти множество контр-аргументов.

Я бы хотел обратиться к ещё одному прекрасному представителю шотландского народа — преподобному Томасу Байесу. Несмотря на то, что данный джентельмен жил сотни лет назад, его дело не просто процветает, а растёт семимильными шагами вместе с ростом машинного обучения и искусственного интеллекта (в смысле ML & AI).

Дело в том, что преподобный Байес сформулировал один замечательный закон в теории вероятности, создав де факто новое направление — байесову статистику. Давайте вместо того, чтобы давать определения и формулы, обсудим этот закон на примере следующей вполне жизненной задачи.

Необходимое введение

Пусть какой-то человек решил спонтанно сделать тест на одно заболевание. Пусть этим заболеванием болеет 1% населения. Сам тест тоже неидеален — в 70% случаев он даёт верный результат, а в 30% случаев — ложный. Тестирование показало положительный результат: болен. С какой вероятностью результаты тестирования правдивы?

Многие люди на этот вопрос сразу же выпалят: 70%, ведь тест даёт именно такой "уровень достоверности", если так можно выразиться. Однако это совсем не так. Точнее, вообще не так.

Почему? Если на словах: когда мы говорим о 70% верных результатов, мы не учитываем тот факт, что заболеванием болеют всего 1% населения. Непонятно и нелогично? Давайте разбираться.

Проще всего разбираться на конкретных числах.

  1. Давайте возьмём 1000 людей.
  2. По условию, из них 1% — больные, то есть, 10 человек. Соответственно, здоровых — 990 человек.
  3. Теперь давайте их всех протестируем.
  4. Среди 990 здоровых человек тест в 70% случаев покажет верный результат, то есть, тот факт, что человек здоров. В числах это: 990x0.7=693 человек, верно определённых здоровыми.
  5. А в 30% случаев тест покажет ложно-положительный результат, то есть, что человек болен, хотя он здоров. В числах: 990x0.3=297 человек, ложно названных больными (они на самом деле здоровы).
  6. А что среди 10 больных? По аналогии: в 70% случаев будет верный результат — то, что человек болен. То есть, 10x0.7=7 человек будут определены как больные (и таковыми являются).
  7. 30% — ложные результаты теста. Значит, 10x0.3=3 человека будут названы здоровыми, хотя по факту они больны.
  8. Отлично, а теперь мы можем по-детски посчитать, какой процент людей из тех, у кого положительные (то есть, что они больны) результаты тестирования, реально больны.
  9. Всего таких людей — 7 человек. Но скольким людям тест выдал положительные результаты? 297 из первой группы здоровых и 7 из второй группы больных, то есть, 297+7=304 человека.
  10. Значит, процент легко считается: 7/304 ~= 2.30%

Вот это — настоящая цифра. Таким образом, если всего 1% населения болеет, а распределение тест в 70% случаев работает верно, то вероятность того, что человек реально болен при получении положительного теста равна 2.3%. Согласитесь, 2.3% против "интуитивных" 70%.

Вы спросите, а какое отношение эта задача имеет к исходной теме статьи? И правильно сделаете, но это введение было необходимо, чтобы понять логику подхода :)

Байесов подход

Давайте посмотрим на задачу с другого угла. Нам изначально известно, что 1% людей болеют некоторым заболеванием. При этом есть некоторый тест, который умеет с вероятностью 70%/30% определять, больной человек или нет.

Сформулируем задачу так: насколько положительный результат теста повышает вероятность болезни человека с 1%? Собственно, на этот вопрос мы и нашли ответ: он повышает до 2.3%.

То есть, принцип Байеса делает следующее:

  1. У нас есть некоторое событие (в нашем случае — факт болезни).
  2. У этого события есть априорная вероятность возникновения (у нас — 1%).
  3. Есть дополнительный факт в виде другого события (в нашем случае — факт положительного результата теста), которое имеет свою вероятность.
  4. С помощью метода Байеса можно оценить, насколько факт из пункта 3 меняет исходную вероятность.

А вот теперь, собственно, мы можем перейти к теме статьи. Рассмотрим какое-то чудо: например, спонтанное появление сахарной ваты из воздуха. Разумеется, вероятность этого события крайне мала, но не невероятна, хотя бы из принципов квантовой механики.

Пусть у нас есть десять свидетелей, которые это видели. Оценив исходную вероятность, равно как "уровень доверия" к свидетелям, мы можем посчитать новую вероятность, уже с учётом этих фактов. И если исходная вероятность чуда была крайне низка, то десяток свидетелей, которым можно доверять, могут существенно изменить расклад.

Мы можем установить для себя, какой уровень для нас является достаточным для того, чтобы поверить в чудо, а какой — нет. Собственно, никакой магии — просто числа (хотя они — так ещё магия).

Конечно, многое в этой схеме "вилами по воде писано": например, как оценить исходную вероятность в виде числа, как оценить уровень доверия к свидетелям?

Однако это не столь важно, когда речь заходит о принятии решений. Обычно проблемы формулируются настолько сложно, что чётко посчитать всё не получится: слишком много зависимостей, слишком много параметров, слишком много неопределённостей. Любая серьёзная жизненная проблема имеет очень много "если" (в противном случае, она не была бы серьёзной :)).

Соответственно, тут на помощь и приходит Байесов подход. Субъективный анализ исходной вероятности и субъективный анализ важности тех или иных фактов плюс формула Байеса дают возможность понять, какое решение лучше подойдёт.

При этом тут можно брать в расчёт вообще всё что угодно. Например, некоторые поклонники Юнга могут уделять особое внимание синхронистичности. Для науки, разумеется, это неприемлемо, но когда вам нужно принять ваше личное решение, то в ход можно пускать всё.

Но как объективно оценить важность? Просто включите этот факт как реально существующий в формулу Байеса. В конце концов, именно ваши чувства и эмоции подскажут важнейший критерий — уровень доверия. А формула избавит от субъективного исключения неудобных фактов или переоценки / недооценки каких-то из них.

Вот такой интересный метод. Есть, кстати, книга Стивена Анвина "Простое вычисление, доказывающее конечную истину, или вероятность Бога", где похожий метод был применён для доказательства существования Бога. Разумеется, эта аргументация работает исключительно в том случае, если ваше субъективное ощущение важности тех или иных фактов совпадает с авторским, но в качестве "пищи для ума" имеет право на существование.

 


Ложки нет © 2019 — 2024.