Блог им. pol_unlim

Бычья ловушка – не то, о чем стоит беспокоиться

Бычья ловушка, медвежья ловушка – не то, о чем стоит беспокоиться. В конце концов это неформализованные паранаучные понятия. А вот ловушка, с которой сталкивается каждый постоянно, не понимая этого – это ловушка Байеса. И это не какое-то определение от спекулянтов, это математика и логика. И эта ошибка приводит к неверным действиям.

Представьте, что Вы тестируетесь на коронавирус. Хотя нет, так не интересно.
Представьте, что Вы проходили мед. осмотр, сдавали анализы, и у Вас один из тестов обнаружил очень редкое заболевание, которое встречается только у 1% людей, и которое смертельно по истечении нескольких месяцев. Тест в 90% случаев определяет больного, и лишь в 3% дает положительный результат здоровому. Похоже, что всё, можно бросать работу и идти во все тяжкие. Но Вы рано расслабились.

Какова реальная вероятность оказаться больным, 90%? А может, 100%-3%=97%? Давайте посмотрим.

Возьмите 1000 человек, у 1% данное заболевание. Это 10 человек. При этом тест дает результат 90% при тестировании больного. Это значит, что из этих 10 только 9 получили положительный тест. Однако тест также дает 3% ложноположительных результатов для здоровых людей, а это 990*3%=30 человек. Получается, что из 1000 человек 9+30=39 получат также положительный результат теста. При этом больных всего 10 человек. Вероятность того, что кто-то из положительно протестированных реально болеет, равна 9/39=23% (9- это те, кто реально болел и получил положительный тест, а 39 – это все те, кто в принципе получил положительный тест). Эта вероятность существенно меньше и 97%, и 90%, о которых Вы, скорее всего, сразу подумали.

Так как же реально рассчитать вероятность? В этом нам поможет теорема Байеса. Вероятность быть реально больным рассчитывается как отношение произведения вероятности заболевания в целом (1%) и вероятности получения положительного теста, будучи больным (90%), к произведению вероятности не заболеть (99%) и вероятности получения ложноположительного теста (3%) плюс числитель.Итого 1%*90%/(99%*3%+1%*90%)=23%.

50 лет назад исследования показали, что врачи не могут правильно интерпретировать тесты, попадают в ловушку Байеса, лишь 15% правильно могут оценить вероятности. Сегодня ситуация, вероятно, лучше, но опыт общения с врачами показывает, что многие всё еще не понимают сути.

Огромная разница 23% или 90-97%. Человек часто неверно оценивает вероятность событий и нередко завышает, когда трактует результаты тестов, индикаторов, макропоказателей и так далее. То же происходит и при тестировании инвестиционных стратегий.

Также проблемы всех тестов, как медицинских, так и торговых тестов (индикаторов), в том, что они могут давать ложноположительный результат (тест обнаруживает болезнь у здорового человека/ индикатор говорит о падении рынка) и ложноотрицательный результат (тест не обнаруживает болезнь у больного человека/ индикатор не говорит о падении рынка, а рынок берет и падает).Тесты разрабатывают так, чтобы снизить вероятность и того, и другого. Но снижать одновременно вероятности обоих ложных результатов не получится. Если индикатор очень чувствительный (срабатывает при малейших признаках обвала рынка), то снижается вероятность ложноотрицательного результата, но повышается вероятность ложноположительного, Вы продаете акции и пропускаете рост. И наоборот, вероятность продать акции, когда это не нужно, снижается, но возрастает вероятность нарваться на падение. И в инвестировании, в отличие от медицины, стоимость ошибки ложноотрицательного результата ниже, чем стоимость ошибки при ложноположительном: рынок долгосрочно растет, в конечном итоге можно пересидеть кризис, хотя иногда сидеть приходится по 15 лет; но вот продав акции, просидев с деньгами, когда акции растут, потом будет очень сложно догнать рынок, так как обыграть рынок в долгосрочном периоде в принципе довольно маловероятно и доступно мало кому. Однако главное – это правильно оценивать вероятность, прежде чем принимать решение.

Возьмем такой широко известный и упоминаемый индикатор, как кривая доходности казначейских облигаций. Считается, что её инверсия (отрицательный наклон) говорит о грядущем кризисе и обвале рынка. Для оценки часто используется разница в доходности между 10-ти летними казначейскими облигациями и 2-ух летними, сильный индикатор T10Y2Y, настолько же сильный, насколько бесполезный в реальном тайминге рынка из-за большого и неизвестного по продолжительности лага от пары дней до пары лет.

Мы же чисто для примера посмотрим на горизонт в один год: сколько раз индикатор предсказывал падение рынка более 15% в течении года после срабатывания. Срабатывание данного индикатора – это когда он становится отрицательным (это значит, что кривая доходности казначейских облигаций инвертирована).

Итак, с 1974 года индикатор T10Y2Y предсказал 86% падений S&P500 (на 15% и более) в течении последующих 12 месяцев. В 5% случаев индикатор дал ложноположительный результат, и падения более 15% с локальных максимумов не было. Однако значит ли это, что его точность 86%, а может 100%-5%=95%? Как Вы уже поняли, и не то, и не то.
Реальная вероятность падения в течении следующих 12 месяцев при срабатывании T10Y2Y должна оцениваться как частота падений за период в целом (это 7 раз за 46 лет или 15%) умножить на 86%, разделить на сумму 15%*86% и (100%-15%)*5%, что дает 75%. Это уже меньше чем 95% и 86%.

Таким образом стоит подходить к определению точности любых индикаторов и статистики. В нашем примере индикатор предсказал 86% падений, но его реальная оценка вероятности падения при срабатывании индикатора 75%. И это пример, где результат, кажется, не сильно поменялся: что 95%, что 86%, что 75% — всё это довольно много.  Но если еще учитывать то, что это вероятность падения в течении года, и мы выходим и сидим вне рынка год, то стоит еще учитывать, какую доходность показывал рынок с момента выхода и в течении года в те периоды, когда случались падения более 15% внутри периода. Если мы будем просто продавать акции на один год, то мы в среднем даже в эти периоды с падениями недополучим 9% доходности, потому что до падения и после падения рынок рос, если мы будем покупать сразу после падения на 15%, то здесь мы уже можем выиграть 6%. Второй вариант предпочтительнее. Будем от него отталкиваться, оценивая ожидаемую доходность нашей стратегии на основе T10Y2Y.

Допустим, сработал сигнал на продажу, тогда с вероятностью 75%, которую мы оценили, рынок будет падать, мы сможем выиграть около 6%. С вероятность 25% падения не будет, и если мы продадим акции, и в течении года так и не будет падения более 15%, то мы в среднем потеряем годовую доходность S&P500 в 10%. Итого ожидаемый результат выигрыша от продажи акций при срабатывании индикатора: 75%*6% — 25%*10%=2% (это корректная оценка).

А теперь возьмем неправильную интуитивную оценку вероятности падения рынка при срабатывании индикатора в 86% как количество предсказанных индикатором падений и посчитаем снова: 86%*6% — 14%*10%=4% (это некорректная оценка).Разница уже в 2 раза. При том, что, казалось бы, нет особой разницы 75% или 86%. По факту очень даже есть. И это только один из примеров с достаточно “сильным” индикатором. Часто оценка корректная и некорректная могут давать вообще противоположные результаты.

Так что не бойтесь попасть в бычью ловушку, главное, систематически не попадайте в ловушку Байеса.

А что касается баланса между ложноположительными и ложноотрицательными результатами, то я же стараюсь снижать частоту ложноположительных сигналов на продажу, по указанным выше причинам, поэтому использую менее чувствительные метрики, которые редко дают поводы для снижения доли рисковых активов. LongTermCM
★21
11 комментариев
Системы обычно характеризуются тремя параметрами.
1. вероятность обнаружения цели
2. вероятность пропуска цели
3. вероятность ложной тревоги.
Все три параметры независимы, как это ни странно.)
avatar
А если стратегия перевертыш лонг/шорт. И ложно положительный сигнал в лонг это одновременно и ложноотрицательный для шорта, и соответственно наоборот. 45%лонгов выбило по стопу, потому что пошли вниз, но я уже был не в шортах, знасит было 45% ложноотрицательных на шортах, однако, и 37% шортов выбивает по стопу, потому что пошли в лонг, но я остался вне рынка, и тут надо вставать в воскресень утром с кровать и брать в руки карандаш, потому что лежа все эти цифры в голове не умещаются
avatar
Если ставшихся 39 положительных результатов анализа еще раз протестировать, то результат резко улучшится, останется 8 больных, один уйдет в ложноотрицательный и один здоровый 3% от 39.собственно поэтому анализ на корону брали 2, а то и три раза.
Т.е если взять второй индикатор с примерно такой же точностью, как первый, то можно значительно сократить ложные сигналы, да часть правильных сигналов пропустим, но в трейдинге главное не терять, а уже потом зарабатывать. Есть логика?
avatar
Тихий омут, А вы что, в обе стороны работаете?
avatar
Larissa, стратегии-перевертыши лонг/шорт совсем не редкость в народе. А что в кэше то сидеть скучно.
avatar
Тихий омут, А одновременно лонг и шорт пробовали?
avatar
если мерять свое давление сидя — будет 1 результат. если лежа — будет др. результат. если стоя — 3-й результат. если покурить — то 4-й рез. и так далее. так какое у вас давление. вывод: лучше не мерять.
avatar
birga, 
вывод… кому выгодно?
avatar
baron_samedi, 
выгодно (бенефициару) — производителю тонометра, например. ну и там по списку: рекламодатели, аптеки и т.д…
avatar
birga, 
скворцариусу…
минздравиусу (чтобы уйней люди занимались и думали что лечатся...)
avatar
Я так понял, что добрая половина текста была заимствована из научпоп-канала на youtube — Veritasium (). Вы лишь немного интерпретировали по своему и получилось, что от вашего очень редкого заболевания, которое встречается у 1% людей, должны за несколько месяцев умереть больше людей, чем в целом умирает за год на всей Земле, хех.
avatar

теги блога pol_unlim

....все тэги



UPDONW