wrmngr
wrmngr личный блог
05 декабря 2022, 12:12

Но моя модель машинного обучения может прогнозировать цены на активы!

  Минутка обучающего контента
   Перевод (twitter.com/bennpeifert/status/1587433226514989057)

Стационарность — одно из важнейших понятий теории вероятностей и статистики.

Суть его значения в том, что конкретный паттерн, который вы пытаетесь понять, постоянен в вероятностном смысле.

Технически это означает, его безусловное совместное распределение вероятностей не меняется со временем.

В блэкджеке правила игры известны и постоянны, и, основываясь на виденных до сих пор картах, мы можем узнать вероятности исходов следующей руки.

В финансах базовая структура мира сложна, неизвестна и меняется со временем. на пути к объективной, достоверной истине мало что есть. Любой анализ исторических данных, предполагающий иное, занижает неопределенность перспективных прогнозов.

Учебники сосредоточены на простых и очевидных случаях, таких как тот факт, что уровни цен на активы (в отличие от изменений) нестационарны. это, конечно, правда, и именно поэтому твиттер-шарлатаны постоянно публикуют графики ложной корреляции двух переменных во времени.

Но гораздо меньше академического внимания уделяется непредсказуемым изменениям в процессах генерации данных для доходности, волатильности, корреляции и т. д.

 

Отрицательные цены на нефть в марте 2020 года из-за нехватки хранилищ — один очень простой пример.

Академикам нравятся модели переключения режимов (regime switching models), но на практике они гораздо лучше подходят к историческим данным, чем к пониманию того, что такое истинные «режимы», и которые помогают наблюдать и прогнозировать изменения в реальном времени.

Когда кто-то пытается подогнать сильно нелинейную модель со многими неявными или явными параметрами к сложной динамической системе с процессом генерации данных, который меняется со временем, то результатом является прекрасное соответствие обучающей выборке и совершенно бесполезное прогнозирование на будущих данных.

Большинство методов AI/ML были разработаны для стационарных задач с высоким отношением сигнал/шум, например, для обработки изображений. Да, есть аналогичные задачи и в финансах, для которых они отлично подходят; на ум приходит автоматизация ручных задач, таких как сопоставление идентификаторов неизвестного формата.

Но наивное предсказание доходности активов не входит в их число. Трюки, которым они учат в классе (валидация с разделением выборки и т. д.), отчасти помогают, но не решают основную проблему, заключающуюся в том, что сигнал очень слаб по сравнению с шумом, и сигналы смещаются быстрее, чем вы можете научиться.

(это всегда было весело)

Есть некоторые очень специфические случаи, когда эта критика менее верна — например, HFT market making, когда имеется огромный объем данных за очень короткие периоды времени, когда основная динамика достаточно постоянна, а модели могут быстро адаптироваться.

B не подходите ко мне с тестами ADF, которые могут разумно ответить только на единственный вопрос типа «это полное безумие, чтобы запустить эту регрессию или посмотреть на этот график?», но не все остальное.

Мы можем научить компьютер играть в ГО, потому что структура игры не меняется. Поэтому мы можем смоделировать миллион игр и обучить нейронную сеть, и следующая игра будет точно такой же, как первый миллион, на котором мы обучались.

Опять же, речь идет не о том, что «машинное обучение бесполезно», совсем наоборот. Но вы должны думать о том, для каких задач оно полезно, как вы применяете это осмысленным образом и как быстро распознать ту чушь, которую вам внушают.

Я раскрываю здесь эту тему с точки зрения финансов, но та же история в целом верна для других сложных явлений, где структура проблемы неизвестна или непостоянна.

Например «мы решаем задачи здравоохранения, используя алгоритмы машинного обучения для диагностики заболеваний». Нет, вы не делаете этого.

61 Комментарий
  • Неудержимый трейдер
    05 декабря 2022, 12:16
    В блэкджеке правила игры известны и постоянны, и, основываясь на виденных до сих пор картах, мы можем узнать вероятности исходов следующей руки.
    Дальше читать уже не хочется :)
      • Неудержимый трейдер
        05 декабря 2022, 13:00
        wrmngr, да я это уже сотню раз слышал от любителей обвести казино. Никому из них это еще не удалось :) Но схема рабочая 100% !!
        Можно посчитать вероятность любого события без каких либо проблем. Вопрос лишь в том, что использовать в прибыль их не получится. Особенно в блэкджеке. Поэтому, читать дальше не интересно
          • Неудержимый трейдер
            05 декабря 2022, 13:10
            wrmngr, не удивлюсь. Потому что у меня друган, используя обычную тетрадь в клетку из 36 листов, описал рабочую схему выигрыша в рулетку ))
              • Неудержимый трейдер
                05 декабря 2022, 13:12
                wrmngr, как и Эдвард Торп
                  • Неудержимый трейдер
                    05 декабря 2022, 15:48
                    wrmngr, значит вы не поняли, что делал Торп )))
                    Уверен, вы по его методичкам уже обобрали все казино и пришли на рынок обирать нас. Успехов
                    • Мальчик buybuy
                      05 декабря 2022, 18:07
                      Юрий, эх, дружище...

                      Не хватает Вам образования и эрудиции...

                      Торп заложил начало процесса. К 2000 г. были разработаны практически идеальные стратегии игры в БЖ (сложные). Масса моих знакомых подняла сотни тысяч долларов.

                      Однако, ввиду малости МО при достаточно высокой дисперсии, я не стал играть в эту игру. Но свой миллион вынес в 2008 в оазис-покере (покер против казино).

                      И да, ТС — прав. БЖ — это детерминированная, полностью считаемая игра.

                      С уважением
                      • Foudroyant
                        05 декабря 2022, 20:09
                        Мальчик buybuy, а шахматы и шашки?
            • SergeyJu
              05 декабря 2022, 14:00
              Юрий, не надо путать друганов с профессионалами. Лучше бы Торпа почитали, очень умный человек, ученый  и весьма умелый спекулянт. 
              • Неудержимый трейдер
                05 декабря 2022, 15:50
                SergeyJu, ну точно не дураки. Причем и тот и другой. Друган тоже очень богатый человек.
                Но самое смешное, что чаще всего зарабатывают состояния совсем не теми способами, что описывают в своих «тетрадях» 
        • Errar
          07 декабря 2022, 04:37
          Юрий, Ну, мне и нескольким моим друзьям это удавалось, пока в Москве казино были. Правда, казино математиков вычисляли и вежливо (в отличии от шулеров) просили больше не приходить.
  • Pringles
    05 декабря 2022, 12:19
    прогнозировать может кто угодно 
  • Главком Главком
    05 декабря 2022, 12:21
    Берем ОбувьРоссии и прогрнозируем
  • Большой Брат
    05 декабря 2022, 12:22
    Give me four parameters and I shall describe an elephant; with five, it will wave its trunk (Дайте мне четыре параметра, и я опишу слона; с пятью он будет махать хоботом).
  • SergeyJu
    05 декабря 2022, 12:32
    Читается как предисловие к чему — то. Под многим бы подписался. Только конструктива нет.
      • SergeyJu
        05 декабря 2022, 14:03
        wrmngr, просто хочется прочесть то, к чему, собственно, было это введение. 
        Про сигнал/помеха, нестационарность, трудностях в применении ИИ к ценовым рядам и тому подобное я и сам могу написать. Так и писал на смартике не раз.
          • SergeyJu
            05 декабря 2022, 14:43
            wrmngr, машинг-ленинг-вьюношей со взором горящим надо на стажировку в поля отправлять. 
            На 1С годик попрограммировать или в гидроакустику погрузить. Пока не разберется хотя бы в одной предметной области, считать юнгой. 
        • Мальчик buybuy
          05 декабря 2022, 18:11
          SergeyJu, кстати

          Если перейти к реальным цифрам, то шум по абсолютной величине может превышать сигнал в 10-50 раз. По энергии цифры похожие (не идентичные).

          Я в своей (неосновной) военной специальности с такими челленджами не связывался. А Вы?

          Ну и мои споры с уважаемым А.Г. касательно зависимости/независимости приращений цен могут иметь схожую природу. При таком соотношении сигнал/шум (и негауссовом шуме) выборочные АКФ могут показывать все, что угодно. Не?

          С уважением
          • SergeyJu
            05 декабря 2022, 18:44
            Мальчик buybuy, я занимался обнаружением сигнала на фоне шумов. Но мы хотя бы приблизительно имели представление о структуре сигнала и помехи, поэтому могли усиливать сигнал и ослаблять шум достаточно успешно. 
            Что касается корреляции как меры — не уважаю. Она неустойчива и не решает базовый вопрос — повышение отношения сигнала к помехе. 
            При этом в многомерном случае ковариационная матрица полезный инструмент, я возился много с SVD разложением. Метод сильный, но не универсальный.  
            • Мальчик buybuy
              05 декабря 2022, 19:02
              SergeyJu, спасибо за развернутый ответ

              И все же — дьявол в деталях
              С каким предельным соотношением сигнал/шум Вы сталкивались в реале?

              С уважением
              • SergeyJu
                05 декабря 2022, 20:22
                Мальчик buybuy, в 10 раз улучшали легко, бывало, что и в 50 раз вытягивали, но уже в зависимости от конкретной помеховой обстановки. Море есть море. 
  • Dzem205
    05 декабря 2022, 12:43
    Само применение слова может-неможет, уже закончило дальнейшее прочтение этой, без преувеличения, ценной статьи.
    Зачем заниматься предсказаниями? Вам в другой клуб, здесь предсказатели, опирающиеся на волны с линиями, которые на грани лудоманства🤣🤣
      • Dzem205
        05 декабря 2022, 13:36
        wrmngr, вы серьезно о том, что посчитаете все вероятности и скажете, что с ноля заработаете хотя бы на остаток жизни?
        Ну ладно, не с ноля, а имея пару лимонов.
        Не смешите, если вам КТО-ТО не шепчет в ухо, думаю понимаете.
        А так, все сообщество смартлаба просто похоже на стадо индюков, просто отвести душу на умностях, особенно перед Новым годом, Кстати, с наилучшими пожеланиями вновом году, молодежи советую не лезть в это болото, и, администратор, удали меня насовсем.
        • kvazar
          06 декабря 2022, 09:54
          Dzem205, администратор, к сожалению, глух к таким просьбам на этом славном ресурсе…
    • ezomm
      05 декабря 2022, 13:23
      Dzem205, правильно.Самое простое -коридор.Он сохраняется пока торгует одна группа участников.Выход в другой коридор делает новый объем.
  • E L
    05 декабря 2022, 12:55
    В финансах базовая структура мира сложна, неизвестна и меняется со временем
    Она не просто меняется, а активно противостоит попыткам взаимодействия с ней с целью извлечения прибыли)
      • 3Qu
        05 декабря 2022, 13:23
        wrmngr, любая цена кому-то выгодна и кому-то невыгодна.
        Смотрим на торги — по любой цене покупают и продают. Ну, не все же они идиоты, чтобы делать это по невыгодным ценам.)
      • ezomm
        05 декабря 2022, 13:50
        wrmngr, не выгодные цены в середине коридора или в облаке Ишимоку.А выход из облаков и середины надо торговать тк это 2 й шаг цены.
          • ezomm
            05 декабря 2022, 14:38
            wrmngr, разметка не обязательна.Важна форма свечи.Если тело больше суммы теней, то это прогресс.Новые 3 таких свечи тренд, а 2 против коррекция.Этот тренд растягивается на +2 ...+2… и тд. даже 1 свеча = тренд.Перешагни волновой вперед к свечному.Сила тренда вверх
            L-ref(H,-2)   и условие сильного тренда  L >ref(H,-2). Можно и L >ref(C,-2).Но тут будут перекрытия уровней тенями.
  • ezomm
    05 декабря 2022, 13:19
    В торговле главное не прогноз, а знание точки входа. Далее важна жадность, те какую часть прибыли взять? на 3 месте размер убытка с одной сделки или убыток за 1 тайм .
    На последнем месте прогноз цены выхода, те цель тренда. Легче прогнозировать время до цели.Это объясняется тем, что график состоит из четных гармоник .180д-45д-9д и тд. Цель цены зависит от объема .
    все расчеты(в % от счета) можно делать по 1 средней свече тайма нашей торговли.
  • Николай Помещенко
    05 декабря 2022, 14:16
    не знаю, что вы учебниками называете. Но настоящие учебники дают базу. 
    Она не для прогнозов нужна, а для понимания что такое экономика и какое место у рыночных активов и бирж в народном хозяйстве.
      • SergeyJu
        05 декабря 2022, 14:58
        wrmngr, годных не видел ни одного. А негодные вроде бы ни к чему. 
          • SergeyJu
            05 декабря 2022, 16:21
            Eugene Logunov, 500 страниц, это, блин, годовой курс, не меньше.
            Вам что-то подошло в торговле, или показалось интересным? 
            • E L
              05 декабря 2022, 16:24
              SergeyJu, Про применение rl для маркетмейкинга интересно написано.
              • SergeyJu
                05 декабря 2022, 16:27
                Eugene Logunov, понял, не моя тема, увы. 
              • Мальчик buybuy
                05 декабря 2022, 18:13
                Eugene Logunov, кстати

                Как мне кажется (IMHO) на рынке есть 3 задачи:
                1. ТС с отличной эквити
                2. «Задача маркетмейкера» (поддержание узких котировок в плюс)
                3. Опционы и прочие отложенные платежные поручения

                Я сильно продвинулся в задаче 1 (в т.ч. практически), уже год успешно (IMHO) работаю над задачей 3 и не имею ни одной креативной мысли в части задачи 2.

                Это я тупой? Литературу подскажете? Буду лично признателен.

                С уважением
                • SergeyJu
                  05 декабря 2022, 20:23
                  Мальчик buybuy, номер 2 — портфель! А, может, даже номер 1.
                  • Мальчик buybuy
                    05 декабря 2022, 20:28
                    SergeyJu, нет

                    В п. 1 портфель просто сглаживает эквити. На любимых мною рынках далеко не всегда успешно
                    П. 2 — черная дыра для меня. Но портфель здесь точно не в кассу.

                    С уважением

Активные форумы
Что сейчас обсуждают

Старый дизайн
Старый
дизайн