Replikant_mih
Replikant_mih личный блог
05 июля 2020, 12:53

Что я понял, обучая модели.

Вернее так: что я увидел, обучая модели. Всякие подобные темы любят поднимать трейдеры, они отлично располагают для пространных рассуждений о рынке и жизни, а я это, можно сказать, увидел наглядно. В общем, наблюдения не что-то гениальное, мной открытое, не грааль, но я это наблюдаю.

 

Что я делаю:

Играюсь с моделями ML, играюсь гипер-параметрами – параметрами самих моделей непосредственно и моими какими-то входящими параметрами. Смотрю как меняются результаты в зависимости от этих параметров.

 

Что я увидел:

  1. Где-то закономерностей объективно больше, где-то объективно меньше. Если прочесываешь график моделями (с разными параметрами) по мат. ожиданию OOS результатов совокупности моделей и по их распределению видно, что из каких-то графиков закономерности извлекаются на ура, а из каких-то со скрипом. В данном случае график это пересечение по тикер-TF-временной отрезок. Да даже если брать только тикер, некоторые, что называется, палку воткни, она зацветёт, а в некоторых надо очень постараться, чтобы нащупать нормальные закономерности.
  2. Похоже, действительно легче прогнозировать на короткие интервалы. Но эта закономерность выглядит не так, как её обычно преподносят. Обычно в ходу какая-то такая версия: чем ближе, тем легче, типа на минуты легче, чем на часы и т.д. Я бы сказал, что подтверждение находит скорее следующее: чем больше отношение горизонта прогноза к длине промежутка времени, данные из которого непосредственно участвуют в прогнозе. Ну т.е. если ты принимаешь решение по 50 свечам, то на 2*50 можно прогнозировать с большей точностью (winrate), чем на 10*50 и т.д. При этом в другом контексте, например, если ты ушел на TF выше, ты эти 10*50 сможешь спрогнозировать уже с хорошей точностью.
  3. Объективно раньше было зарабатывать легче. По ошибке из большого промежутка времени сначала какое-то время брал для обучения данные не самые свежие, а самые древние и удивлялся очень приличным результатам моделей, на свежих данных моделям можно сказать драматически сложнее извлекать закономерности.
32 Комментария
  • SergeyJu
    05 июля 2020, 13:05
    По мере «взросления», и отдельные акции, и рынки в целом имеют тенденцию превращаться из ярко трендовых в слабо контртрендовые. Думаю, что именно этот процесс Вы и видите. «Раньше зарабатывать было легче» ~ нынешние старички раньше были молодыми, а тогдашних старичков мы не в основном уже не застали.
  • SergP
    05 июля 2020, 13:24
    Свежие данные — это что значит?
  • GOLD
    05 июля 2020, 13:51
    Толково.
    После многочисленных бэк- и форвад-тестов разных алгоритмов на разных инструментах пришел к примерно таким же выводам.
      • Олайвир Стокс
        05 июля 2020, 19:34
        Replikant_mih, 
        движение реальных залогов — акций\сырья должны быть другие, нежели движение котировок контрактов — фьючерсов
          • Олайвир Стокс
            05 июля 2020, 21:10
            Replikant_mih, 
            к закономерностям, рынки залогов и контрактов различны
  • valemill
    05 июля 2020, 14:21
    Модели псевдо-хаоса? Думаю ( может не прав ).что свечки выстраиваются исходя из псих.факторов и текущей или ожидаемой инфы.Верифицировать эти факторы не возможно (пока ) -слишком огромные массивы.И построить идеальную модель с х -неизвестными и у-весами — невозможно
  • valemill
    05 июля 2020, 14:29
    Ну. все же ищут Грааль
      • SergeyJu
        05 июля 2020, 15:10
        Replikant_mih, где их, некоррелированных, столько набрать?
          • SergeyJu
            05 июля 2020, 15:52
            Replikant_mih, у Вас уже получилость? 
  • старый трейдер
    05 июля 2020, 16:34
    на свежих данных моделям можно сказать драматически сложнее извлекать закономерности.

    От моделей зависит. У некоторых работа улучшается с ростом объемов/ликвидности.
  • Леха Майтрейд
    05 июля 2020, 20:37
    На каких данных тестишь? минутки\тики? 
      • Леха Майтрейд
        06 июля 2020, 11:09
        Replikant_mih, 
        Да мне какие ты тф используешь не интересно… интересно из каких данных ты их строишь… какого типа дата у тебя :).
        Минутки:

        20200705 220100;3121.25;3126.25;3121.25;3125.75;1912
        20200705 220200;3125.75;3129;3125.25;3128;1467
        20200705 220300;3128;3128.75;3127.25;3128;644
        20200705 220400;3128;3128.5;3127.25;3128;413

        или тики:

        20200311 220000 0150000;2727;2727;2727;7
        20200311 220000 0270000;2727.5;2726.25;2727.5;1
        20200311 220000 0270000;2726.25;2726.25;2727.5;2
        20200311 220000 0390000;2726.25;2726.25;2727.25;2
        20200311 220000 0460000;2726;2726;2728;1
        20200311 220000 0660000;2728;2726;2728;1
        20200311 220000 0660000;2728;2726;2728;1
        20200311 220000 0660000;2728.25;2726;2728.25;1
        20200311 220000 0660000;2728.25;2726;2728.25;1
        20200311 220000 0660000;2728.75;2726;2728.75;3
        20200311 220000 0700000;2726;2726;2728.25;1
        20200311 220004 7380000;2728.5;2728.5;2729.75;1
        20200311 220005 0820000;2729.75;2728.75;2729.75;2
        20200311 220009 6400000;2727.25;2727.25;2728.75;1
        20200311 220015 1440000;2727.25;2725.25;2727.25;1


        На тиковых данных не обязательно тиковый график смотреть))). 
        Просто можно построить тф меньше минуты… например 50sec.

        Мало ли, мож у тебя какие раритетные старые тиковые данные есть по фьючам)))).
  • Vladimir N.
    06 июля 2020, 12:27
    Да нифига, модели есть рабочие и можно применять абсолютно на любом ТФ. Необязательно так заморачиваться

Активные форумы
Что сейчас обсуждают

Старый дизайн
Старый
дизайн