Блог им. Replikant_mih

Что я понял, обучая модели.

Вернее так: что я увидел, обучая модели. Всякие подобные темы любят поднимать трейдеры, они отлично располагают для пространных рассуждений о рынке и жизни, а я это, можно сказать, увидел наглядно. В общем, наблюдения не что-то гениальное, мной открытое, не грааль, но я это наблюдаю.

 

Что я делаю:

Играюсь с моделями ML, играюсь гипер-параметрами – параметрами самих моделей непосредственно и моими какими-то входящими параметрами. Смотрю как меняются результаты в зависимости от этих параметров.

 

Что я увидел:

  1. Где-то закономерностей объективно больше, где-то объективно меньше. Если прочесываешь график моделями (с разными параметрами) по мат. ожиданию OOS результатов совокупности моделей и по их распределению видно, что из каких-то графиков закономерности извлекаются на ура, а из каких-то со скрипом. В данном случае график это пересечение по тикер-TF-временной отрезок. Да даже если брать только тикер, некоторые, что называется, палку воткни, она зацветёт, а в некоторых надо очень постараться, чтобы нащупать нормальные закономерности.
  2. Похоже, действительно легче прогнозировать на короткие интервалы. Но эта закономерность выглядит не так, как её обычно преподносят. Обычно в ходу какая-то такая версия: чем ближе, тем легче, типа на минуты легче, чем на часы и т.д. Я бы сказал, что подтверждение находит скорее следующее: чем больше отношение горизонта прогноза к длине промежутка времени, данные из которого непосредственно участвуют в прогнозе. Ну т.е. если ты принимаешь решение по 50 свечам, то на 2*50 можно прогнозировать с большей точностью (winrate), чем на 10*50 и т.д. При этом в другом контексте, например, если ты ушел на TF выше, ты эти 10*50 сможешь спрогнозировать уже с хорошей точностью.
  3. Объективно раньше было зарабатывать легче. По ошибке из большого промежутка времени сначала какое-то время брал для обучения данные не самые свежие, а самые древние и удивлялся очень приличным результатам моделей, на свежих данных моделям можно сказать драматически сложнее извлекать закономерности.
★10
32 комментария
По мере «взросления», и отдельные акции, и рынки в целом имеют тенденцию превращаться из ярко трендовых в слабо контртрендовые. Думаю, что именно этот процесс Вы и видите. «Раньше зарабатывать было легче» ~ нынешние старички раньше были молодыми, а тогдашних старичков мы не в основном уже не застали.
avatar
SergeyJu, Не, думаю, это не про трендовость — по идее, модели могут и контртрендовые закономерности находить, вроде, так подумал, ничего я в них не зашил такого, чтоб они на тренд ориентировались, их ориентир — winrate). Думаю, дело в общей эффективности, больше народу, мощнее компы, умнее алгоритмы, закономерности уже не лежат красиво уложенными штабелями не полянке, теперь их надо искать глубже, ну или искать там же, но довольствоваться меньшим.
avatar
Свежие данные — это что значит?
avatar
SergP, Ну, есть у меня данные за 10 лет, например, а для модели мне нужен год, я могу взять 2001-й год), а могу 2020-й).
avatar
Replikant_mih, ну в смысле 2011 и 2020).
avatar
Толково.
После многочисленных бэк- и форвад-тестов разных алгоритмов на разных инструментах пришел к примерно таким же выводам.
avatar
$100, Ага. Глядишь и что-то поинтересней найду).
avatar
Replikant_mih, 
движение реальных залогов — акций\сырья должны быть другие, нежели движение котировок контрактов — фьючерсов
Олайвир Стокс, Это к чему относится?)
avatar
Replikant_mih, 
к закономерностям, рынки залогов и контрактов различны
Олайвир Стокс, Ну я оцениваю модель там где обучил), ну только OOS. Так что если закономерности специфичные, модель это должна просечь. Ну вернее ей без разницы, она что-то нашла, ну или не нашла, пытается применить.
avatar
Модели псевдо-хаоса? Думаю ( может не прав ).что свечки выстраиваются исходя из псих.факторов и текущей или ожидаемой инфы.Верифицировать эти факторы не возможно (пока ) -слишком огромные массивы.И построить идеальную модель с х -неизвестными и у-весами — невозможно
avatar

valemill, А зачем строить идеальную), руками же вы торгуете не когда научились 100 из 100 в плюс торговать? при тейк/стоп 3/1). Так и тут.

avatar
Ну. все же ищут Грааль
avatar
valemill, Портфель из нескоррелированных добротных, но не идеальных моделей — вполне себе грааль))).
avatar
Replikant_mih, где их, некоррелированных, столько набрать?
avatar
SergeyJu, Ну, тут 2 фактора — понять, как сделать нескоррелированными и 2 — найти стратегии соответствующего вида. 1 — берем разные факторы, по ним берем сетку и озадачиваемся чтобы в пределах фактора было какое-то равномерное распределение стратегий. 2 — тут можно адресно искать), т.е. понятно, что если не заморачиваться адресностью, то большая часть стратегий будет трендовая и на Si))) или типа того, но если заморочиться и адресно копать — можно обеспечить норм. диверсификацию.
avatar
Replikant_mih, у Вас уже получилость? 
avatar
SergeyJu, Ну это же больше процесс, чем результат), ну или вернее что-то не дискретное, так что у всех получается, просто у всех в разной степени)), ну как минимум по лонг-шорт и ещё паре критериев стараюсь придерживаться этих принципов.
avatar
Eugene Logunov, разные стратегии на разных данных. Правильная и хорошая мысль, которая трудно реализуема. К сожалению. 
avatar
на свежих данных моделям можно сказать драматически сложнее извлекать закономерности.

От моделей зависит. У некоторых работа улучшается с ростом объемов/ликвидности.
старый трейдер, Нуу, да, но это про другое немного, т.е. ликвидность пришла/ушла — это ± цикличные вещи, а общее повышение эффективности рынка — это скорее долгосрочный общий тренд, а вокруг него уже колебания ходят со всеми вытекающими.
avatar
Eugene Logunov, Россию без бюджета выдает финам. Америка — смотря что нужно. Если минутки, то бюджет вменяемый. Если дневки, можно и на халяву, только осторожно. Данные приходится так или иначе чистить. 
Но бюджета и желания многим (я бы сказал, почти всем) оказывается недостаточно.
avatar
На каких данных тестишь? минутки\тики? 
Леха Мартьянов (my-trade), свечи — разные TF, в т.ч. минутки да, но на минутках сложно выцарапывать приемлемый средний трейд чтобы покрывать издержки и обеспечивать робастность модели. С тиками никогда не работал, даже не знаю какие признаки там придумывать), но, уверен, это до первого знакомства. В тиках немного пугают объемы данных, я даже на свечах иногда упираюсь в свои нескромные 32 Гб. оперативки, хотя, возможно, тики и не надо огромными объемами гонять, вероятно, на тиках надо находить «быстрые закономерности».
avatar
Replikant_mih, 
Да мне какие ты тф используешь не интересно… интересно из каких данных ты их строишь… какого типа дата у тебя :).
Минутки:

20200705 220100;3121.25;3126.25;3121.25;3125.75;1912
20200705 220200;3125.75;3129;3125.25;3128;1467
20200705 220300;3128;3128.75;3127.25;3128;644
20200705 220400;3128;3128.5;3127.25;3128;413

или тики:

20200311 220000 0150000;2727;2727;2727;7
20200311 220000 0270000;2727.5;2726.25;2727.5;1
20200311 220000 0270000;2726.25;2726.25;2727.5;2
20200311 220000 0390000;2726.25;2726.25;2727.25;2
20200311 220000 0460000;2726;2726;2728;1
20200311 220000 0660000;2728;2726;2728;1
20200311 220000 0660000;2728;2726;2728;1
20200311 220000 0660000;2728.25;2726;2728.25;1
20200311 220000 0660000;2728.25;2726;2728.25;1
20200311 220000 0660000;2728.75;2726;2728.75;3
20200311 220000 0700000;2726;2726;2728.25;1
20200311 220004 7380000;2728.5;2728.5;2729.75;1
20200311 220005 0820000;2729.75;2728.75;2729.75;2
20200311 220009 6400000;2727.25;2727.25;2728.75;1
20200311 220015 1440000;2727.25;2725.25;2727.25;1


На тиковых данных не обязательно тиковый график смотреть))). 
Просто можно построить тф меньше минуты… например 50sec.

Мало ли, мож у тебя какие раритетные старые тиковые данные есть по фьючам)))).

Леха Мартьянов (my-trade), А, да не, обычные свечи в готовом виде которые качаю. Пока такими вещами не заморачиваюсь, хотя из минуток были идеи собирать нестандартные TF, но для этого сначала надо научиться не тонуть в миллионах графиков)).

avatar
Да нифига, модели есть рабочие и можно применять абсолютно на любом ТФ. Необязательно так заморачиваться
avatar
Eugene Logunov, что имеется в виду под разными данными?
avatar

теги блога Replikant_mih

....все тэги



UPDONW
Новый дизайн