Блог им. empenoso

Предсказал цену? Поздравляю, ты всё равно в минусе

На прошедшей неделе в Москве состоялось мероприятие, посвящённое машинному обучению (Machine Learning) в трейдинге. Название мне показалось весьма злободневным: «ML в трейдинге: как выжить, если ты один, а против тебя — хедж-фонды с бесконечным бюджетом».

Предсказал цену? Поздравляю, ты всё равно в минусе

Я бы хотел побывать на нём лично, но из Перми ехать далековато (только Тимофею дарят по 150 тр чтобы поднять настроение) и поэтому я отдал билет другу. Так что отдельное спасибо Сергею Степаняну за то, что он приехал в Москву из Ярославля и фактически стал моими глазами и ушами — то, что вы читаете — это его наблюдение, мои размышления и немного здравого смысла. 

Вообще моё текущее представление о ML в трейдинге на Московской бирже довольно прикладное. Смотришь за ценой: волатильность больше или меньше, скорость изменения цены быстрее или медленнее. И если за какой-то из этих показателей меняется, то продаешь или покупаешь. Так можно попасть в вероятность, но точно определить конечно же невозможно. Ну и приходится постоянно это дело подкручивать под изменяющиеся параметры рынка -  играть в догонялки — рынок меняется и всегда вынужден его преследовать. 


На этой встрече мне показалось очень здравой мысль, что современный алготрейдер в России — это один человек, который заменяет целую команду: 

  • он ищет и чистит данные;

  • придумывает признаки; 

  • строит модели; 

  • тестирует гипотезы;

  • собирает стратегии; 

  • считает риски; 

  • и всё это выводит в продакшн.


Предсказал цену? Поздравляю, ты всё равно в минусе

Слайд из презентации


И это принципиальное отличие от фондов когда все роли разделены между людьми, а у тебя просто домашний компьютер с видеокартой чуть мощнее среднего и ИИ помощник. 


Я уже не первый год пишу статьи на Смартлабе, а читаю уже очень давно, и кроме новостного шума сложно найти что-то содержательное по теме алго и ML, а по Deep Learning уж и подавно, потому что никто не рассказывает что реально работает, а все обсуждения идут на уровне намёков. В итоге каждый сам изобретает свой собственный велосипед и, конечно же, повторяет чужие ошибки. Просто не знает об этом. 


На встрече был всего один доклад от Антона Абдулгалимова. Я очень извиняюсь перед ним, но упоминания компании где он работает не будет — из-за подобных вещей у меня блокировали аккаунт однажды — потому что заподозрили рекламу (которой не было).


Предсказал цену? Поздравляю, ты всё равно в минусе
Слайд из презентации


На встрече проводили небольшой опрос и оказалось что люди в целом знакомы с тем, что такое ML, они экспериментируют, но прибыли не видят и только 30% имеют работающие стратегии которые запущены на реальных деньгах. 

Иллюзия «предсказания цены»

Вообще общепринятое мнение о ML — что ты скармливаешь нейронке график Сбера и она тебе говорит сколько он будет стоить завтра. Но в реальной жизни так не работает. Если просто натравить регрессию на цену, то на выходе получится мусор, а в высокочастотном трейдинге (HFT) ML вообще очень ограниченно используется, потому что там бьются за наносекунды и любая тяжёлая модель просто убивает систему задержками.


В своей практике я тоже уже пытался использовать ML как генератор сигналов (неудачно). 


Зато ML отлично работает в более узких задачах:

  • Поиск фазы рынка (режима) — модель не говорит покупай, она говорит: «сейчас жесткий боковик, трендовые стратегии лучше выключить».

  • Фильтрация сигналов — какие сделки из вашей базовой стратегии брать, а какие — с высокой долей вероятности убыточны.

  • Исполнение — как зайти в позицию так, чтобы не размазать весь свой профит о проскальзывание и комиссию.

  • Микроструктура стакана — там, где человеческий глаз просто не успевает увидеть закономерности в потоке ордеров.


Предсказал цену? Поздравляю, ты всё равно в минусе
Слайд из презентации

Почему граали ломаются о реальность

Но вернёмся к статистике: большинство застревает на этапе тестов. В трейдинге очень легко построить иллюзию что у тебя всё хорошо и Антон нашёл грабли на которые наступает большинство одиночек:

  • Garbage in = Garbage out. Данные — это 80% успеха. Если в ваших дневных свечах пропущен один день, или вы криво склеили фьючерсы, модель найдет там закономерность, которой в природе нет. Поиск и чистка данных забирают львиную долю времени.

  • Заглядывание в будущее. При обучении модель случайно подсматривает в завтрашний день из-за ошибки в разбиении выборки (кто копает глубоко — почитайте Маркуса де Прадо на эту тему). На истории вы миллиардер, в проде — получаете маржин-колл.

  • Forecast != PnL (Прогноз не равен прибыли). Вы создали модель, которая в 60% случаев угадывает направление цены. Бинго? Нет. Пока вы вставали в очередь в стакане, пока словили проскальзывание, а брокер и биржа списали комиссии — ваша математическая альфа ушла в минус по счету.


И тут многие начинают кивать на запад: мол, у них там вендоры альтернативных данных, команды квантов, хедж-фонды с бюджетами, а у нас что? 


Предсказал цену? Поздравляю, ты всё равно в минусе
Слайд


Но по факту, разрыв в значительной степени связан с инфраструктурой. Все остальное: поиск сигнала, переобучение моделей, нестационарность рынка — проблемы абсолютно одинаковые что на Уолл-Стрит, что в Перми (ну и в Москве).


Чтобы не тратить месяцы на разработку мертворожденной стратегии, Антон предложил отличный подход. Прежде чем открывать Python, прогоните свою идею через 5 вопросов:


  1. Есть ли конкретная задача? 

(Не «я хочу прикрутить нейронку, чтобы было», а «я хочу снизить издержки на исполнение заявки»).

  1. Есть ли у вас честные данные? 

(Чистые, без заглядывания в будущее и доступные в моменте торгов).

  1. Можно ли это проверить? 

(С учетом комиссий и задержек).

  1. Превращается ли прогноз в действие? 

(Понятен ли мост между тем, что выдала модель, и реальной сделкой/фильтром).

  1. Есть ли экономический эффект? 

(Стала ли система приносить больше денег после уплаты всех издержек).


Если хотя бы на один вопрос ответ «нет» — вы внедряете ML слишком рано.

Вместо итога

Знаете, что мне понравилось больше всего на этой встрече (пусть и в пересказе)? То, к чему призывал Антон в конце.


ML не даёт контроля над рынком и не является магической кнопкой «бабло». Это сложный, капризный инструмент, который работает только там, где он реально нужен. Но главная проблема нашего рынка не в нехватке библиотек или вычислительных мощностей. Проблема в том, что мы сидим по своим углам.


Культура «никому ничего не рассказывать» приводит к тому, что все совершают одни и те же ошибки по кругу. То, что умерло на вашей проверке, ваша ошибка в коде или слитый на тестах депозит — это бесценный опыт, который гораздо важнее историй чужого успешного успеха.


Поэтому давайте общаться. Уважаемые алготрейдеры, кто балуется машинным обучением, как у вас успехи? На каком этапе пути застряли: тестируете гипотезы или уже пустили модель в бой на реальных деньгах? 


Автор: Михаил Шардин
🔗 Моя онлайн‑визитка


31 марта 2026 г.

2.4К
#10 по плюсам, #7 по комментариям
11 комментариев
Банальненько. В ML самое сложное сформировать правильный dataset.
avatar
Rational_Capital, так вот и на мероприятии вроде о том же
Михаил Шардин, ни на одном мероприятии ничему путнему не научат. Одна из проблем ML — чистка датасета от взаимоисключающих данных. Это когда при примерно одном и том же входе на выходе противоположные сигналы. Как такое вычищать? Найдите-ка публичный алгоритм в интернетах 
avatar
Rational_Capital, кстати да, гладкость — это проблема,
большую дисперсию прогноза ещё терпеть можно, но когда функция ещё и не гладкая по параметрам/вектору — это перебор
avatar

Rational_Capital, ну на самом деле «публичный алгоритм в интернетах» есть и много. Да вот например:

smart-lab.ru/blog/1216966.php

smart-lab.ru/blog/1278719.php

Хотя думаю это не те примеры про которые вы говорили

Я б Вам ещё 6 вопрос накинул — Предполагаете ли вы, что сможете когда-то научиться по сделкам участников торгов, предсказывать их торговые замыслы, сами оставаясь при этом для них непредсказуемыми? И если да, то не слишком ли много алгофуфла, вы в свои модели торговли закладываете?)
Чтобы не тратить месяцы на разработку мертворожденной стратегии, Антон предложил отличный подход. Прежде чем открывать Python, прогоните свою идею через 5 вопросов:

план — это ключевое.
относится не только к МЛ/ЛЛМ, а ко всем подходам, вплоть до гадания по звёздам
avatar

Культура «никому ничего не рассказывать» приводит к тому, что все совершают одни и те же ошибки по кругу. То, что умерло на вашей проверке, ваша ошибка в коде или слитый на тестах депозит — это бесценный опыт, который гораздо важнее историй чужого успешного успеха.

Поэтому давайте общаться. Уважаемые алготрейдеры, кто балуется машинным обучением, как у вас успехи? На каком этапе пути застряли: тестируете гипотезы или уже пустили модель в бой на реальных деньгах? 


Хорошая попытка отмутить бесценные знания задаром, но нет:)
Михаил Михалёв, ну нет так нет :) но надо же было попробовать :)
Михаил Шардин, Хороший ответ на хороший комментарий ))))
    А теперь немного корректности. Заголовок у вас заведомо провокационный. Поскольку достаточно точный прогноз направления — не гарантия прибыли по определению, необходимы еще верные точки входа/выхода. 
Культура «никому ничего не рассказывать» приводит к тому, что все совершают одни и те же ошибки по кругу.
...
Хорошая попытка отмутить бесценные знания задаром, но нет:)

Бесценные знания лежат задаром на arxiv.org. Проблема кажется в том, что их никто не читает. Даже «Эксперты Московской биржи».
avatar

Читайте на SMART-LAB:
Фото
Напоминаю, сегодня проследний день самых низких цен и максимальных скидок на нашу конференцию 20 июня в СПБ!
Напоминаю, сегодня проследний день самых низких цен и максимальных скидок на нашу конференцию 20 июня в СПБ!...
Фото
ПСБ Финанс на «МФО. Весна 2026» 🎤
  Наши коллеги формируют отраслевую повестку: Ольга Шарацкая , руководитель направления методологии департамента управления рисками...
Фото
#MGKL: Купонные выплаты по облигациям за март — 91,8 млн ₽
В марте ПАО «МГКЛ» в срок и в полном объёме исполнило обязательства перед держателями облигаций. Общий объём купонных выплат составил 91...
Фото
ВТБ МСФО 2 мес. 2026 г. - правильная прибыль выросла
ВТБ отчитался за 2 месяца 2026 года по МСФО. Чистая прибыль за 2 месяца снизилась на 11% до 69 млрд руб.  Рентабельность капитала составила...

теги блога Михаил Шардин

....все тэги



UPDONW
Новый дизайн