Постов с тегом "ml": 32

ml


Machine Learning на Мосбирже - почему AUC 0.55 - это всё ещё больно?

Время после нового года решил провести с пользой и окунуться в машинное обучение. Заняться Machine Learning — и посмотреть получится что‑то или нет с российским рынком акций на Московской бирже.

Моей целью было построить такую систему, которая будет учиться на истории и в перспективе торговать лучше чем случайное блуждание 50/50. Но из‑за комиссий и спреда подобные блуждания изначально отрицательны — чтобы выйти в плюс надо как минимум покрывать комиссии.
Machine Learning на Мосбирже - почему AUC 0.55 - это всё ещё больно?
Если говорить о результатах очень кратко, то технически всё работает, но вот финансовый результат на грани безубыточности.

Если Вы только интересуетесь этой темой Вы можете посмотреть какие‑то шаги в моей статье, а если Вы уже опытный разработчик подобных систем, то можете подсказать что‑нибудь в комментариях.

Причём вся эта работа выглядит совершенно не так как показывается в фильмах про уолл‑стрит: фактически это написание скриптов и монотонный запуск и всё происходит полностью локально на компьютере.



( Читать дальше )

Обзор новых исследований по алгоритмической торговле

Каждую неделю мы разбираем свежие научные работы по алгоритмическому трейдингу и количественным финансам. Вот что выделилось за 5–12 января 2026 года.

1. Адаптивные модели для прогнозирования
Сейчас активно развиваются модели, которые подстраиваются под меняющиеся рыночные условия. Например, в этой работе показано, как фильтр Калмана и модели Марковского переключения улучшают прогнозы во время кризисов на корейском рынке.

В другом исследовании предложили стратегию для прогнозирования спредов на рынке электроэнергии — она учитывает резкие скачки цен в разных зонах.

Ещё одна статья посвящена прогнозированию корреляций акций. Гибридные нейросети помогают лучше группировать активы для портфельных стратегий.

2. Машинное обучение в портфелях
ML всё чаще используют для оптимизации портфелей. В работе представлена модель DeePM — она даёт стабильную доходность даже при высокой волатильности.

Другое исследование сравнивает методы пассивного инвестирования. Нейросети и оптимизационные модели тут показывают лучшие результаты.



( Читать дальше )

Когда математика убивает рынок: как кванты заработали миллиарды, а мир - кризис

Недавно купил книгу «Кванты. Как волшебники от математики заработали миллиарды и чуть не обрушили фондовый рынок», которую её автор Скотт Паттерсон написал ещё в 2010 году. Книга издана на русском языке в 2014, но я познакомился с ней только недавно и понял что в книге очень хорошо расписана хронология развития алгоритмической торговли и чем она заканчивалась. Спойлер: ничем хорошим в итоге, но в моменте очень выгодно для участников.

Решил сделать статью по мотивам книги — краткую выжимку идей о том, какими алгоритмами и в какое время зарабатывались деньги. Первая часть этой статьи — на основе этой книги, а вторая этой часть — на основе открытых данных из интернета.

Причём странная деталь — заказал книгу на обычном маркетплейсе, но книга шла из‑за рубежа и пришла даже без указания тиража — то есть какая‑то условно китайская копия — раньше с такими не сталкивался.


Когда математика убивает рынок: как кванты заработали миллиарды, а мир - кризис
Моя книга

Ниже первая часть, которая написана на основе этой книги.



( Читать дальше )

Как я погружаюсь в ML и понимаю, что всё начинается с данных

Экспериментирую с ML. Несколько недель ковыряюсь в данных и всё больше понимаю — алгоритмы это не главное. Главная боль — подготовка данных.
Как я погружаюсь в ML и понимаю, что всё начинается с данных




( Читать дальше )

Научить искусственный интеллект думать как трейдер - это утопия или начало нового подхода?


Представьте опытного трейдера: наверняка он не говорит котировками и не рассказывает про индикаторы — он просто говорит «сильный тренд», «пробой уровня» или «ложный отскок». Для него график это язык: свечи, объёмы и уровни складываются в понятные фразы о том, что сейчас происходит на рынке. Именно от этой человеческой интуиции я и отталкивался в своём эксперименте.

Идея была такая: а что, если научить искусственный интеллект понимать этот язык? Не подавать модели сырые числа, а переводить бары и объёмы в текстовые описания наблюдаемых паттернов и кормить ими языковую модель. Гипотеза была что в тексте уже будет содержатся достаточно данных, чтобы модель научилась связывать недавнюю торговую историю с тем, пойдёт ли цена вверх на следующий день.
Научить искусственный интеллект думать как трейдер - это утопия или начало нового подхода?
Мои результаты, о них ниже

Инструмент эксперимента — модель distilbert‑base‑uncased с Hugging Face и это облегчённая, быстрая версия BERT для понимания языка.



( Читать дальше )

Научные тренды в алготрейдинге: обзор за неделю

Каждую неделю мы отбираем и разбираем десятки свежих препринтов научных работ по алгоритмической торговле. Вот что сейчас в фокусе исследований.

Генеративные модели для рыночных данных

Ученые активно работают над моделями, которые имитируют рыночные данные. Это нужно для стресс-тестирования и торговли в условиях неопределенности.

В работе «Nested Optimal Transport Distances» предлагают новый метод оценки таких моделей. Он помогает точнее предсказывать поведение рынка, что важно для хеджирования и алгоритмов на основе обучения с подкреплением.

Другое исследование «Painting the market: generative diffusion models for financial limit order book simulation and forecasting» использует диффузионные модели — технологию, похожую на ту, что создает изображения в нейросетях. Здесь ее применили к данным стакана заявок, чтобы лучше предсказывать его изменения.

Микроструктура рынка и влияние ордеров

Как отдельные заявки меняют цену? В статье «The Subtle Interplay between Square-root Impact, Order Imbalance & Volatility II: An Artificial Market Generator» показано, что волатильность можно объяснить через влияние крупных ордеров. Их эффект на цену часто подчиняется закону квадратного корня.



( Читать дальше )

Исследования недели: ML в трейдинге и анализе рынка

На этой неделе больше всего работ посвящено двум направлениям:

1. Машинное обучение (ML) для алгоритмической торговли
2. Анализ временных рядов с помощью глубокого обучения

1. ML в алгоритмическом трейдинге

Больше всего исследований — про обучение с подкреплением (RL). В них показывают, что RL и нейросети помогают делать торговые стратегии гибкими и устойчивыми.

— В работе QTMRL: An Agent for Quantitative Trading Decision-Making Based on Multi-Indicator Guided Reinforcement Learning предлагают торгового агента, который учитывает несколько технических индикаторов и адаптируется под рынок. Этот метод зарабатывает больше и лучше управляет рисками, чем классические подходы.

Optimal Quoting under Adverse Selection and Price Reading — про оптимизацию котировок для маркет-мейкеров. Тут предлагают способ корректировать заявки, учитывая риски из-за информационного дисбаланса.

2. Глубокое обучение для прогнозирования рынков

Вторая группа работ — про анализ временных рядов. Акцент на предобученных моделях (foundation models), которые могут работать без дополнительной настройки.



( Читать дальше )

DeepSeek + TSLab: как ИИ генерирует код для профессиональных трейдеров

Введение

В трейдинге каждая секунда может иметь значение. Но стандартные инструменты часто не позволяют работать с данными высокого разрешения. В этой статье я поделюсь опытом создания кастомного решения для TSLab, которое сохраняет 1-секундные свечи с расширенными метриками (открытый интерес, количество продавцов/покупателей, лента сделок, лучшие бид/аск и др.). Покажу, как забрать эти данные из TSLab, передать их в Python для ML – анализа и т.д.

Задача

Трейдеры часто сталкиваются с ограничениями стандартных платформ: нельзя сохранить сверхмалые таймфреймы, добавить кастомные метрики или быстро переложить данные в Python для ML.

**Цель проекта** — создать инструмент, который:

— Сохраняет 1-секундные свечи с расширенными данными (открытый интерес, лента сделок…).

— Автоматически генерирует CSV-файлы для анализа.

— Позволяет строить интерактивные графики и обучать ML-модели.

 

**Главный герой** — ИИ-ассистент DeepSeek, который ускорил разработку в несколько раз и решил ключевые технические проблемы.



( Читать дальше )

Применение искусственного интеллекта в техническом трейдинге

Инструменты искусственного интеллекта могут быть использованы для классификации торговых сессий по паттернам. Для этого можно использовать среду программирования Python. Здесь мы изложим концепцию.

Вы когда-нибудь думали о торговой сессии как о… цветке?"

Когда я впервые предложил такую тему своим менеджерам хедж-фондов, то увидел, как они растерялись. Уверен, что некоторые из них начали бормотать и интересоваться, не курил ли я и не ел ли каких-нибудь необычных цветов! Тем не менее, я был серъезен, и позвольте мне объяснить почему.

Давайте вернемся в 1936 год, когда британский ученый по имени Рональд Фишер разработал «алгоритм» для распознавания видов радужных оболочек по нескольким числовым характеристикам. Набор данных по радужной оболочке глаза — это «Hello world» науки о данных, то есть он широко используется для отработки основных алгоритмов машинного обучения (ML). Он состоит из пяти столбцов: длина лепестка, ширина лепестка, длина чашелистика, ширина чашелистика и тип вида. Исследователи измерили различные характеристики цветков ириса и записали их в цифровом виде. Фишер использовал четыре признака — длину чашелистика, ширину чашелистика, длину и ширину лепестка — для классификации трех видов ирисов (названных setosa, versicolor и virginica).



( Читать дальше )

ML грааль в трейдинге.

Взяли в руки блокнотики?))

 

Грааль в ML для трейдинга состоит из нескольких компонентов. По сути грааль, это «правильные» ответы на вопросы:

  1. Что используется в качестве объектов, на которых мы обучаемся. Что за срез. Что? – Свеча, день, тик, трейдер, стакан, паттерн? Очень важный компонент.
  2. Признаковое описание этих объектов. Супер-важная тема. Пространство для креатива.
  3. Таргет – важная тема, но скорее производная от «что является объектом». После выбора объекта, с таргетом становится ± понятно.
  4. Тип модели. Эта штука, на самом деле не так и важна, как кажется.
  5. Параметры модели (гиперпараметры и вот это вот всё). Из одних гиперпараметров кашу не сваришь, их нужно использовать скорее чтобы «не испортить блюдо».
  6. Процесс. Обучения, отбора, валидации модели. Супер-важная тема тоже.

 

Пожалуй, можно составить ТОП покороче:

  1. Что является объектом.
  2. Признаковое описание.
  3. Процесс отбора данных, обучения, отбора, валидации моделей.


( Читать дальше )

....все тэги
UPDONW
Новый дизайн