Предпосылки к моделированию
«Мы правы всего в 50.75 % случаев… Но мы на 100 % правы в 50.75 % случаев, — сказал Мерсер другу. — Таким способом можно заработать миллиарды».
Это не рецензия на книгу — я её не читал, но упомянутая в ней оценка смещённой вероятности вызвала у меня интерес, достойный небольшого исследования.
Прибыль по каждой сделке никогда не была огромной, и фонд выигрывал чуть больше, чем в половине случаев, но этого было более чем достаточно.
Отсутствие деталей вынуждает опираться на простейшее предположение (Take Profit = Stop Loss), чтобы построить модель.
Унифицированный бенчмарк стратегий
(необязательный технический раздел; статья остаётся самодостаточной и без него)
Для сопоставления эффективности любой другой торговой стратегии (у которой TP ≠ SL) с унифицированным представлением (TP = SL) эквивалентная вероятность успеха определяется формулой:
где:
p — эмпирическая доля успешных сделок;
W — средняя прибыль по прибыльным сделкам;
L — средняя абсолютная величина убытка по убыточным сделкам;
μ — математическое ожидание приращения (средняя прибыль на сделку);
C — масштабный коэффициент (условная величина, к которой приводятся TP и SL). Задаёт шкалу
p_eq: больше
C — сильнее сжатие вокруг 0.5, меньше
C — растяжение.
Условия корректности:
p ∈ (0; 1),
W > 0,
L > 0,
C > 0. Для одной стратегии (фиксированных
p,
W,
L) необходимо и достаточно
C ≥ |
μ|, чтобы
p_eq ∈ [0; 1]. Для единого
C на любые
p ∈ [0; 1] необходимо и достаточно
C ≥ max(
W,
L).
Главное правило: одна и та же нормировка для всех стратегий. Рекомендуемый базовый (симметричный) вариант:
C = max{(
W +
L) / 2, |
μ|} (при
W ≈
L обеспечивает локально несмещённую шкалу:
p_eq ≈
p).
Такое преобразование сохраняет
μ, но изменяет дисперсию и не является строгим тождественным переходом между исходной стратегией и моделью.
p_eq агрегирует
p,
W и
L, но не учитывает структуру исходов, из которых получены эти величины. Поэтому сам по себе его рост ещё не означает, что один алгоритм лучше другого. Тем не менее этот показатель даёт единый масштаб сравнения: по нему удобно сопоставлять разные стратегии как между собой, так и с результатами моделирования из этой статьи (в рамках которой формула не используется, а лишь предоставляется как инструмент).
Алгоритм
1. Выбирается распределение Бернулли, возвращающее +1 с вероятностью p и −1 с вероятностью 1 − p.
2. Генерируются псевдослучайные числа (Mersenne Twister) и по порогу p преобразуются в исходы {+1, −1}.
3. Строится график накопленной доходности для n сделок.
4. Вычисляется коэффициент корреляции Пирсона (r) между массивом накопленной доходности (включая стартовую нулевую точку) и индексами 0, 1, 2, …, n (дискретным временем модели).
5. Шаги 1–4 повторяются миллион раз.
6. Полученные r сортируются по возрастанию; отбираются три опорные величины: 1-й процентиль (10 000-й элемент), медиана и среднее.
7. Шаги 1–6 выполняются независимо для каждого p ∈ [0.5005; 0.5250] с шагом 0.0005.
Наблюдения
Коэффициенты Шарпа и Сортино (в представлении TP = SL) ведут себя предсказуемо: линейно растут с увеличением
p и не дают дополнительной информации сверх того, что уже даёт само значение
p. А вот коэффициент Пирсона показывает более интересную картину: его динамика не сводится к простой линейной зависимости и меняется вместе с размером выборки
n.
Этот безразмерный коэффициент принимает значения в диапазоне [−1; 1] и отражает силу и направление линейной зависимости между двумя переменными. Его величина по модулю характеризует, насколько плотно данные «прижаты» к линии линейной регрессии (без необходимости её построения), а знак определяет, наклонена ли эта линия вверх или вниз — то есть, соответствуют ли наблюдаемые изменения положительному или отрицательному тренду. Линия линейной регрессии — это прямая, которая наилучшим образом «подстраивается» под данные, минимизируя сумму квадратов отклонений точек от неё.
Диаграммы
n = 1 000
n = 5 000
n = 10 000
n = 30 000
Вертикальная ось —
r. Горизонтальная ось — смещение вероятности относительно 50 % (в процентных пунктах).
Интерпретация кривых
Жёлто-оранжевая — 1-й процентиль распределения
r (граница худшего 1 %). То есть при
n = 1 000 и смещении даже втрое выше «ориентира» из книги (0.75 п.п. × 3 = 2.25 п.п.) остаётся заметный риск отрицательного наклона линии регрессии (
r < 0). Лишь при
n = 5 000 и смещении не менее 1.75 п.п. вероятность сохранения капитала достигает 99 %.
Сине-голубая — медиана распределения. При
n = 5 000 и смещении 0.75 п.п. соответствующее значение
r оказывается весьма низким — 0.78.
Светло-серая — среднее по миллиону значений. Оно занижено относительно медианы (из-за влияния нижней части выборки) и носит иллюстративный характер.
Салатово-зелёная — среднее по ста тысячам значений, полученное после группировки результатов симуляций по 10 (исходное
n не меняется, пересчитывается лишь новое
r для объединённых серий). Кривая остаётся результатом усреднения сильно колеблющихся значений, но при этом наглядно выявляет тенденцию — значения заметно выше медианы. Такой эффект отражает преимущество параллельной торговли множеством некоррелированных инструментов. При
n = 5 000 и смещении 0.75 п.п. соответствующее значение
r повышается до 0.95, однако этого всё ещё недостаточно для получения ровной equity.
Примеры траекторий
p = 0.5175;
r ≈ 0.95 (±0.001);
n = 5 000
p = 0.5175;
r ≈ 0.97 (±0.001);
n = 10 000
p = 0.5175;
r ≈ 0.99 (±0.001);
n = 30 000
Масштабы осей различаются. Серо-синяя кривая — траектория эквити; коралловая прямая — линия регрессии. Для каждого
r показана серия с медианной RMSE (root mean squared error, среднеквадратичная ошибка) среди первых 10 000 реализаций, попавших в заданное окно.
Медиана RMSE даёт типичную амплитуду отклонений при фиксированном
r и отсеивает крайние «удачные/неудачные» примеры. Большее RMSE означает большую амплитуду отклонений от тренда (кривая может выглядеть «гладкой», но уходы крупнее); меньшее RMSE — меньшую амплитуду (частые мелкие колебания создают впечатление «дёрганности»).
Практические замечания
1. Несмотря на теоретическую модель, под результатом следует понимать практическое значение
p. В реальных условиях транзакционные издержки (комиссии, спред, проскальзывание) занижают
W и увеличивают
L; эффект тем сильнее, чем меньше
μ.
2. Нелинейность хорошо иллюстрирует динамика нулевой точки жёлто-оранжевой кривой: ~1.75 п.п. (
n = 5 000), ~1.25 п.п. (
n = 10 000), ~0.75 п.п. (
n = 30 000). Поскольку это 1-й процентиль, речь о пороге безубыточности «хвоста»: он снижается медленно — значит, для неубыточной торговли в худшем 1 % серий требуется существенный запас преимущества.
3. Для
r усреднение по независимым инструментам эквивалентно росту
n (при том же
p): усреднение 10 независимых рядов длины 1 000 даёт значение
r, сопоставимое со значением для одного ряда длины 10 000. Поэтому на диаграммах салатово-зелёная кривая при
n = 1 000 и светло-серая при
n = 10 000 практически совпадают; различия — на уровне статистического шума.
4. Стабильный рост доходности начинается не при
r > 0.95 и даже не при
r > 0.97, а лишь при
r > 0.99000 — когда значимыми становятся различия в третьем-пятом знаках после запятой. Однако даже в этом случае необходимы дополнительные критерии оценки качества (RMSE, хвостовые метрики и т.д.).
5. Для устойчивого заработка в большом смещении (более 2 п.п.) необходимости действительно нет, но и сравнительно небольшое смещение (менее 1 п.п.) — малопригодно. Разумный априорный ориентир для отбора стратегий — около 1.5 п.п. На этом уровне салатово-зелёная кривая при
n = 5 000 как раз даёт
r = 0.99046. Впрочем, это лишь среднее по группам из десяти «инструментов», тогда как на Московской бирже ликвидных — всего три.
Вывод
Моделирование наглядно показывает, что увеличение числа сделок (
n) способно компенсировать недостаточную точность прогнозов (
p), повышая устойчивость результата (оценку
r). Алгоритмические хедж-фонды располагают огромным
n, тогда как частный трейдер в этом ограничен.
Мерсер, по-видимому, в точности не понимал торговые возможности своей фирмы — для него более значимым оказалось то, что Renaissance совершал тысячи одновременных сделок — небольшое преимущество, но достаточно весомое и последовательное, чтобы сколотить огромное состояние.
На самом деле это и было их
решающим преимуществом.
---
@Multifractal (TG) | трейдер · алготрейдер · аналитик компьютерных систем
---
P.S. Несмотря на то что 23 — простое число, важно делить не только прибыль, но и нагрузку. Если у кого-то есть инфраструктурная возможность обеспечить приличное (параллельное)
n, давайте объединим усилия: я как раз работаю над достойным
p_eq. Стратегия основана на инерционном, немасштабируемом свойстве рынка. Класс — «intraday momentum-continuation» с геометрическим триггером и режимно-зависимыми фильтрами (не HFT). На исторических данных не «сливает» и не требует «подгонки» под конкретный актив, но для реальной торговли нужен портфель инструментов с достаточно сильной и стабильной «трендовостью».
Теоретические результаты за 2008–2025 гг. на SBER (без учёта транзакционных издержек и пока ещё без разрабатываемого улучшения входа по «лимиткам», снижающего их влияние):
μ = 0.13 %;
p_eq = 0.58 (в базовой симметричной нормировке);
r = 0.99305 (по сделкам за 2010–2025 гг.); profit factor = 1.54; медианное время в позиции — 1.5 часа; среднегодовая прибыль — 93 % (без плеча); максимальная просадка — 12 %; среднее количество сделок в торговый день — 2.8 (без «овернайтов»). Результат был особенно хорош в кризисные 2008–2009 гг. (при существенно большем наклоне линии регрессии).
Ближайшая задача — расширить набор таких инструментов на российском и зарубежных рынках.
уважаемый автор упомянул распределение Бернулли, как помним из статей общего учителя, на рынке распределение Лоренца, Лоренцы бывают разные ).
Зеленая кривая на графике это логарифм ( натуральный, тут подсказывают более сведущие коллеги ) и у него должна быть пара -экспонента на финише. Как полагается в хаотических системах .
вообще все крайне просто… надо только начать а потом сам все увидишь… имхо самый простой актив для торговли на российском рынке это rgbi sber
успехов