На простом языке разберем, как незамысловатые элементы статистики и математики могут сильно помочь на финансовых рынках.
Где встречается нормальное распределение (и почему оно плохо подходит для финансовых рынков), что за шапка жандарма такая, откуда берутся 1, 2 или 3 сигмы, как определить математическое ожидание стратегии — после прочтения статьи вам будет все понятно.
Полезные материалы, которые хорошо бы изучить перед продолжением:
Многое, что нас окружает, имеет нормальное распределение. Средняя, нормальная скорость, с которой передвигаются машины в городе, средние зарплаты, средняя продолжительность фильма и т.д. Среднее и нормальное движение цен финансовых инструментов — не исключение (о них — чуть позже).
Скорее всего, вы видели колоколообразную кривую нормального распределения. Разберем ее на примере среднего роста человека.

Нормальное распределение среднего роста взрослого человека.
Допустим, у нас есть данные о всех взрослых людях планеты и их росте за последние 1000 лет. Нам не составит труда узнать средний рост такого человека — он равняется 165 см. Самый низкий рост человека — 54,6 см, а самый высокий — 272 см. Выше на графике ось X показывает как раз значения роста взрослого человека, ось Y — вероятность встречи человека с определенным ростом. И если перевести график на простой язык, будет звучать примерно так:
С большей вероятностью мы будем встречать людей с ростом от 150 до 180 см. А вот взрослых людей с ростом ниже 100 см и выше 200 см мы будем встречать крайне редко.—
Кстати да, иногда математики нормальное распределение называют “шлемом жандарма”. И вот почему:

Жандарм и его «нормальный» шлем :)
Ок, теперь разберем, что такое стандартное отклонение.
В статистике дается следующее определение:
Стандартное отклонение (отображается как греческая буква σ — сигма) — мера, которая показывает разброс величин от среднего значения.—
Формула стандартного отклонения выглядит так:

Получив значение стандартного отклонения, мы можем узнать, где и с какой вероятностью окажутся наши исследуемые данные, используя правило 3-х сигм. Для этого обратимся к рисунку ниже.

1, 2 и 3 сигмы (σ) — те самые отклонения от среднего.
Если в нуле у нас то самое среднее значение (которое также называется математическим ожиданием и обозначается буквой мю — μ. О мат. ожидании скоро поговорим чуть подробней), то 1, 2 и 3 сигмы — отклонения от среднего значения. На одно, два и три значения соответственно.
Правило 3-х сигм говорит вот о чем:
Стандартное отклонение еще называют среднеквадратичным отклонением, потому что является квадратным корнем дисперсии — меры, которая показывает разброс значений от среднего (от того самого нуля, или μ). Нет необходимости погружаться в формулы, так как дисперсия тоже автоматически считается в том же Excel (по формуле “ДИСП”). Но если все же хотите разобраться с дисперсией подробней, вот ссылка на статью Википедии.
Ок, с матчастью разобрались, теперь к примерам из финансовых рынков.
Теперь мы знаем, что нормальное распределение должно встречаться и в разных сферах финансовых рынков — от доходностей торговых стратегий до движения котировок внутри дня. Давайте исследуем эту гипотезу экспериментально.
В статье "Ценность стоп-лосса, выявленная из 2 365 алгоритмов" мы уже приводили результативность стратегий и их среднюю доходность. Вот какая выборка данных была:
Угадайте, что получили? Да, шлем жандарма.

Нормальное (почти) распределение доходностей среди 2 365 алгоритмов.
По оси X — соотношение прибыльных сделок в исследуемых стратегиях. В нашем случае — от 20% до 75%. По оси Y — количество алгоритмов, которые попали в определенную доходность (всего их во всех гистограммах — 2 365 штук). Чем выше гистограмма, тем больше алгоритмов туда попало, — значит, выше вероятность такого события. Опять же, давайте переведем все на человеческий язык, как на примере со средним ростом человека. Вот как сформулируем:
Вероятней всего, в среднем у стратегий будет от 35% до 45% прибыльных сделок. Шанс того, что среднее количество сделок будет 55% и выше — крайне мал.—
И важное отступление: распределение не всегда бывает нормальным. Слово “нормальное” в нашем термине подразумевает зеркальные значения что слева от среднего, что справа.
Вот какие типы распределений бывают:

Виды кривых распределений.
Есть теорема (центральная предельная теорема — ЦПТ), которая приводит ненормальное распределение к нормальному. Это все, что нам нужно знать в рамках этой статьи.
С этим разобрались. Это была средняя доходность. А что, если посмотреть на среднюю просадку?
И в средних просадках должно все повторяться. Давайте проверим это с помощью метода Монте-Карло. Подробнее о методе вы можете прочесть в статье "Как определить вероятностный результат торговой стратегии, используя метод Монте-Карло" или в видео ниже:
Сейчас же просто посмотрим на распределения.
Ок, допустим, у нас есть некая стратегия, которая в среднем дает 50% прибыльных сделок, а соотношение стоп-лосса к тейк-профиту составляет 1 к 1. Вот как будет выглядеть среднее распределение по просадке:

Распределение по просадке.
MDD — Maximum Drowdown — максимальная просадка. И здесь видим уже знакомую нам кривую распределения. Как показывает эта кривая, средняя просадка, вероятнее всего, будет в районе 3,8%.
Важно заметить, что у нас есть смещение вправо — то есть “толстый хвост” (о них — далее). Такие распределения называют positive skewness — положительный сдвиг или положительное смещение. В случае с примером выше это говорит о том, что могут быть редкие сценарии и форс-мажоры, которые сильно увеличат максимальную просадку.
Ок, еще один пример для закрепления.

Нормальное распределение, где средняя просадка уже 26,6%.
Здесь же распределение нормальное, без сдвигов влево или вправо.
Шпаргалка по математическим принципам в трейдинге — в нашем Telegram 📊—
Об этом любит писать в своих книгах и публикациях Нассим Талеб. Что за “толстые хвосты” такие? Сейчас расшифруем.
По правилам 3-х отклонений, (тех самых 3-х сигм) все, что выходит за их рамки — крайне редкие события, которые можно вообще и не встретить в жизни (мы уже знаем, что шанс встретиться с таким событием — примерно 0,3%). Но парадокс в том, что редкие события на финансовых рынках, они же “черные лебеди”, встречаются значительно чаще, чем об этом говорит статистика.

Те самые «хвосты» распределения.
“Хвосты” — те самые края распределения. И если у синего распределения они тонкие (то есть вероятность события действительно низка), то у красного распределения они шире.
Мы помним, что по оси Y у нас вероятность встречи события, а по оси X — его значение. Так и получается, что чем “толще” хвосты, тем выше вероятность реализоваться крайне неожиданному и экстремальному событию.
Финансовые пузыри, падения котировок и другие форс-мажоры — все это происходит намного чаще, чем должно было бы быть в теории. И все это нельзя отнести к нормальному распределению.—
И об этом — ниже.
Исходя из нормального распределения, выходы за пределы 3-х сигм были бы с теми вероятностями, что ниже в таблице.

Вероятности отклонений от нормального.
Теперь же посмотрим, какие события были за последние 10 лет, которые вышли за рамки нормального.
То есть, если опираться на законы нормального распределения, многие из этих событий должны были бы происходить 1 раз в миллионы или даже миллиарды лет. На практике же они происходят несколько раз в десятилетие.
Хоть и нормальное распределение — далеко не самая точная модель описания цены (как мы выяснили выше), но для частного трейдера с нее можно начинать, а дальше уже переходить к более сложным моделям, которые учитывают “толстые хвосты”.
Вот несколько индикаторов, в основе которых лежит логика нормального распределения и стандартного отклонения.
Задача индикатора Standard Deviation — показывать всплески волатильности от средних значений. По классической настройке индикатор включается с периодом 20, то есть берет 20 последних свечей и вычисляет от них то самое среднее значение.

График валютной пары NZD/JPY H1 и индикатор стандартного отклонения с периодом 20.
Рост индикатора — рост ценовой активности, снижение индикатора — снижение активности.
Так как этот индикатор показывает лишь всплески волатильности, в отдельности он практически не используется. Волатильность достаточно легко определить на глаз, без каких-либо приборов.
Этот индикатор популярней, так как автоматически помогает с определением тренда, волатильности и стандартного отклонения. Не будем подробно описывать здесь принципы его работы, так как уже сделали это в прошлой статье: "Трендовая стратегия на индикаторах SMA и полосах Боллинджера (Bollinger Bands)". Просто покажем, как выглядят линии на графике:

Линии Боллинджера и уже знакомые вам отклонения (сигмы).
Линия посередине — то самое среднее значение. Линии выше и ниже — +2 сигмы и -2 сигмы, то есть вероятностное движение цены как в рост, так и в падение.
Вот видео о том, как мы создавали и тестировали стратегию на основе полос Боллинджера:
Индикатор линейной регрессии
Линейная регрессия в трейдинге используется для определения основной динамики цен на рынке и отклонений от нее. Строится из 3-х линий:
Линейную регрессию можно использовать как в боковых движения, так и в трендовых.

Пример линейной регрессии в шумном боковом движении.
Линейная регрессия может быть хорошим помощником в сложных фазах рынка — волатильных консолидациях. На примере выше — именно такая фаза. Покупки от нижней линии отклонения (-2 сигмы) и продажи от верхней линии (+2 сигмы) могут быть неплохой контртрендовой стратегией.
Теперь посмотрим трендовые методы.

Линейная регрессия в нисходящем тренде.
В трендовых движениях регрессия аналогично помогает с точками входа и упрощает визуальный анализ.
Последнее, о чем поговорим, и расходимся.
Скорее всего, вы слышали что-то вроде “О, эта стратегия с положительным мат. ожиданием”, или “Эта стратегия не годится. Ее мат. ожидание отрицательное”. Да, положительное математическое ожидание — хорошо, отрицательное — плохо. А берется оно, как мы уже разобрались, из тех же значений нормального распределения — из среднего. Сформулировать мат. ожидание можно так:
Математическое ожидание — это наиболее ожидаемое значение, которое мы можем получить при многократном повторении испытания.—
Снова обратимся за помощью к методу Монте-Карло и распределениям, чтобы проверить все на практике.

Распределения с помощью Монте-Карло.
Выше мы провели 10 000 случайных симуляций стратегии (на самом деле портфеля стратегий, но сейчас это не важно) и получили данные по распределениям. Нам интересна правая нижняя диаграмма — “Распределение ФинРез” — финансовый результат.
Еще раз пройдемся по определению, но уже для торговой стратегии.
Математическое ожидание торговой стратегии, это среднее значение ее доходности при многократном повторении испытания.—
Если среднее значение отрицательное (оно же мат. ожидание), как на примере выше (-11,5%), значит эта стратегия не заслуживает право на существование. Любые прибыли в такой стратегии — это лишь случайность и простое везение.
Теперь посмотрим на потенциально прибыльную стратегию.

Распределения с помощью Монте-Карло.
Здесь финансовый результат уже положительный. Среднее значение доходности — +29,1%, что говорит нам о положительном математическом ожидании. Стратегия заслуживает право на существование.
Давайте еще раз тезисно по всему пробежимся:
В этой статье мы постарались показать, что для простейших вычислений вам не нужно быть математиком — все уже создано, можно брать и пользоваться. Самое важное, это умение тестировать стратегии и правильно работать с их данными. С таким подходом вы будете на голову выше других частных (как минимум) трейдеров.
Принципы распределения вы можете применять к любым показателям, которые вас заинтересуют. Это могут быть и средние движения криптовалют, и средняя ожидаемая доходность инвестиционного портфеля, и все, что вы сами захотите исследовать. Ограничения всегда лишь в вашей голове.
Работа с данными, тестирования, рациональное мышление и опора на статистику — вот что ценится среди профессионалов и отделяет их от любителей.—
И да, не забывайте, что финансовые рынки иногда проявляют “толстые хвосты” ;)
Успехов!
Вывод: Трейдинг и математика для трейдера работают иным образом, практически всегда наоборот от ожидаемых расчётов.
Где там минус 1?