Добрый день, коллеги!
Этот пост написан в продолжение дискуссии, начатой
Открытое письмо к VictorGromov. Доколе?! (smart-lab.ru)
К сожалению, сам я в ней поучаствовать не смог, т.к. был мгновенно забанен за систематическое называние VictorGromov большим земляным червяком, не уважающим нас, смердов. Ну и правильно. Чем больше на СЛ будет таких активных и плодовитых авторов, как VictorGromov, тем больше годного контента мы с вами получим. Аминь!
Возьмем какой-нибудь длинный массив котировок. Например, XBTUSD.P (код tradingview.com), которым я давно и успешно торгую. В моменте у меня его аж 2437219 минутных баров. Поскольку биткойн на долгосроке ходит размашисто, возьмем логарифм от цены (не буду повторяться, почему всегда полезно исследовать логарифм от цены, но на коротком сроке это бесполезная модификация).
Пусть x(n) — это логарифм цены
Пусть d(n)=x(n)-x(n-1) — это приращение логарифма цены
В 99% вероятностных подходов к рынку базовой случайной величиной является не цена, а ее приращение (ну, или приращение ее логарифма). Опять же не буду повторяться, почему это удобнее — на этот счет есть 100500 публикаций.
Посмотрим на d(n) как на реализацию случайного процесса. Мы ничего особо не знаем про этот процесс, но можем попытаться оценить матожидание и дисперсию по этой единственной реализации.
Для этого построим график частичных сумм d(1)+...+d(n). Получим мы, ессно, исходный ряд x(n) и вот такой график:

Из него мы видим, что матожидание d(n) скорее всего положительно, дисперсия/СКО высоки по сравнению с матожиданием, так что ничего уверенного про поведение цены в ближайшем будущем мы сказать не можем. Также мы не знаем, стационарны ли матожидание и дисперсия, либо же они меняются со временем.
Теперь построим еще 2 случайные величины:
y(n) = abs(d(n))
z(n) = d(n)*sign(d(n-1))
и применим к ним такую же процедуру.
В первом случае получим график:

Из него мы видим, что матожидание y(n) слабо зависит от времени, а дисперсия мала по сравнению с матожиданием. После детрендирования ряда (исключения из него линии регрессии), можно увидеть колебания около нуля и порассуждать о кластеризации волатильности. Ну и монотонный рост не вызывает у нас вопросов — мы складываем только неотрицательные числа.
Второй случай интереснее:

Это по сути график эквити простейшей реверсивной трендовой линейной торговой системы порядка 1. Из него мы также видим, что матожидание z(n) слабо зависит от времени, а дисперсия мала по сравнению с матожиданием.
Но тут мы уже имеем дело со знакопеременным рядом, так что тот факт, что частичные суммы четко ложатся на асимптотическую прямую, объяснить уже непросто.
ТЕПЕРЬ ВЫ, КОЛЛЕГИ:
1. Берете любую теоретико-вероятностную модель, которую Вы используете для работы на рынке (случайное блуждание, авторегрессионные модели, модели с кластеризацией волатильности, любые кастомные модели с изменяющимися во времени матожиданием и дисперсией) и пробуете воспроизвести этот феномен (последовательность z(n) и график ее частичных сумм).
2. Далее берете любой знакомый вам ряд ценовых котировок (Si, Ri, GAZP, SBER, валюты, индексы, коммодитиз, американские стоки, крипту — вообще все, что угодно, кроме облигаций, дисконтные инструменты можно) и воспроизводите график сумм z(n). Это можно сделать в Excel за 3 минуты. И видите, что магия работает, правда, в 90% случаев у вас выйдет не монотонно возрастающая, а монотонно убывающая функция. Главное, чтобы таймфрейм был малый (1m, но можно юзать 15m, 30m, 1h, дальше — хуже), а количество баров — большое (иначе получатся корявые, а не красивые картинки).
3. Видите, что теоретико-вероятностная модель радикально расходится с реалом. И, чтобы как-то привести ее в соответствие, следует выкрутить корреляцию соседних приращений цен вплоть до +-100% (что не слишком соответствует действительности и не подтверждается графиком выборочной АКФ).
4. Задаете себе вопрос — если в этом тесте теоретико-вероятностная модель показывает одно, а рыночные котировки — совсем другое, то каковы реальные границы применения этой теоретико-вероятностной модели? Будет ли она работать и нести бабло?
Как-то так.
С уважением
P.S. Иногда (редко) вместо 3-го графика получается какой-то фантазийный мусор. В 99.9% случаев это означает, что:
1. Котировки «кухонные»
2. На этом рынке нет ликвидности
3. Вы взяли не все котировки (убрали ночные торги, которыми не пользуетесь)
Других исключений пока найдено не было, но все может быть в теории...
А есть у вас котировки по NG,SPY,NASDAQ?
Вообще говоря слабо понятно, что означает «совсем другое»?
Модельные ряды дают качество роста 3-4 (шарп)
Реальные… от +2 (Si) до -7 ( комоды).
Мои системы ито более ровные графики выдают чем это всё. Но они посложнее, конечно.
В мою бытность студентом кафедры алгебры матмеха ЛГУ именно в мою обязанность (ну и пары таких же способных коллег) входила подготовка ответов на присылаемые в огромном количестве доказательства Великой Теоремы Ферма. Никто это не поручал аспирантам — у них и так много важных дел. Завкафедры просто распределял пачки писем между сотрудниками, а те спускали это дело на своих студентов.
Там была, конечно масса феерической ереси, вроде «я не понимаю, почему вы не отвечаете уже на мое 5-е письмо с абсолютно правильным доказательством Великой Теоремы Ферма. То ли по той причине, что я пишу вам из мест лишения свободы, то ли по какой-то другой причине...».
Но больше всего мне врезалось в память толстое письмо, в котором чувак чистыми вычислениями пытался опровергнуть ВТФ для показателя 3 (этот кейс еще Эйлер разобрал в лохматые годы) и перемежал кучи листков с вычислениями перлами примерно такого типа:
«Извлекать кубические корни из целых чисел — очень непростое занятие. С каждым следующим знаком после запятой вычисления становятся все сложней и сложней. Но я абсолютно уверен, что когда-нибудь им придет конец...»
С уважением
О чем спич?
С уважением