Статистические модели трендов. Смещение среднего. (Дополненное)

02 марта 2012, 13:45
|
vlad1024

Попросили объяснить что такое персистентность без специальных терминов и как она связана с трендовостью рынка. Совсем, без терминов вряд ли получится, но если их минимизировать, достаточно понятия — плотности вероятности.

Что такое плотность вероятности? Это функция интеграл интервала которой, дает нам вероятность попадания в этот интервал. Или в простейшем случаи, если мы рассматриваем ее эмпирическую оценку в виде гистограммы распределения это будет просто частота попадания в набор фиксированных интервалов.
Для примера рассмотрим гистограмму нормального распределения.

Статистические модели трендов. Смещение среднего. (Дополненное)

Собственно что мы видим — разбиение на набор фиксированных интервалов, затем подсчет попадания каждого значения в тот или иной интервал, который дает частоту. Если мы хотим посчитать частоту попадания в бОльший интервал например от 0 до 2, то нам необходимо сложить(проинтегрировать) частоту попадания во все маленькие интервалы внутри этого отрезка [0, 2]. Таким образом плотность вероятности дает возможность, зная интервал, получить вероятность попадания в него. Или если рассматривать на более «интуитивном» уровне — показывает какие значения выпадают более часто, а какие менее. В приведенном примере, наиболее часто выпадают значения вокруг нуля распределения и затем оно постепенно спадает.

Если мы рассмотрим, распределение как набор значений расположенных во времени (привычные для трейдинга представления в виде графиков числовых рядов). То получим для все того же нормального(гауссового) распределения следующую картинку:

Как и ожидалось из гистограммы распределения, 95% значений находятся внутри интервала от -2 до +2, с центром в нуле.

Каждый наверняка видел график случайного блуждания и этот на него мало похож. Разница в том, что для того чтобы получить случайное блуждание необходимо последовательно сложить эти значения. Или наоборот чтобы получить из случайного блуждания — распределение приращений, необходимо взять разность соседних значений.

Таким образом мы подходим к первой простейшей модели тренда. Рассмотрим распределение приращений:

которое практически на глаз не отличается от предыдущего, но среднее (центр) сдвинуто на +0.1. Теперь просуммируем значения распределений для первого случая с нулевым и положительным (+0.1) смещением среднего, таким образом получим два графика случайных блужданий.

Первый, без смещения в мат ожидании приращений:

А второй, с «ничтожным» (ели разлечимым на графике распределения приращений) смещением(+0.1):

Разница, разительная, но на первом графике — заработать не возможно, а на втором вполне.

В данном случае мы рассматриваем, зависимость(смещение в мат. ожидании), которая не изменяется во времени, то есть стационарна, 0 для всего графика, или +0.1 другого. Теперь представим что эти значения сами изменяются во времени, и представляют к примеру кусочно-постоянную функцию. То есть набор констант, из которого мы выбираем значение, действующее на каком-то интервале. Соответственно если это значение положительное возникает «растущий кусок тренда», если отрицательное — «падающий». А сам график «сшит» из таких интервалов с постоянными значениями. Таким образом мы получим приближенную к реальности простейшую динамическую модель тренда. У которое стационарное среднее приращений равняется 0, но при этом существуют интервалы на которых оно отклоняется от 0 как в положительную так и отрицательную сторону. При этом в среднем количество таких участков «уравновешивается» и мы получаем среднее всех приращений близким к нулю.

Или если мы будем рассматривать среднее, как функцию времени, то для кусочно-постоянной модели, получим следующую картинку:

Или ввиде формулы, P_i+1 = P_i + A_k + N(0, 1) , где A_k это значение среднего на данном временном интервале(t_k, t_k+1), N(0, 1) стандартизированное нормальное распределение, а Pi это получившийся стохастический процесс.

Для примера рассмотрим реализацию такого стохастического процесса, при t_k = (0, 100, 200, 400, 450, 600, 650) и A_k = (+0.1, -0.1, +0.05, +0.15, -0.2, -0.05), что примерно соответствует представленному выше графику зависимости от времени.

Первая реализация:

Вторая реализация:

Как видно они мало похожи, и в них гораздо менее очевидно наличие трендов чем в простейшем стационарном случаи, но тем не менее они там присутствуют, а значит на таком процессе возможно заработать.

В следующей серии, мы поговорим о еще одной модели тренда, которая связана с персистентностью, или более конкретно, мы будем понимать под персистентностью — авто-регрессивность числового ряда.

Данная публикация является личным мнением автора. Мнение владельца сайта может не совпадать с мнением автора.

1.3К | ★51

50 комментариев

vlad1024, такие модели только для упражнений в стох.анализе потребны.

Временной ряд на финансовом рынке — не Винеровский процесс.

Shredder

02 марта 2012, 14:01
Ответить

Shredder, а где здесь винеровский процесс? ряд с кусочно-постоянным смещеним среднего, к примеру, во первых не стационарен, во вторых не винеровский. Просто я на простейших примерах показываю как прийти к этой мысли, так как топики статистической направленности тут вообще не особо любят, да и попросили объяснить «на пальцах».

vlad1024

02 марта 2012, 14:04
Ответить

vlad1024, тогда плюс :)) Здесь любят топики, где направленность рукой указывают.

Может тогда возьмете на себя труд объяснить популярно публике, что есть Винеровский процессс… А вдруг кто-то заинтересуется как премии по Black-Sholes считают )

Shredder

02 марта 2012, 14:12
Ответить

Shredder, да я вроде бы и так насколько мог объяснил что такое случайное блуждание (интеграл белого шума). А винеровский процесс получается из случайного блуждания, как предел перехода к шагу по времени стремящемуся к нулю.
Гауссовость тут или какое-то другое распределение приращений — не важно, главное в этой модели тренда, что происходит динамическое смещение центра(мат.ожидания/медианы) распределения приращений от нуля. Собственно чем занимается уважаемый А. Г. и зарабатывает деньги на рынке, это исследование оптимальных оценок в рамках данных моделей, более подробно можно почитать у него на сайте.

vlad1024

02 марта 2012, 14:30
Ответить

Shredder, а какой, на Ваш взгляд?

автору +

onemorefake

02 марта 2012, 14:08
Ответить

onemorefake, Он, во первых, не случайный, а во вторых — нормальное распределение вероятности на нем не работает (есть стандартные методы для определения белого шума — они почти всегда дают отрицательный результат)

Shredder

02 марта 2012, 14:22
Ответить

Shredder, случайный/неслучайный это, скажем так, вопрос скорее религии :) суть от этого не меняется.
То что гаусс не работает оно и понятно — на нем на дистанции и заработать нельзя.

onemorefake

02 марта 2012, 14:46
Ответить

onemorefake, нет — это не религия. Временной ряд — либо белый шум либо — нет.

Shredder

03 марта 2012, 01:01
Ответить

Swan, «В следующей серии, мы поговорим о еще одной модели тренда, которая связана с персистентностью, или более конкретно, мы будем понимать под персистентностью — авто-регрессивность числового ряда.»

Просто лень было все в одном посте писать, но решил начать с азов. )

vlad1024

02 марта 2012, 14:01
Ответить

Swan, нормальное распределение вероятности — хорошая модель для технических приложений. Систем массового обслуживания, например. На рынке это не работает.

Shredder

02 марта 2012, 14:19
Ответить

Swan, Стартовать можно. Но нужно заранее уяснить, что системы массового обслуживания — это не финансовые рынки. Самый большой натурный эксперимент который был поставлен на эту тему LTCM. После его банкротства, наиболее продвинутая часть публики — это уяснила четко. А остальным популярно растолковали в 2008 когда долбанула деривативная пирамида MBS…

Shredder

02 марта 2012, 14:35
Ответить

Swan, дифференцируешь временной ряд (что бы тренд убрать) и любой продвинутый софт. Хоть тот же SPSS применяешь

Shredder

02 марта 2012, 14:38
Ответить

Shredder, просто так дифференциировать зашумленный ряд данных нельзя) получится такой бред, что дальше работать с этим набором цифр будет нельзя.

Kostya_gro

02 марта 2012, 16:45
Ответить

Kostya_gro, Не обязательно тупо дифференцировать, можно другим способом тренд убрать…

Shredder

03 марта 2012, 01:00
Ответить

автору — а в виде формулы нельзя предложенную модель описать?

onemorefake

02 марта 2012, 14:48
Ответить

onemorefake, можно и в виде формулы, добавил картинку с описанием.

vlad1024

02 марта 2012, 15:30
Ответить

vlad1024, спасибо!

собственно пример торговли по Горчакову в чистом виде :)

onemorefake

02 марта 2012, 16:36
Ответить

onemorefake, ну до торговле тут далеко, надо еще построить оптимальные критерии определения точек изменения тренда, учесть не стационарность волатильности и т.д. чем А.Г. и занимается. А так да, модель достаточно очевидная, но в то же время достаточно «похожа на реальность». А то тут меня уже начали обвинять, что ни к чему кроме заданий по стохастическому анализу, «такая статистика» не пригодна. )

vlad1024

02 марта 2012, 16:50
Ответить

vlad1024, да никто Вас не обвиняет… Просто эту дистанцию уже столько народу плавало… Не втыкается серьёзный Теорвер в трейдинг напрямую никак ((

Shredder

03 марта 2012, 01:05
Ответить

Shredder,

В том то и дело, что либо случайность и теорвер (это неотделимо), либо цены предсказуемы точно по прошлым значениям (просто мы не знаем этого «закона»).

А из теорвера все потенциально просто:- надо искать статзависимость прошлого и будущих приращений цен.

Только одна «незадача» — классический теорвер из вузовских учебников — это теория независимых случайных величин и их модификаций на разного рода процессы (мартингал — это как одна из модификаций независимости).

А мы решаем задачу «перпендикулярную» тому, чему учат в теорвере и тому, что активно развивалось. А зависимые выборки, не сводящиеся к независимому случаю при переходе от непрерывного времени к дискретному, — это «падчерица» фундаментального теорвера, так как общую и красивую теорию на них не построишь и докторскую не защитишь.

А. Г.

03 марта 2012, 01:34
Ответить

не, влад… ты конечно очень умный )) но объяснять по-простому, без терминов — это явно не твоё))))

karapuz

02 марта 2012, 15:00
Ответить

karapuz, не… проще это уже будет в 10 раз больше текста и вообще не понятно о чем… тут надо приложить усилие над собой и хотябы прочитать википедию по непонятным словам. ))

vlad1024

02 марта 2012, 15:35
Ответить

-1

vlad1024, да я читал))) не помогло)))))

karapuz

02 марта 2012, 17:19
Ответить

я вот тут подумал, если цена движется с коэффициентом, равной какой то константе. то, думаю, высчитать этот К представляется возможным последовательным перебором периодов. Даже не периодов, а… кароче…
есть массив данных цены
1,2,3,4,5,4,4,3,2...., n
начинаем считать приращение с 1по n. Не нашли.
с 2 по n
с 3… с 4, с 5, с4, с4 по n.
правда толку не будет наверное, потому что как никак это история… свершившийся факт.
а вот для интересу можно, только вычислительные мощности нужны намного более серьезные, чем наши ПК :)
я кончено могу ошибаться. это лишь мое имхо после прочтения хорошего поста)

Скальпёр

02 марта 2012, 16:13
Ответить

описанная модель насколько понимаю не соответствует реальному распределению цен. на долгосрочных графиках фондовых индексов смещение среднего есть. но там еще есть высокий пик и толстые хвосты. за топик +. ждем продолжения про персистентность!

Сергей

02 марта 2012, 17:30
Ответить

Сергей,

Если рассматривать значения смещения среднего и дисперсии, как процессы с «тяжелыми хвостами», одномерное распределение приведенного процесса тоже будет иметь «тяжелые хвосты».

А. Г.

02 марта 2012, 18:16
Ответить

А. Г., на приведенной диаграмме (нормального распределения со смещением среднего) вроде нет тяжелых хвостов?..

Сергей

02 марта 2012, 19:08
Ответить

Сергей, тяжелые хвосты возникают из-за неоднородности интенсивности торгов на рынке, для этого достаточно модели стохастической волатильности, то есть динамически изменяющейся дисперсии. Самый широкий класс таких процессов — мартингаловский. Согласно теореме о репрезентации мартингала, любой такой процесс, можно представить как броуновское блуждание в неоднородном времени.

vlad1024

02 марта 2012, 19:28
Ответить

vlad1024, еще просьба: связывать все, что пишите со статистикой биржевых цен. примеры, аналогии и пр.

Сергей

02 марта 2012, 20:43
Ответить

Сергей,

Де-факто я ответил на Ваш вопрос выше

smart-lab.ru/blog/43277.php#comment720985

А. Г.

02 марта 2012, 23:17
Ответить

Swan,

В том то и дело, глобальное среднее у такого процесса может быть нулевым, а на отрезках с одним и тем же сдвигом среднее произведений двух соседних приращений положительно (так как глобальное среднее нуль, то мы не вычитаем произведение средних)

А. Г.

02 марта 2012, 18:19
Ответить

Swan,

Ниже правильно vlad1024 сказал, что хвосты порождает неоднородность среднего и дисперсии. Мы имеем не нормальное распределение N(0,s), а распределение N(a,b*s), где а и b в свою очередь случайные величины и закон такого распределения при абсолютно непрерывных распределениях a и b уже будет интегралом от нормальной плотности n(a,b*s), умноженной на плотности a и b. А у этого интеграла при разных распределениях a и b могут быть «хвосты» любой тяжести.

Вообще эта модель интересна тем, что в ее рамках можно объяснить любую одномерную статистику от приращений цен. Но в этом и ее слабость — она ничего не объясняет, а лишь дает пути поиска статпреимущества.

А. Г.