vlad1024
vlad1024 личный блог
02 марта 2012, 13:45

Статистические модели трендов. Смещение среднего. (Дополненное)

Попросили объяснить что такое персистентность без специальных терминов и как она связана с трендовостью рынка. Совсем, без терминов вряд ли получится, но если их минимизировать, достаточно понятия — плотности вероятности. 

Что такое плотность вероятности? Это функция интеграл интервала которой, дает нам вероятность попадания в этот интервал. Или в простейшем случаи, если мы рассматриваем ее эмпирическую оценку в виде гистограммы распределения это будет просто частота попадания в набор фиксированных интервалов. 
Для примера рассмотрим гистограмму нормального распределения.

Статистические модели трендов. Смещение среднего. (Дополненное) 

Собственно что мы видим — разбиение на набор фиксированных интервалов, затем подсчет попадания каждого значения в тот или иной интервал, который дает частоту. Если мы хотим посчитать частоту попадания в бОльший интервал например от 0 до 2, то нам необходимо сложить(проинтегрировать) частоту попадания во все маленькие интервалы внутри этого отрезка [0, 2]. Таким образом плотность вероятности дает возможность, зная интервал, получить вероятность попадания в него. Или если рассматривать на более «интуитивном» уровне — показывает какие значения выпадают более часто, а какие менее. В приведенном примере, наиболее часто выпадают значения вокруг нуля распределения и затем оно постепенно спадает. 

Если мы рассмотрим, распределение как набор значений расположенных во времени (привычные для трейдинга представления в виде графиков числовых рядов). То получим для все того же нормального(гауссового) распределения следующую картинку:
Статистические модели трендов. Смещение среднего. (Дополненное)

Как и ожидалось из гистограммы распределения, 95% значений находятся внутри интервала от -2 до +2, с центром в нуле. 

Каждый наверняка видел график случайного блуждания и этот на него мало похож. Разница в том, что для того чтобы получить случайное блуждание необходимо последовательно сложить эти значения. Или наоборот чтобы получить из случайного блуждания — распределение приращений, необходимо взять разность соседних значений. 

Таким образом мы подходим к первой простейшей модели тренда. Рассмотрим распределение приращений: 
Статистические модели трендов. Смещение среднего. (Дополненное)

которое практически на глаз не отличается от предыдущего, но среднее (центр) сдвинуто на +0.1. Теперь просуммируем значения распределений для первого случая с нулевым и положительным (+0.1) смещением среднего, таким образом получим два графика случайных блужданий. 

Первый, без смещения в мат ожидании приращений:
Статистические модели трендов. Смещение среднего. (Дополненное)

А второй, с «ничтожным» (ели разлечимым на графике распределения приращений) смещением(+0.1):
Статистические модели трендов. Смещение среднего. (Дополненное)

Разница, разительная, но на первом графике — заработать не возможно, а на втором вполне. 

В данном случае мы рассматриваем, зависимость(смещение в мат. ожидании), которая не изменяется во времени, то есть стационарна, 0 для всего графика, или +0.1 другого. Теперь представим что эти значения сами изменяются во времени, и представляют к примеру кусочно-постоянную функцию. То есть набор констант, из которого мы выбираем значение, действующее на каком-то интервале. Соответственно если это значение положительное возникает «растущий кусок тренда», если отрицательное — «падающий». А сам график «сшит» из таких интервалов с  постоянными значениями. Таким образом мы получим приближенную к реальности простейшую динамическую модель тренда. У которое стационарное среднее приращений равняется 0, но при этом существуют интервалы на которых оно отклоняется от 0 как в положительную так и отрицательную сторону. При этом в среднем количество таких участков «уравновешивается» и мы получаем среднее всех приращений близким к нулю.

Или если мы будем рассматривать среднее, как функцию времени, то для кусочно-постоянной модели, получим следующую картинку:
Статистические модели трендов. Смещение среднего. (Дополненное)
Или ввиде формулы, P_i+1 = P_i + A_k + N(0, 1)  , где A_k это значение среднего на данном временном интервале(t_k, t_k+1), N(0, 1) стандартизированное нормальное распределение, а Pi это получившийся стохастический процесс. 

Для примера рассмотрим реализацию такого стохастического процесса, при t_k = (0, 100, 200, 400, 450, 600, 650) и A_k = (+0.1, -0.1, +0.05, +0.15, -0.2, -0.05), что примерно соответствует представленному выше графику зависимости от времени. 

Первая реализация:
Статистические модели трендов. Смещение среднего. (Дополненное)

Вторая реализация:
Статистические модели трендов. Смещение среднего. (Дополненное)

Как видно они мало похожи, и в них гораздо менее очевидно наличие трендов чем в простейшем стационарном случаи, но тем не менее они там присутствуют, а значит на таком процессе возможно заработать.

В следующей серии, мы поговорим о еще одной модели тренда, которая связана с персистентностью, или более конкретно, мы будем понимать под персистентностью — авто-регрессивность числового ряда.
50 Комментариев
  • Shredder
    02 марта 2012, 14:01
    vlad1024, такие модели только для упражнений в стох.анализе потребны.

    Временной ряд на финансовом рынке — не Винеровский процесс.
      • Shredder
        02 марта 2012, 14:12
        vlad1024, тогда плюс :)) Здесь любят топики, где направленность рукой указывают.

        Может тогда возьмете на себя труд объяснить популярно публике, что есть Винеровский процессс… А вдруг кто-то заинтересуется как премии по Black-Sholes считают )
    • onemorefake
      02 марта 2012, 14:08
      Shredder, а какой, на Ваш взгляд?

      автору +
      • Shredder
        02 марта 2012, 14:22
        onemorefake, Он, во первых, не случайный, а во вторых — нормальное распределение вероятности на нем не работает (есть стандартные методы для определения белого шума — они почти всегда дают отрицательный результат)
        • onemorefake
          02 марта 2012, 14:46
          Shredder, случайный/неслучайный это, скажем так, вопрос скорее религии :) суть от этого не меняется.
          То что гаусс не работает оно и понятно — на нем на дистанции и заработать нельзя.
          • Shredder
            03 марта 2012, 01:01
            onemorefake, нет — это не религия. Временной ряд — либо белый шум либо — нет.
  • onemorefake
    02 марта 2012, 14:48
    автору — а в виде формулы нельзя предложенную модель описать?
      • onemorefake
        02 марта 2012, 16:36
        vlad1024, спасибо!

        собственно пример торговли по Горчакову в чистом виде :)
          • Shredder
            03 марта 2012, 01:05
            vlad1024, да никто Вас не обвиняет… Просто эту дистанцию уже столько народу плавало… Не втыкается серьёзный Теорвер в трейдинг напрямую никак ((
            • А. Г.
              03 марта 2012, 01:34
              Shredder,

              В том то и дело, что либо случайность и теорвер (это неотделимо), либо цены предсказуемы точно по прошлым значениям (просто мы не знаем этого «закона»).

              А из теорвера все потенциально просто:- надо искать статзависимость прошлого и будущих приращений цен.

              Только одна «незадача» — классический теорвер из вузовских учебников — это теория независимых случайных величин и их модификаций на разного рода процессы (мартингал — это как одна из модификаций независимости).

              А мы решаем задачу «перпендикулярную» тому, чему учат в теорвере и тому, что активно развивалось. А зависимые выборки, не сводящиеся к независимому случаю при переходе от непрерывного времени к дискретному, — это «падчерица» фундаментального теорвера, так как общую и красивую теорию на них не построишь и докторскую не защитишь.
  • karapuz
    02 марта 2012, 15:00
    не, влад… ты конечно очень умный )) но объяснять по-простому, без терминов — это явно не твоё))))
      • karapuz
        02 марта 2012, 17:19
        vlad1024, да я читал))) не помогло)))))
  • Скальпёр
    02 марта 2012, 16:13
    я вот тут подумал, если цена движется с коэффициентом, равной какой то константе. то, думаю, высчитать этот К представляется возможным последовательным перебором периодов. Даже не периодов, а… кароче…
    есть массив данных цены
    1,2,3,4,5,4,4,3,2...., n
    начинаем считать приращение с 1по n. Не нашли.
    с 2 по n
    с 3… с 4, с 5, с4, с4 по n.
    правда толку не будет наверное, потому что как никак это история… свершившийся факт.
    а вот для интересу можно, только вычислительные мощности нужны намного более серьезные, чем наши ПК :)
    я кончено могу ошибаться. это лишь мое имхо после прочтения хорошего поста)
  • Сергей
    02 марта 2012, 17:30
    описанная модель насколько понимаю не соответствует реальному распределению цен. на долгосрочных графиках фондовых индексов смещение среднего есть. но там еще есть высокий пик и толстые хвосты. за топик +. ждем продолжения про персистентность!
    • А. Г.
      02 марта 2012, 18:16
      Сергей,

      Если рассматривать значения смещения среднего и дисперсии, как процессы с «тяжелыми хвостами», одномерное распределение приведенного процесса тоже будет иметь «тяжелые хвосты».
      • Сергей
        02 марта 2012, 19:08
        А. Г., на приведенной диаграмме (нормального распределения со смещением среднего) вроде нет тяжелых хвостов?..
          • Сергей
            02 марта 2012, 20:43
            vlad1024, еще просьба: связывать все, что пишите со статистикой биржевых цен. примеры, аналогии и пр.
        • А. Г.
          02 марта 2012, 23:17
          Сергей,

          Де-факто я ответил на Ваш вопрос выше

          smart-lab.ru/blog/43277.php#comment720985
  • Kelvinoid
    27 апреля 2012, 16:52
    Скажите, а можно расчитать среднее отклонение в текущий период времени. и как?
      • Kelvinoid
        27 апреля 2012, 17:07
        vlad1024, а каким образом взять среднее? может есть софтина полезная для этого? =)

Активные форумы
Что сейчас обсуждают

Старый дизайн
Старый
дизайн