vlad1024
vlad1024 личный блог
18 сентября 2011, 18:18

Исследование индекса оптимизма Smart Lab. Часть 1

Насколько предсказуемо поведение индекса оптимизма? Какие внешние факторы на него влияют, а на сколько это «вещь в себе»? Попытаемся ответить на эти вопросы в ходе исследования.

Прежде всего, обратимся к тому как он собственно расчитывается, на данный момент используется довольно простая формула Количество Быков/Количество Медведей. При этом возникают следующие проблемы: распределение индекса совсем не симметрично, резкое изменение соотношения приводит к серьезным «выбросам» (тяжелые хвосты распределения). 

<cut>

Поэтому первым делом приведем его к более приемлемому со статистической точки зрения виду.  Для этого пересчитаем индекс следующим образом: Процент Быков — Процент Медведей или (X — Y)/(X+Y). Сравним распределение индекса построенного по оригинальной(cлева) и предложенной формуле(справа):
 

 
 Распределение справа, хотя бы отдаленно напоминает нормальное. Поэтому остановимся на предложенной формуле и пересчитаем значения индекса:


В качестве внешних факторов будем использовать следующий набор финансовых инструментов: индекс РТС, индекс ММВБ, акции Сбербанк, акции Газпром, индекс Bovespa, индекс S&P, фьючер на нефть марки BRENT, фьючерс на золото и фьючерс на пару рубль/доллар.
Для каждого из которых расчитаем, разницу логарифмов открытия и закрытия(фактически, процентное приращение за день).

Наиболее всего индекс оптимизма скоррелирован с индексом РТС, корреляция достигает 38%, корреляция с индексом ММВБ  9.5%, с S&P 13.5%. (возможно значительное влияние оказывает вечерняя сессия)

Построенную модель, будем оценивать по двум параметрам:
1. Средне-квадратичное отклонение(СКО) ошибки, которое показывает насколько близко предсказания модели к реальным значениям индекса.  sqrt(sum((actual — prediction)^2)/N)
2. Корреляция предсказаний модели и значений индекса, показывает насколько часто модель правильно угадывает направление индекса.

В качестве нулевой модели будем использовать линейную регрессию с одним фактором: приращение логарифма индекса РТС, то есть формулу вида: A*приращение логарифма индекса РТС + B, где A и B находятся минимизацией СКО ошибки. В результате получим, СКО ошибки: 0.235,
Корреляция:  38.8%. Получим следующий график значений индекса и предсказаний модели(красным).

Как видно из графика, хотя модель достаточно часто правильно прогнозирует направление графика(относительно большая корреляция),  с амплитудой дела обстоят гораздо хуже(большое СКО ошибки). 

В следующей части исследования, мы ответим на вопрос, как улучшить эту простейшую модель, а так же какие абсолютно бессмысленные факторы влияют на поведение смарт лабовцев. И главное, сможет ли бездушный математический Терминатор, точно предсказать поведение иррационального, движимого толпой теплого лампового индекса, не пропустите.
 
12 Комментариев
  • Александр М
    18 сентября 2011, 19:47
    Плюс в ожидании следующей части.
    Хочется увидеть, как 38% корреляции превращаются в пункты профита.
  • criminal
    18 сентября 2011, 21:53
    Я думаю главным выводом будет то, что по индексу РТС можно прогнозировать индекс оптимизима смартлаба. Посмотрим прав ли я.
  • Тимофей Мартынов
    18 сентября 2011, 22:12
    Нифигасебе. Ну ты молодец.
  • Smoketrader
    19 сентября 2011, 00:00
    + в профиль и в тему…
    я тоже в первые года 4 пытался найти взаимосвязи…
  • AE-trader
    19 сентября 2011, 00:44
    Я думаю с практической точки зрения нужно корреляцию сравнивать не с индексом РТС а с фьючерсом на индекс… попробуйте и увидите, что она будет гораздо ниже
  • AE-trader
    19 сентября 2011, 00:49
    И еще насколько я понимаю статистика приведена по предыдущей истории индекса оптимизма когда он отсекался в 10.30 — к этому времени индекс РТС уже совершал движение и часто существенное, что в общем то сводит к нулю практическое применение выводов о корреляции по крайней мере с индексом РТС
  • AE-trader
    19 сентября 2011, 01:12
    Это не неожиданный результат :)
  • Nonick
    19 сентября 2011, 02:16
    откуда данные?
  • karapuz
    19 сентября 2011, 09:04
    молодец!
    многоплюсов. особенно за то, что пользуешься R :)
  • karapuz
    19 сентября 2011, 09:06
    vlad1024 а можно дискретную модель построить и оценить?
    которая не приращения, а просто направление предсказывает?

Активные форумы
Что сейчас обсуждают

Старый дизайн
Старый
дизайн