Блог им. vlad1024

Исследование индекса оптимизма Smart Lab. Часть 1

    • 18 сентября 2011, 18:18
    • |
    • vlad1024
  • Еще
Насколько предсказуемо поведение индекса оптимизма? Какие внешние факторы на него влияют, а на сколько это «вещь в себе»? Попытаемся ответить на эти вопросы в ходе исследования.

Прежде всего, обратимся к тому как он собственно расчитывается, на данный момент используется довольно простая формула Количество Быков/Количество Медведей. При этом возникают следующие проблемы: распределение индекса совсем не симметрично, резкое изменение соотношения приводит к серьезным «выбросам» (тяжелые хвосты распределения). 

<cut>

Поэтому первым делом приведем его к более приемлемому со статистической точки зрения виду.  Для этого пересчитаем индекс следующим образом: Процент Быков — Процент Медведей или (X — Y)/(X+Y). Сравним распределение индекса построенного по оригинальной(cлева) и предложенной формуле(справа):
 

 
 Распределение справа, хотя бы отдаленно напоминает нормальное. Поэтому остановимся на предложенной формуле и пересчитаем значения индекса:


В качестве внешних факторов будем использовать следующий набор финансовых инструментов: индекс РТС, индекс ММВБ, акции Сбербанк, акции Газпром, индекс Bovespa, индекс S&P, фьючер на нефть марки BRENT, фьючерс на золото и фьючерс на пару рубль/доллар.
Для каждого из которых расчитаем, разницу логарифмов открытия и закрытия(фактически, процентное приращение за день).

Наиболее всего индекс оптимизма скоррелирован с индексом РТС, корреляция достигает 38%, корреляция с индексом ММВБ  9.5%, с S&P 13.5%. (возможно значительное влияние оказывает вечерняя сессия)

Построенную модель, будем оценивать по двум параметрам:
1. Средне-квадратичное отклонение(СКО) ошибки, которое показывает насколько близко предсказания модели к реальным значениям индекса.  sqrt(sum((actual — prediction)^2)/N)
2. Корреляция предсказаний модели и значений индекса, показывает насколько часто модель правильно угадывает направление индекса.

В качестве нулевой модели будем использовать линейную регрессию с одним фактором: приращение логарифма индекса РТС, то есть формулу вида: A*приращение логарифма индекса РТС + B, где A и B находятся минимизацией СКО ошибки. В результате получим, СКО ошибки: 0.235,
Корреляция:  38.8%. Получим следующий график значений индекса и предсказаний модели(красным).

Как видно из графика, хотя модель достаточно часто правильно прогнозирует направление графика(относительно большая корреляция),  с амплитудой дела обстоят гораздо хуже(большое СКО ошибки). 

В следующей части исследования, мы ответим на вопрос, как улучшить эту простейшую модель, а так же какие абсолютно бессмысленные факторы влияют на поведение смарт лабовцев. И главное, сможет ли бездушный математический Терминатор, точно предсказать поведение иррационального, движимого толпой теплого лампового индекса, не пропустите.
 
★9
12 комментариев
Плюс в ожидании следующей части.
Хочется увидеть, как 38% корреляции превращаются в пункты профита.
avatar
Я думаю главным выводом будет то, что по индексу РТС можно прогнозировать индекс оптимизима смартлаба. Посмотрим прав ли я.
avatar
Нифигасебе. Ну ты молодец.
+ в профиль и в тему…
я тоже в первые года 4 пытался найти взаимосвязи…
avatar
Я думаю с практической точки зрения нужно корреляцию сравнивать не с индексом РТС а с фьючерсом на индекс… попробуйте и увидите, что она будет гораздо ниже
avatar
И еще насколько я понимаю статистика приведена по предыдущей истории индекса оптимизма когда он отсекался в 10.30 — к этому времени индекс РТС уже совершал движение и часто существенное, что в общем то сводит к нулю практическое применение выводов о корреляции по крайней мере с индексом РТС
avatar
AE-trader, ну это достаточно очевидно, что поведение проголосовавших зависимо от индекса РТС и относительно него запаздывает. Поэтому главный вопрос исследования ни о том как заработать, а о том как формируется мнение участников смарт лаба о рынке. На сколько его можно предсказать, а на сколько оно спонтанно. В результате можно прийти к достаточно неожиданным результатам, в свете мнения «рынок это толпа, поведение толпы спонтанно, эмоционально и трудно предсказуемо, поэтому и рынок плохо предсказуем». Толпа — очень предсказуема, рынок — нет.

При этом выборка на смарт лабе достаточно репрезентативна, чтобы по ней можно было судить в целом о такой рыночной группе как «частные трейдеры рубящиеся на фортсе».
avatar
Это не неожиданный результат :)
avatar
откуда данные?
avatar
Nonick, индекс оптимизма отсюда, там есть ссылка — скачать в файле для экселя, остальное с финама.
avatar
молодец!
многоплюсов. особенно за то, что пользуешься R :)
avatar
vlad1024 а можно дискретную модель построить и оценить?
которая не приращения, а просто направление предсказывает?
avatar

теги блога vlad1024

....все тэги



UPDONW
Новый дизайн