Исследование индекса оптимизма Smart Lab. Часть 2

25 сентября 2011, 20:34
|
vlad1024

В предыдущей серии, мы пересчитали значении индекса, а так же нашли его корреляцию с приращениями индекса RTS, таким образом построив простейшую модель (Корреляция: 38.8%, СКО ошибки: 0.235), на этот раз мы попробуем значительно ее улучшить.

Для каждого из используемых факторов: Индекс РТС, индекс ММВБ, акции Сбербанк, акции Газпром, индекс Bovespa, индекс S&P, фьючер на нефть марки BRENT, фьючерс на золото и фьючерс на пару рубль/доллар, посчитаем: приращения логарифма (logdelta = log(Close) — log(Open)). По которым построим линейную регрессию этих приращений и значений индекса оптимизма. То есть формулу вида: индекс оптимизма = A0 + A1*РТС logdelta + A2*ММВБ logdelta + A3*S&P logdelta +…. В результате получим, что два статистически значимых фактора, приращения индекса РТС и индекса ММВБ, и здесь нас ждет первая неожиданность: значимыми оказываются не сами приращения, а их разница (то есть, приращение индекса РТС — приращение индекса ММВБ).
Таким образом выделим новый фактор: РТС logdelta — ММВБ logdelta, и попробуем построить на его основе модель (аналогичную той что была в первой части). Получим:
индекс оптимизма = 15.77*(РТС logdelta — ММВБ logdelta) + 0.095
(черным значения индекса, красным предсказания модели)

Как видно модель, чаще стала угадывать направление, и даже амплитуду, что выразилось в росте Корреляции: 38.8% -> 60%, и снижении СКО ошибки: 0.235 -> 0.202. Из чего можно сделать вывод, что разница приращений РТС и ММВБ является, основным наиболее существенным фактором влияющим на значения индекса оптимизма.
Попробуем еще немного усложнить модель, чтобы повысить ее предсказательную силу. Для каждого инструмента добавим следующие факторы: logdelta_l1 (приращение за предыдущий день) и logrange (log(high) — log(low)). Использую так же как и в предыдущих случаях линейную регрессию, мы выявим два фактора статистически значимо влияющие на значения индекса, это: sandp_logdelta_l1 (приращения S&P500 за предыдущий день) и brent_logrange (диапазон движения нефти за текущий день в лог масштабе log(high) — log(low)).
Используя уже выявленный фактор (разница приращений ММВБ и РТС) и эти два, построим новую, трех факторную модель. Получим:
индекс оптимизма = 16.22*rtsi_micex_logdelta + 4.93*sandp_logdelta_l1 + 6.91*brn_logrange — 0.1
или то же самое, но в масштабе приращений (а не их логарифмов):
индекс оптимизма = 0.0087*rtsi_micex_delta + 0.0043*sandp_delta_l1 + 0.0613*brn_range — 0.1

Корреляция: 60% -> 74%, СКО ошибки: 0.202 -> 0.170
Добавление большего количества факторов, с одной стороны несомненно могло еще больше улучшить формальные метрики, с другой стороны на такой небольшой выборке(100 значений) привело бы к переподгонке/переоптимизации и худшей предсказательной силе модели. Поэтому остановимся на выделенных трех статистически значимых факторах и попробуем улучшить структуру нашей линейной модели. Каким образом? Попробуем добавить нелинейность! То есть перейдем от линейной регрессии вида a0 + a1*factor1 + a2*factor2 +.., к обобщенным аддиативным моделям(gam/generalized additive model) вида F0 + a1*F1(factor1) + a2*F2(factor2) + ..., где F0, F1, F2 — какие-то нелинейные функции(не параметрические, чаще всего сплайны).
Для каждого из трех факторов получим функции вида:

Как видно существенно нелинейно преобразование лишь для первого фактора(rts_micex_logdelta, разница приращений РТС и ММВБ). Поэтому остановимся на финальной модели вида: a0 + a1*F1(rts_micex_logdelta) + a2*sandp_logdelta_l1 + a3*brn_logrange. В результате получим:

Как видно, значения предсказанные моделью, почти не отличаются от «настоящего» индекса. Корреляция: 74% -> 81%, СКО ошибки: 0.170 -> 0.146.

Ну и на последнем этапе, произведем форвардное тестирование модели, на новых данных полученных за неделю (19-23).
(черным значения индекса, зеленым трех факторная линейная модель, красным нелинейная обобщенная модель)

В общем видно, что линейная модель предсказывала немного лучше нелинейной, и обе они были хуже чем на истории, что скорее всего связанно с аномальным падением рынка.

Какие можно сделать выводы из проведенного исследования?

1. Индекс оптимизма скоррелирован с приращением S&P за предыдущий день, тоесть сентимент существенно запаздывает, «толпа» верит что движение S&P за прошлый день продолжится. (в отличии от рынка приращения, которого за текущий день не скоррелировано с приращением S&P за прошлый)

2. Индекс оптимизма скоррелирован с волатильностью нефти BRENT, то есть рост волатильности нефти воспринимается позитивно, а падение негативно.

3. Хотя индекс оптимизма скоррелирован с приращениями индекса РТС, наиболее значимым фактором является разница приращений РТС и ММВБ, что достаточно неожиданно, и у меня нет однозначной интерпретации на этот счет (можете предложить свою в комментариях)

И на последок, предикативность индекса оптимизма (по y приращение RTSI на следующий день, по x значения индекса):

корреляция — 9%, что меньше статистической значимости, и меньше серийности RTSI — 20%(корреляция приращений текущего и следующего дня за период).

данные, картинки, код на R

Ключевые слова:
индекс оптимизма,
research

272 | ★9

19 комментариев

занимательно однако:) лови плюс

hasupapa

25 сентября 2011, 21:09
Ответить

похоже на правду. +

S.One

25 сентября 2011, 21:14
Ответить

а разница между ммвб и ртс это случайно не курс бакса?

Александр М

25 сентября 2011, 21:20
Ответить

Александр Малофеев, вместе))

karapuz

25 сентября 2011, 21:21
Ответить

разница приращений ммвб и ртс — это изменение курса рубля))

karapuz

25 сентября 2011, 21:21
Ответить

неа, фьючерс на рубль там тоже был, он тоже вылазил как значимый фактор, но значительно хуже чем разница между ртс и ммвб

vlad1024

25 сентября 2011, 21:27
Ответить

Настоящий доклад очень похож на раскрытие темы доктора наук, академика РАН Иванова о Влиянии пессимистических элементов катастрочески мистифицирующих патологическую абстрактность.

Проще говоря доклад не о чем. Причина нет сути и конкретики.
Индекс оптимизма вообще вещь тоже не о чем для рядового спекулянта, коих здесь 99%.

Спасибо исследователям за работу, в очередной раз можно констатировать что рынок это совсем математика и по формуле 2+2=4 он ходить не будет.
Корелировать можно все что угодно и с чем угодно, но вы никогда не найдете даже приблизительную точность.

Arhilamer

25 сентября 2011, 21:47
Ответить

Arhilamer, к сожалению или к счастью, пред последняя картинка как раз показывает, что относительно простая трех факторная модель, достаточно точно предсказывает значения индекса оптимизма.

vlad1024

25 сентября 2011, 21:54
Ответить

vlad1024, Немного усложним задачу ради которой наверно все ломают голову: заработать благодаря этим исследованиям индекса оптимизма сможете на рынке? Если да то подскажите где шортить.

Arhilamer

25 сентября 2011, 22:01
Ответить

Arhilamer, я еще в прошлой серии в комментах говорил, что это исследование не про «заработать», а про то как предсказать поведение «толпы», тут ведь так часто любят рассуждать на эту тему )
более прикладного характера исследование, я тоже наметил, посмотрим что получится…

vlad1024

25 сентября 2011, 22:24
Ответить

vlad1024, Вся сущность в том, что крупняк всегда делает деньги на толпе (спекулях), следовательно, играет(торгует) против нее.
Предположим что поведение толпы мы предсказали, даст ли нам это финансовую пользу или вообще что даст??? Очень сложно сказать.
Тогда жму руку за исследования)

Arhilamer

25 сентября 2011, 22:36
Ответить

Swan, на R все, я там добавил в конец ссылку на архив

vlad1024

25 сентября 2011, 21:52
Ответить

к автору: не хотите протестировать простейшую контрарную стратегию на основе индекса оптимизма?

Сергей

26 сентября 2011, 07:45
Ответить

Сергей, я там добавил в конце картинку, нет смысла.

vlad1024

26 сентября 2011, 12:24
Ответить

относительно предикативности индекса оптимизма.
я хотел бы сделать что-то вроде такого теста для другого консенсуса.
прошу совета.
общий алгоритм, думаю, такой:
вычислить приращения консенсуса;
вычислить приращения цены;
сделать корреляционный тест приращений цены за сегодня и приращений индекса за вчера.
все верно? или я упустил что-н? наприм., перевод в логарифмы и пр.

Сергей

27 апреля 2012, 21:29
Ответить

Отличное исследование, которое доказывает что нет никаких «куклов», и что толпа это и есть рынок. Если все скажут что сегодня доллар стоит 100 рублей, то никакой «кукл» не изменит этого факта и всем остальным рано или поздно придётся согласиться с общим мнением…

Иван Донских

14 февраля 2019, 11:20
Ответить

Читайте на SMART-LAB:

Число инвесторов RENI достигло 100 тысяч человек

Получили свежий отчет Московской Биржи. Количество наших инвесторов выросло на 4 тыс. до 100 тыс. человек, +62% с начала года. Средний размер...

Ренессанс страхование

16:13

Последнее заседание в 2025 году. Как поступит Банк России 19 декабря?

19 декабря состоится финальное в этом году заседание Банка России по вопросу ключевой ставки. В предыдущий раз в октябре ЦБ снизил размер...

Финам Брокер

13:34

📝 Еженедельный дайджест от ГК «А101» с комментариями экспертов

Рост ставок по депозитам, инвестиции в недвижимость и меморандум РФ и Саудовской Аравии 📊 Новости в мире финансов и...

A101

13:07

Ленты

Форумы

Участники

Котировки

Акции

Календарь

Информация

Книги

Исследование индекса оптимизма Smart Lab. Часть 2

полезные записи за 24 часа

Лучшие записи за 24 часа

самые обсуждаемые сегодня

теги блога vlad1024

Авторизация

Ленты

Форумы

Участники

Котировки

Акции

Календарь

Информация

Книги

Исследование индекса оптимизма Smart Lab. Часть 2

полезные записи за 24 часа

Лучшие записи за 24 часа

самые обсуждаемые сегодня

теги блога vlad1024