Блог им. pavlikC1

Корреляция - кто сечет?

Народ, уверен на этом ресурсе есть понимающие в расчетах корреляции.
Преамбула. Хочу посчитать корреляции разных сортов мазута и сравнить с брентом.
Для этого беру с BBG данные, с помощью функции ВПР (Vlookup) подгоняю дни сделок.
Получаются замечательные корреляции:
Корреляция - кто сечет?

Отправляю расчеты банкиру, несущие документы на кред комитет для одобрения лимита на нас, а он мне в ответ:
"Корреляция была рассчитана не совсем корректно.
Данный показатель рассчитывается на основе сравнения динамики изменений рассматриваемых показателей"

Я ей (!!!) объясняю: формула корреляции представляет собой уже привязанный к динамике изменений расчет:
{\displaystyle \mathbf {r} _{XY}={\frac {\mathbf {cov} _{XY}}{\mathbf {\sigma } _{X}{\sigma }_{Y}}}={\frac {\sum (X-{\bar {X}})(Y-{\bar {Y}})}{{\sqrt {\sum (X-{\bar {X}})^{2}}}{\sqrt {\sum (Y-{\bar {Y}})^{2}}}}}.}
, но мне талдычат, что в функции Excel она прописана иначе, и сначала нужно посчитать приращения, а уже потом — корреляцию.
По факту, как мне кажется, они считают корреляцию на корреляцию (по сути), в итоге, естественно, получаются такие значения:

Рассудите пожалуйста, вопрос крайне важный для нас, так как собираемся хеджировать топливные риски одного из дивизионов, а в банках сами знаете как под неправильные расчеты выбиваются лимиты.

Спасибо
Ра
M100vsICE Brent 14%
IFOvsICE Brent 61%
M100 adj vsICE Brent 14%
88% 84%
19 комментариев
Так посчитана корреляция как была? По какой формуле?
avatar
Bleeding Edge, просто по двум массивам данных
avatar
уважаемый, Pavel, вы привели формулу коэффициента корреляции Пирсона.  Уточните у банка, по какой формуле они считают корреляцию: Кендалла, спирмена и тд. В Excel'е все они есть.
avatar
Для тугодумов. КОРРЕЛЯЦИЮ СЧИТАЮТ ТОЛЬКО ПО ПРИРАЩЕНИЯМ, считать корреляцию по нестационарным временным рядам ХУЕВО.
avatar
Aero, как насчет логарифмов отношений?
avatar
Правильно написали, формулу в студию) а то получается… Здорово, кума. —  На рынке была.- Никак ты глуха? — Купила петуха. — Прощай кума — Пять алтын дала.
avatar
Да, Aero, прав и банк тоже. У вас нестационарные ряды, а вы считали корреляцию по формуле для стационарного ряда. 
avatar
Бульдозер, еще раз для «тугодумов» пожалуйста. Обычный массив данных называется нестационарным, верно?
avatar
Pavel Inkov, Что бы проверить ряд на стационарность надо провести тест ADF)
avatar
Aero, можете по-русски ответить? )) у меня есть два ряда данных, почему я не могу посчитать корреляцию между ними? интересует зависимость цен, а не их динамики в каждый момент времени; ну то есть мне нужно глобально знать, будет мазут расти при стоимости нефти или нет
avatar
Pavel Inkov, потому что у вас данные меняются со временем, получается нестационарный ряд. если бы данные были неизменны всегда, то можете сразу использовать формулу Пирсона, которую привели
avatar
Бульдозер, в смысле «данные неизменны всегда»? какую корреляцию и для чего тогда считать?
avatar
Pavel Inkov, это уж не знаю для чего). хорошо,  пусть меняются, но как то равномерно, типа белого шума). Главное, чтобы средняя с дисперсией не менялись
avatar
Pavel Inkov, вас интересует именно зависимость динамики. Если динамика одинаковая, тогда и цены изменяются одинаково.
avatar
Bleeding Edge, в том и дело, что коэффы корреляции меняются существенно в зависимости от методов расчета
avatar
Pavel Inkov, они и должны существенно отличаться. насколько я понимаю.  Это из за числителя формулы. Если у вас знаки в числители буду совпадать в обоих множителях, то в результате перемножения получим плюс, т.е.  якобы корреляция будет расти ( графически это когда две величины изменяются в одном направлении).   Но на самом деле это совсем необязательно, корреляции может не быть вообще. Когда вы считает дельту сначала, то у вас получается что то типа звуковой волны на экране монитора, соответственно при перемножении получится больше членов с разными знаками и коэфф корреляции получится меньше. Вот он, по идее и должен показывать реальное положение вещей.
avatar
Бульдозер, нарисовал. Понятнее стало. Спасибо
avatar
Pavel Inkov, я сам тугодум)) посмотрите в инете.  у нестационарного ряда среднее и дисперсия зависят от времени, т.е непостоянны. Если вы сначала находите приращения, то избавляетесь от временной зависимости, у вас получается уже стационарный временной ряд и  для него   производите расчеты.  Формула, которую вы привели —  именно для стационарных рядов. Получается в банке правы. Но  все это было 30 лет назад, так что могу и ошибиться). 
avatar
Бульдозер, спасибо
avatar

теги блога Pavel Inkov

....все тэги



UPDONW
Новый дизайн