Pavel Inkov
Pavel Inkov личный блог
21 ноября 2016, 12:03

Корреляция - кто сечет?

Народ, уверен на этом ресурсе есть понимающие в расчетах корреляции.
Преамбула. Хочу посчитать корреляции разных сортов мазута и сравнить с брентом.
Для этого беру с BBG данные, с помощью функции ВПР (Vlookup) подгоняю дни сделок.
Получаются замечательные корреляции:
Корреляция - кто сечет?

Отправляю расчеты банкиру, несущие документы на кред комитет для одобрения лимита на нас, а он мне в ответ:
"Корреляция была рассчитана не совсем корректно.
Данный показатель рассчитывается на основе сравнения динамики изменений рассматриваемых показателей"

Я ей (!!!) объясняю: формула корреляции представляет собой уже привязанный к динамике изменений расчет:
{\displaystyle \mathbf {r} _{XY}={\frac {\mathbf {cov} _{XY}}{\mathbf {\sigma } _{X}{\sigma }_{Y}}}={\frac {\sum (X-{\bar {X}})(Y-{\bar {Y}})}{{\sqrt {\sum (X-{\bar {X}})^{2}}}{\sqrt {\sum (Y-{\bar {Y}})^{2}}}}}.}
, но мне талдычат, что в функции Excel она прописана иначе, и сначала нужно посчитать приращения, а уже потом — корреляцию.
По факту, как мне кажется, они считают корреляцию на корреляцию (по сути), в итоге, естественно, получаются такие значения:

Рассудите пожалуйста, вопрос крайне важный для нас, так как собираемся хеджировать топливные риски одного из дивизионов, а в банках сами знаете как под неправильные расчеты выбиваются лимиты.

Спасибо
Ра
M100vsICE Brent 14%
IFOvsICE Brent 61%
M100 adj vsICE Brent 14%
88% 84%
19 Комментариев
  • Bleeding Edge
    21 ноября 2016, 12:15
    Так посчитана корреляция как была? По какой формуле?
  • Vincent Demidoff
    21 ноября 2016, 12:30
    уважаемый, Pavel, вы привели формулу коэффициента корреляции Пирсона.  Уточните у банка, по какой формуле они считают корреляцию: Кендалла, спирмена и тд. В Excel'е все они есть.
  • Aero
    21 ноября 2016, 12:57
    Для тугодумов. КОРРЕЛЯЦИЮ СЧИТАЮТ ТОЛЬКО ПО ПРИРАЩЕНИЯМ, считать корреляцию по нестационарным временным рядам ХУЕВО.
    • cfree0185
      21 ноября 2016, 13:35
      Aero, как насчет логарифмов отношений?
    • Бульдозер
      21 ноября 2016, 14:17
      Правильно написали, формулу в студию) а то получается… Здорово, кума. —  На рынке была.- Никак ты глуха? — Купила петуха. — Прощай кума — Пять алтын дала.
  • Бульдозер
    21 ноября 2016, 14:33
    Да, Aero, прав и банк тоже. У вас нестационарные ряды, а вы считали корреляцию по формуле для стационарного ряда. 
      • Aero
        21 ноября 2016, 15:21
        Pavel Inkov, Что бы проверить ряд на стационарность надо провести тест ADF)
          • Бульдозер
            21 ноября 2016, 16:13
            Pavel Inkov, потому что у вас данные меняются со временем, получается нестационарный ряд. если бы данные были неизменны всегда, то можете сразу использовать формулу Пирсона, которую привели
              • Бульдозер
                21 ноября 2016, 17:33
                Pavel Inkov, это уж не знаю для чего). хорошо,  пусть меняются, но как то равномерно, типа белого шума). Главное, чтобы средняя с дисперсией не менялись
          • Bleeding Edge
            21 ноября 2016, 17:13
            Pavel Inkov, вас интересует именно зависимость динамики. Если динамика одинаковая, тогда и цены изменяются одинаково.
              • Бульдозер
                21 ноября 2016, 18:13
                Pavel Inkov, они и должны существенно отличаться. насколько я понимаю.  Это из за числителя формулы. Если у вас знаки в числители буду совпадать в обоих множителях, то в результате перемножения получим плюс, т.е.  якобы корреляция будет расти ( графически это когда две величины изменяются в одном направлении).   Но на самом деле это совсем необязательно, корреляции может не быть вообще. Когда вы считает дельту сначала, то у вас получается что то типа звуковой волны на экране монитора, соответственно при перемножении получится больше членов с разными знаками и коэфф корреляции получится меньше. Вот он, по идее и должен показывать реальное положение вещей.
      • Бульдозер
        21 ноября 2016, 16:10
        Pavel Inkov, я сам тугодум)) посмотрите в инете.  у нестационарного ряда среднее и дисперсия зависят от времени, т.е непостоянны. Если вы сначала находите приращения, то избавляетесь от временной зависимости, у вас получается уже стационарный временной ряд и  для него   производите расчеты.  Формула, которую вы привели —  именно для стационарных рядов. Получается в банке правы. Но  все это было 30 лет назад, так что могу и ошибиться). 

Активные форумы
Что сейчас обсуждают

Старый дизайн
Старый
дизайн