Блог им. ivanovr |Еще раз про корреляцию

Часто для оценки связи между значениями (например, приращениями цены) используют коэффициент корреляции. И как мне кажется, мало уделяется внимания тому моменту, что речь идет именно о линейной корреляции т.е. корреляции в узком смысле. Нулевой коэффициент линейной корреляции в общем случае не говорит об отсутствии связи между величинами.

Вот иллюстрация на python:

import numpy as np
# создаем массив чисел, равномерно распределенных от -1 до 1
x = np.random.uniform(-1, 1, 10000000)
# каждое число возводим в квадрат (можно еще вычесть 1/3, если хотим нулевое матожидание)
y = x**2
# y полностью определяется x, значит x и y коррелированы в широком смысле
# но вычисление ЛИНЕЙНОГО коэффициента корреляции дает 0 (+- с учетом случайного разброса)
print(np.corrcoef(x,y))




Блог им. ivanovr |Связь RI и Si. Продолжение.

В прошлом топике smart-lab.ru/blog/161386.php не учтены данные за прошлый год. Не заметил что отключил обновление дневок в архиве. Посыпаю голову пеплом!
И что же мы видим на новом участке? А то что закономерность нарушилась. Похоже, что это как раз то, что и имел в виду другой автор smart-lab.ru/blog/161509.php .
Итак, вот полный график с теми же коэффициентами как в прошлый раз.

Связь RI и Si. Продолжение. 

За прошлый год видим явное нарушение модели. Для тех кто считает, что нарушение исчезнет, если прошлый год включить в область оптимизации, привожу результат этой самой оптимизации:

( Читать дальше )

Блог им. ivanovr |Загадочная связь RI и Si

Наткнулся на любопытную связь между RI и Si. Связь показана на графике, там же в заголовке формула:
Зеленая линия — RI, красная — оценка RI по формуле RI` = 548882 — 12.81 * Si. RI и Si в пунктах.
Коэффициенты найдены путем подгонки методом МНК после 01.06.2010 по НВ (эта дата не имеет принципиального значения).
Налицо сильная связь. Причем логично было бы ожидать связь типа RI*Si = const, но из такого предположения ничего подобного не получается. А в итоге скорее имеем обратное отношение.

Причем видно, что до кризиса 2008 корреляция слабая. Si не следует за RI, а после — сильная корреляция. 
Пока не понял отчего такая связь. Может кто-то подскажет?
Также могу попробовать подогнать коэффициенты для другой модели, если кто предложит.

Загадочная связь RI и Si


ЗЫ: Главный вывод в том, что если учитывать очевидный вклад Si к котировки RI, то коэффициент в модели должен быть RI/Si т.е. в последние годы примерно 4-7, а не 10-14, как имеем. Так что очевидный вклад объясняет меньше половины зависимости.

....все тэги
UPDONW
Новый дизайн