Блог им. KonstantinLebedev

Русал пришел к своей квадратичной функции регрессия c r^2 0,87

По оси X — Фьючерс на алюминий на Шанхайской бирже с 2019-го года
По оси Y — Дневные цены закрытия котировок акций Русал, так же с 2019-го года
Большая красная точка — это сегодняшний день, на момент поста.
Красная линия — квадратичная функция регресси
Синяя пунктирная линия — линенйная функция регресси
   
Русал пришел к своей квадратичной функции регрессия c r^2 0,87

Почему это важно, смотри предыдущий пост перед началом движения, было указано куда идем и почему идем, вот и пришли. Но разброс большой можем идти выше к 70-и рублям при той же цена алюминия.

Как всегда предоставляю исходные данные от расчета пользуйтесь jupyter notebook файл
★2
20 комментариев
Это что значит?:)
Тимофей Мартынов, У вас в институте мат. анализ/мат. ожидание было ?
Я не смогу пересказать в комменте весь курс, извините.
Тимофей Мартынов, Добавил немного контекста 
Тимофей Мартынов, 
Это что значит?
так Они-с же говорят…
можем идти выше к 70-и рублям
т.е. Они-с прогнозируют, что стражайше запретил А.Г.....
avatar

wistopus, коты соблюдают запреты А.Г. !

avatar
Тимофей Мартынов, Нашел отличную статью по стат.анализу и прогнозирования с анимацией рекомендую для прочтения
Как я понимаю тут ищется закономерность цены акции русала от фьючерса на люминий. но почему именно квадратичная и не линейная регрессия?
avatar
sl_walker, Ну вспомните немного математику из школы, что такое линейная функция — которая растет линейно и есть квадратичная функция которая может рости x^2 и есть экспоненциальная функция и так далее.
Оно отражает скорость роста Y(цена акция) относительно X(базовый ресурс или спред между сырьем и продукцией) с поправочным коэффициентом.

Для построения корректной линейной зависимости необходимо проверять соблюдение условий Гаусса-Маркова. Тут они очевидно нарушаются, как и для большинства временных рядов DS типа — остатки явно имеют высокую корреляцию. Как следствие с большой долей вероятности это классическая ложная зависимость. Для анализа временных рядов лучше использовать предназначенные для этого методы, а не строить линейные зависимости.
avatar

Михаил, Для этого я предоставил исходный алгоритм , вы можете его перепроверить и указать предметно на ошибки и в вычисления использовал полиномиальную регрессию, а линейная больше для сравнения добавлена.



Константин Лебедев, там нет данных. Не важно какую вы регрессию считаете. По поводу ошибок:
1. Анализ временных рядов необходимо начинать с теста на стационарность, например Дики — Фуллера. У вас его нет. Если по результатам теста обнаружилось наличие единичного корня, то линейную регрессию строить нельзя. С большой долей вероятности он в ваших данных присутсвует.
2. Если единичного корня все-таки нет, то после построения регрессии нужно построить графики afc/pafc и проверить отсутсвие значимого их отклонения от нуля. Тут я на глаз уверен на 100%, что присутствует отличная от нуля автокорреляция остатков. В этом случае нужно использовать ARMAX модель для построения зависимости с учетом значимых лагов на afc/pafc. 
avatar
Михаил, Вроде выглядит норм, спасибо за интерес :)


Значение p намного меньше уровня значимости 0,05, и, следовательно, мы можем отклонить нулевую гипотезу и принять, что ряд является стационарным.
Константин Лебедев, выглядит как раз не норм, у вас p_value 99% — нулевая гипотеза в этом тесте, что в данных есть единичный корень, — поэтому строить линейную регрессию нельзя.
avatar
Константин Лебедев, картинку вы позже добавили — на ней отлично видно, что у вас просто жуткая автокореляци Durbin–Watson практически равен нулю, хотя должен быть равен 2.
avatar
Михаил,  Для акций это нормально, так как там все трендами торгуют, а это и есть автокоррекция.
www.investopedia.com/terms/d/durbin-watson-statistic.asp
Если она, есть значит на регрессии можно зарабатывать :)
Константин Лебедев, одно из условий Гаусса-Маркова — отсутсвие автокорреляции. Ели автокорреляция есть, то строить в лоб линейную регрессию нельзя, нужно пользоваться другими методами.  
avatar
Для истории по данным с 2015 года так и нужен второй фактор цены на бокситы





Мужики, ну вы загнули)))
avatar
И кто из них двоих «правильный» математик? Голосую за Михаила!

avatar

теги блога Константин Лебедев

....все тэги



UPDONW
Новый дизайн