<HELP> for explanation

Блог им. InnaAst

Послевкусие от встречи Smart-Lab + ЭкОнОмЕтРиКа без формул

 
Smart-Lab 16.03.13: Адреналин от выступления, новая информация, знакомство с интересными людьми – получены!..=) Печаль, что была необходимость уехать раньше.
Хочется сказать спасибо Тимофею за поддержку и организацию, выступающим за доклады, аудитории за вопросы!..


Тяжело было осветить за полчаса поднятую мной тему. Для тех, кому интересно, периодически буду выкладывать информацию, относящуюся к эконометрическому моделированию.
 
…начну с простого:
 
В самом общем смысле временной ряд – это последовательность количественных характеристик какого-либо процесса, измеренных через одинаковые промежутки времени. Временными рядами в трейдинге являются, к примеру, цены закрытия часа либо дня,  годовые доходности актива (тиковые данные не являются временным рядом). Принципиально важными свойствами временных рядов является строгая упорядоченность и стационарность.
 
    1. Упорядоченность – информацию несут не только сами значения количественного показателя, но и их расположение относительно друг друга.
    2. Стационарность – среднее значение и стандартное отклонения количественного показателя постоянны во времени. Если ряд нестационарен, большинство эконометрических моделей к нему не применимы. Цена практически любого актива нестационарна, прирост цены и доходность – стационарные ряды.
Существуют 5 основных классов моделей временных рядов, разделяемых в зависимости от факторов, влияющих на цену (доходность), а также от размерности. ARIMA, ~ARCH, ARFIMA  и трендовые модели – примеры одномерных моделей, они подразумеваю использование только одного показателя. VAR, SVAR и VEC-модели, это модели, использующие несколько коррелированных временных рядов.
Простейшей моделью временных рядов является модель класса ARIMA. Данный класс моделей анализирует зависимость показателя от своих предыдущих значений и предыдущих ошибок прогнозирования. Для биржевых данных это означает, что текущая цена зависит от предыдущих цен и от того, насколько предыдущие цены были недооценены либо переоценены. Модель строится только для стационарных рядов, что позволяет на ее основе построить прогноз прироста цены. К преимуществам данной модели относится простая процедура оценки.
Модели класса GARCH – это объединение двух уравнений: доходности или цены, зависящей от своих предыдущих значений и предыдущих ошибок, и стандартного отклонения цены, которое тоже зависит от своих предыдущих значений и своих предыдущих ошибок. Переменное стандартное отклонения позволяет, во-первых, применять данную модель к нестационарным временным рядам, во-вторых, учитывает так называемые «кластеры волатильности». Если рассмотреть график доходности или прироста цены, можно заметить периоды колебаний малой амплитуды и периоды резких колебаний – GARCH модели позволяют учесть эту особенность.
ARFIMA модели являются расширением ARIMA моделей, в них количество периодов времени в прошлом, влияющих на цену в настоящем, может быть не постоянным, как в ARIMA –моделях, а переменным.
Трендовые модели являются самыми простыми с точки зрения предпосылок о структуре ряда, однако самыми сложными с точки зрения процедуры оценивания. В трендовых моделях предполагается, что вся информация о цене содержится в самой цене, и задача заключается в том, чтобы выяснить, какая функция описывает зависимость цены от времени. Время в данном случае является единственным явным показателем в модели. При достаточно высокой точности полученных прогнозов успешность применения данного метода сильно зависит от того, насколько точно выбран класс функция для анализа. Точность существенно возрастает, если процедуру выбора функции поручить программе-роботу.
В многомерных моделях временных рядов кроме непосредственно ряда, для которого строится прогноз, используются также ряды, оказывающие влияние на основной ряд. К примеру, в случае с ценой финансового актива это могут быть цены других активов и макроэкономические показатели. В VAR-модели рассматривается влияние только прошлых значений различных показателей на цену, в SVAR – модели возможен учет одновременной реакции нескольких показателей на сторонний шок (а также влияние предыдущих значений). Обе модели не применимы к нестационарным рядам. VEC модель разработана специально для анализа нестационарных временных рядов.
 
P.S.: уже выкладывала пример работы с VaR .
 

Инна, привет! А как же ты строила модель по РТС, это же нестационарный ряд?
avatar

Марина

Max K0zl0v, эконометрический инструментарий позволяет из нестационарного ряда сделать стационарный, после чего ряд готов к анализу. Помимо этого, есть модели, которые способны работать с нестационарными рядами.
InvestInna, после таких манипуляций с рядами они однозначно проходят тест на стационарность? Еще вопрос: какой софт лучше? Я вот уже разбираюсь с EViews, ее достаточно?
Max K0zl0v, на моей практике — да!.. Есть процедуры, которые проводятся по несколько раз для приведения нестационарного ряда к стационарному.
По поводу софта: я пользуюсь несколькими -> Gretl, EViews, R и Stata (начиная с 8 версии).
С R у меня особые отношения, потому что там свой язык программирования, но посредством этого больше возможностей. =) Если что, могу поскидывать материалы.
InvestInna, а почему несколькими? Одной программы не достаточно?

Да поскидывай плизззззззз!) А лучше напиши отдельный топик про эконометрический анализ!) Я тебя защищу от критикунов всяких!))))

И подскажи просто книжки по статистике и эконометрическому моделированию, только такие чтоб с нуля было понятно, а то я так давно это все в институте изучал, некоторые базовые вещи совсем не помню!

Спасибочкиииии!
Max K0zl0v, на первых порах достаточно, потом уже нет. Одна программа компенсирует другую в недостатках и дополняет некоторыми возможностями.
Топик обязательно напишу :) А про защиту ловлю на слове! :))
Куда лучше материал тебе отправить?

Если начинать с нуля, то так:
1) «Теория статистики», Громыко Г. — статистическая база;
2) «Теория вероятностей и математическая статистика» (блок математическая статистика), Л.Н.Фадеева, А.В.Лебедев — статистическая база;
3) «Введение в эконометрику», К. Доугерти;
4) «Эконометрика», Я.Р.Магнус, П.К.Катышев, А.А.Пересецкий;
5) Исследовательские статьи (как правило, на английском языке, если что, могу отправить).
InvestInna, давай на почту maxim.kozlov@mail.ru
Стать пока не надо, у меня там и так уже куча всего неразобранного!)

А еще нет ссылочки на EViews? А то нашел одну, а там стока манипуляций надо делать с программой, что у меня не фига не получилось, отказалась запускаться!

Спасибо!)
Макс K0zl0V, ссылочка: rutracker.org/forum/viewtopic.php?t=3458809
InvestInna, а не пробовали эмулировать метод FAVAR, который Б. Бернанке в свое время пропагандировал, мне кажется, он до сих пор его использует?)
InvestInna, +++
1) торгуете ли Вы опционы?
2) почему Var неприменим к нестационарным рядам?
bozon, пока не торгую опционами, но есть ряд лиц, которые активно меня вовлекают в это дело))) Обязательно займусь в скором времени :)
InvestInna, чисто эмпирически Вы правы!
Инна, по идее финансовый ряд не стационарен, но у вас локальная подгонка, так что может не всё так страшно.
HideYourRichess, нелинейный МНК, который я использовала, позволяет не приводить нестационарный ряд к стационарному.
InvestInna, :) у меня всегда в этом случае вопрос возникает, который Ширяев задал трейдерам — а что это у вас за процесс на экране?

удачи.
HideYourRichess, :) Спасибо!..
InvestInna, ну скииинь материалушечку!) Скинь-скинь-ски-ски-скинь!)))
Макс K0zl0V, скину, как дома буду, обязательно-обязательно!))
+4 Автору:
Ваше выступление было одним из лучших (можно даже сказать лучшим), хотя последние 3 я не видел пока, тоже пришлось уехать раньше. Весьма содержательно.
avatar

Borrris

Borrris, Вы не представляете, как много значат для человека, который в последний момент перед выступлением думал убежать из зала, отказаться от выступления, а после оного, впал в уныние думая, что с треском провалил свой доклад — как много значат Ваши слова!!! :)
Огромное спасибо за них, они буквально дают кислород =)
Мне, в свою очередь, хочется поддержать Вас хотя бы тем, что многим обычно кажется после своего выступления, что оно прошло отвратительно. Но на самом деле редко, когда это совпадает с действительностью.
К сожалению, я ушла раньше Вашего выхода, пока не могу прокомментировать :)
Правда, самокритичность дает стимулы идти вперед, главное — не переборщить! =)
InvestInna,+++
— отличное выступление!
— попробуйте в следующий раз своими вычислениями всех нагрузить. У меня большие сомнения, что хоть кто-то что-то смог бы возразить!
bozon, спасибо Вам, очень подбадривает! :)
В следующий раз будут уже результаты!.. Надеюсь))
Инна не сам индекс моделирует, а часовые приращения индекса. Часовые приращения более менее стационарны. Проблема в том, что устойчивые корреляции там найти очень и очень непросто.
Инна, Вы молодец, что занялись такой «неблагодарной» задачей :)

Но у меня к Вам несколько вопросов, которые я не понял из видео.

1. Какой исходный ряд для модели — сами цены, приращения цен или приращения логарифмов цен?
2. Сколько степеней свободы у подбираемых функций (трендов) и какой размер обучающей выборки?
3. Проверялась стационарность ошибки прогноза на обучающей выборке и out of sample?
4. Если в модели присутствует «Шок», то почему используется метод наименьших квадратов, а не робастыные ранговые или знаковые оценки?
avatar

А. Г.

А. Г.,
Благодарю Вас за поддержку!.. С интересом смотрю и слушаю Ваши доклады и выступления =)

Ответы на вопросы получились следующие:
1. Исходный ряд — цены закрытия, но модель можно использовать для прогноза изменений любого показателя, который демонстрирует какие-то закономерности, например, были пробы использовать: (O+H+C+L)/4 и MA(3);
2. У подбираемых функций 151 степень свободы (тренд описывался экспоненциальной функцией, колебания рядами Фурье), число наблюдений, было равно 197;
3. Да, проверялась: было показано, что ошибка представляет собой «белый шум»;
4. Спасибо за подсказку с робастостью, надо будет разобраться =) На сколько я знаю, знаковые оценки не приспособлены для решения нелинейных задач.
InvestInna,

Уточните про п. 3. Я имел ввиду, что выборка делится на две части. На одной подбирается функция, на другой просто прогоняется и сравниваются распределения остатков модели на равенство распределений. Это исследование проводилось?
А. Г., Нет, не проводилось. Я подгоняла параметры и оценивала остатки по одной и той же выборке.
InvestInna,

Вот это желательно делать, чтобы избежать подгонки.
А. Г., подозреваю, что мы вкладываем разный смысл в термин «подгонка». Решение задачи нелинейного МНК в программе Stata осуществляется методом подгонки: программа просто подбирает наилучшее приближенное решение. С другой стороны, мы можем оценивать параметры на одной выборке, а тестировать свойства модели на другой.
InvestInna,

Ну я это имел ввиду, что без теста на другой выборке мы можем случайно подогнать параметры под результат. И в будущем наша модель работать не будет.
А. Г., поняла =) С этим нельзя не согласиться!
А. Г., но на другой выборке может лучше работать другая функция.
InvestInna,

Но ведь тогда непонятно, как применять метод в неизвестном будущем. Если у нас в будущем будет работать другая функция, а та, которую мы подобрали на прошлом, работать не будет, то это же неприменимо для реальной торговли.
А. Г., пока тенденция сохраняется и не подает явные сигналы о своем изменении — можно применять функцию, предполагается такое применение.
Инна, скжите, а есть ли такие мдели, которые анализируют несколько рядов. например в нашем случае нет особого смысла, на мой «недомыленный» взгляд ;-), анализировать скажем приращения индекса fRTS. а вот проанализировать их его во связи с нефтью, долларом, и парой фишек — было бы ну очень интересно! Есть ли софт для такого анализа.
Виталий, я отвечу, да есть, тот же самый, что Инна и использовала!)

Сам недавно увлекся это интересно!)
Присоединяюсь к А.Г. Хорошее выступление Инны — мне понравилось. Подход спорен, но если соблюдать методологию и двигать шаг за шагом такой путь может быть интересен и наверное эффективен. Попытка раскрыть вопрос методологии и подхода был, по сути, провален но вины Инны в этом нет. Шовинизм процветает и это бесит, все родились гениями и со знанием рынка. Увы смарт не был бы смартом — под видом компетенции задавали совершенно дурацкие вопросы с целью потролить (Инне пришлось объяснять элементарные вещи вместо того чтобы раскрыть модель по существу)
Андреев Андрей, благодарю Вас, спасибо за понимание!.. =)
«Цена практически любого актива нестационарна, прирост цены и доходность – стационарные ряды.»

спорное утверждение :)
Зотова (Яроцкая) Майя, это так… в общем!)
Зотова (Яроцкая) Майя, да, соглашусь, прирост цены и доходность могут быть как стационарными, так и нестационарными — добавлю это сейчас :)
Я конечно придираюсь, но тиковые цены не являются временным рядом. Скорее они являются некими «сдельными рядам»)))
А по сему вопрос, если эти модели делают прогноз на основе временных рядов на некое кол-во периодов в будущее, то по идее, анализируя «сдельные ряды», прогноз должен идти на некое кол-во сделок. Однако у сделки гораздо больше показателей которые надо прогнозировать.
1) Возможно ли вообще приложение эконометрики к тиковым рядам? На ваш взгляд.
2) Если да, то как осуществлять это прогнозирование в связи с большой зависимостью от стакана и большой волатильностью в размерах заявок? Фильтры или другие способы?
3) Может быть стоит использовать агрегированные по объёмам тики? Т.е. 1 свечка — это все тики, набравшие кумулятивно определённый объём.
Надеюсь понятно выразил свои мысли))
avatar

migs911

migs911, в эконометрическом моделировании можно все что угодно считать и прогнозировать, все зависит от вашего подхода, вообще это спорная наука со стороны экономистов!

А чтобы тики моделировать, да и еще в реальном времени, нужен мощный компьютер!)
Макс K0zl0V, спорная, да!.. =)
migs911, спасибо, я в посте уточнила! Конечно же, тиковые данные не являются временным рядом, потому что между ними нет одинаковых промежутков времени.
Эконометрический анализ к тиковым данным не применим.
Инна, увлекался прогнозированием котировок анализируя их как временные ряды в 94-95 годах. Соотв софт, позволяющий применить большинство имеющихся на тот момент моделей, был доступен и тогда. По прошествии, без малого, 20-лет никаких новых, прорывных теорий я не знаю. Вообще, с теоретической точки зрения, учебник Колмогорова из 80-х с запасом покрывает все потребности.

Практический вывод: если удается предсказать временной ряд, из этого следует, что присутствует некая закономерность, которую можно понятно объяснить не прибегая, так сказать.
avatar

Shredder

Глупости это все :)))
avatar

KotBegemot

Brain Slug, случайность, хаотичность — эти понятия имеют четкое определение. Было бы все совсем просто, если бы рынки были просто хаотичными.
Brain Slug, свечки графика цены — не информация? Или Вы имеете ввиду информацию из вне?
Brain Slug, +++
— «Коллектив воздействует на индивида, перенормируя вероятности его поведения, устремляя к нулю вероятности одних действий и резко повышая вероятности других. При этом со стороны коллектива не требуется, как правило, силовых воздействий — индивид просто не может вести себя иначе.» — сильное утверждение, трудно поспорить!
— есть еще такой момент как воспитание коллективом — индивид (скорее всего лидер в коллективе) через коллектив воздействует на другого индивида, который "… просто не может вести себя иначе". Т.е. не только и не всегда макроструктура определяет микроструктуру.
Если напишете доступно про ARFIMA, буду весьма признателен. Помнится когда-то читал, но с наскоку вникунуть не удалось
avatar

q-trader

q-trader, договорились, попробую, в течение двух недель, найду, когда времени побольше будет!
InvestInna, Спасибо. Вообще продолжайте тему — думаю будет заинтересованная аудитория
q-trader, да, тема интересная, будем стараться развивать!..
q-trader, нашла статью про ARFIMA приличную: algoritmus.ru/?p=2889, возможно, поможет. А пост обязательно сделаю!..
Присоединяюсь к просьбе про ARFIMA и семейство AR- вообще. Формулы понятны, суть нет.
Вообще, у меня от них такое ощущение, что это банальные вещи, давно известные из других областей, но изложенные каким-то дико извращенным методом ))))
В ответ могу тоже объяснить что-нибудь из анализа временных рядов, ЦОС, и т.п., вдруг и у вас есть заковыристые вопросы )))
avatar

barabas

barabas, сделаю, найдем общие точки соприкосновения!.. :)
barabas, нашла статью про ARFIMA приличную: algoritmus.ru/?p=2889, возможно, поможет. А пост обязательно сделаю!..
InvestInna,
спасибо, прочитал. Правда, ясности это не добавило :)
Вот простой пример: я могу сделать линейную аппроксимацию и экстраполировать ее вперед, это будет линейная модель тренда (не котировок!). И она даже будет хорошо работать, пока тренд не начнет разворачиваться. Могу сделать параболическую, и даже аппроксимацию синусом, во всех случаях понятно, что является моделью и каким образом строится прогноз.
А вот какая сущность является моделью в ARx, совершенно непонятно.
В статье есть одна фраза, которая вроде бы отвечает на этот вопрос: «цены в ней образуются регрессией на себя». Но это только вызывает еще больше вопросов — из формул регрессия в явном виде не прослеживается, и вообще непонятно, что является парами значений.
InvestInna,
вот для авторегрессии более-менее доходчиво изложено:
fnow.ru/ru/stati/obzor-algoritmov/avtoregressija
но тогда получается, модель АР — это обычный цифровой фильтр, да еще и с постоянными параметрами (упрощенно говоря, экспоненциальное сглаживание).
Непонятно, какая может быть польза от такой «модели» и как по ней можно что-то прогнозировать.
Отдельный вопрос, это пример данных, на которых они там строят прогноз. Это же практически шумовой сигнал, и надеяться, что очередной отсчет будет линейной комбинацией предыдущих, по-моему, наивно. Та точность прогнозирования, которую они там пытаются получить, на мой взгляд принципиально невозможна.
Brain Slug,… выжимание информации.

Только зарегистрированные и авторизованные пользователи могут оставлять комментарии.

Залогиниться

Зарегистрироваться
....все тэги
Регистрация
UP