Блог им. InnaAst

Послевкусие от встречи Smart-Lab + ЭкОнОмЕтРиКа без формул

 
Smart-Lab 16.03.13: Адреналин от выступления, новая информация, знакомство с интересными людьми – получены!..=) Печаль, что была необходимость уехать раньше.
Хочется сказать спасибо Тимофею за поддержку и организацию, выступающим за доклады, аудитории за вопросы!..


Тяжело было осветить за полчаса поднятую мной тему. Для тех, кому интересно, периодически буду выкладывать информацию, относящуюся к эконометрическому моделированию.
 
…начну с простого:
 
В самом общем смысле временной ряд – это последовательность количественных характеристик какого-либо процесса, измеренных через одинаковые промежутки времени. Временными рядами в трейдинге являются, к примеру, цены закрытия часа либо дня,  годовые доходности актива (тиковые данные не являются временным рядом). Принципиально важными свойствами временных рядов является строгая упорядоченность и стационарность.
 
    1. Упорядоченность – информацию несут не только сами значения количественного показателя, но и их расположение относительно друг друга.
    2. Стационарность – среднее значение и стандартное отклонения количественного показателя постоянны во времени. Если ряд нестационарен, большинство эконометрических моделей к нему не применимы. Цена практически любого актива нестационарна, прирост цены и доходность – стационарные ряды.
Существуют 5 основных классов моделей временных рядов, разделяемых в зависимости от факторов, влияющих на цену (доходность), а также от размерности. ARIMA, ~ARCH, ARFIMA  и трендовые модели – примеры одномерных моделей, они подразумеваю использование только одного показателя. VAR, SVAR и VEC-модели, это модели, использующие несколько коррелированных временных рядов.
Простейшей моделью временных рядов является модель класса ARIMA. Данный класс моделей анализирует зависимость показателя от своих предыдущих значений и предыдущих ошибок прогнозирования. Для биржевых данных это означает, что текущая цена зависит от предыдущих цен и от того, насколько предыдущие цены были недооценены либо переоценены. Модель строится только для стационарных рядов, что позволяет на ее основе построить прогноз прироста цены. К преимуществам данной модели относится простая процедура оценки.
Модели класса GARCH – это объединение двух уравнений: доходности или цены, зависящей от своих предыдущих значений и предыдущих ошибок, и стандартного отклонения цены, которое тоже зависит от своих предыдущих значений и своих предыдущих ошибок. Переменное стандартное отклонения позволяет, во-первых, применять данную модель к нестационарным временным рядам, во-вторых, учитывает так называемые «кластеры волатильности». Если рассмотреть график доходности или прироста цены, можно заметить периоды колебаний малой амплитуды и периоды резких колебаний – GARCH модели позволяют учесть эту особенность.
ARFIMA модели являются расширением ARIMA моделей, в них количество периодов времени в прошлом, влияющих на цену в настоящем, может быть не постоянным, как в ARIMA –моделях, а переменным.
Трендовые модели являются самыми простыми с точки зрения предпосылок о структуре ряда, однако самыми сложными с точки зрения процедуры оценивания. В трендовых моделях предполагается, что вся информация о цене содержится в самой цене, и задача заключается в том, чтобы выяснить, какая функция описывает зависимость цены от времени. Время в данном случае является единственным явным показателем в модели. При достаточно высокой точности полученных прогнозов успешность применения данного метода сильно зависит от того, насколько точно выбран класс функция для анализа. Точность существенно возрастает, если процедуру выбора функции поручить программе-роботу.
В многомерных моделях временных рядов кроме непосредственно ряда, для которого строится прогноз, используются также ряды, оказывающие влияние на основной ряд. К примеру, в случае с ценой финансового актива это могут быть цены других активов и макроэкономические показатели. В VAR-модели рассматривается влияние только прошлых значений различных показателей на цену, в SVAR – модели возможен учет одновременной реакции нескольких показателей на сторонний шок (а также влияние предыдущих значений). Обе модели не применимы к нестационарным рядам. VEC модель разработана специально для анализа нестационарных временных рядов.
 
P.S.: уже выкладывала пример работы с VaR .
277 | ★19
68 комментариев
Инна, привет! А как же ты строила модель по РТС, это же нестационарный ряд?
avatar
Max K0zl0v, эконометрический инструментарий позволяет из нестационарного ряда сделать стационарный, после чего ряд готов к анализу. Помимо этого, есть модели, которые способны работать с нестационарными рядами.
avatar
InvestInna, после таких манипуляций с рядами они однозначно проходят тест на стационарность? Еще вопрос: какой софт лучше? Я вот уже разбираюсь с EViews, ее достаточно?
avatar
Max K0zl0v, на моей практике — да!.. Есть процедуры, которые проводятся по несколько раз для приведения нестационарного ряда к стационарному.
По поводу софта: я пользуюсь несколькими -> Gretl, EViews, R и Stata (начиная с 8 версии).
С R у меня особые отношения, потому что там свой язык программирования, но посредством этого больше возможностей. =) Если что, могу поскидывать материалы.
avatar
InvestInna, а почему несколькими? Одной программы не достаточно?

Да поскидывай плизззззззз!) А лучше напиши отдельный топик про эконометрический анализ!) Я тебя защищу от критикунов всяких!))))

И подскажи просто книжки по статистике и эконометрическому моделированию, только такие чтоб с нуля было понятно, а то я так давно это все в институте изучал, некоторые базовые вещи совсем не помню!

Спасибочкиииии!
avatar
Max K0zl0v, на первых порах достаточно, потом уже нет. Одна программа компенсирует другую в недостатках и дополняет некоторыми возможностями.
Топик обязательно напишу :) А про защиту ловлю на слове! :))
Куда лучше материал тебе отправить?

Если начинать с нуля, то так:
1) «Теория статистики», Громыко Г. — статистическая база;
2) «Теория вероятностей и математическая статистика» (блок математическая статистика), Л.Н.Фадеева, А.В.Лебедев — статистическая база;
3) «Введение в эконометрику», К. Доугерти;
4) «Эконометрика», Я.Р.Магнус, П.К.Катышев, А.А.Пересецкий;
5) Исследовательские статьи (как правило, на английском языке, если что, могу отправить).
avatar
InvestInna, давай на почту maxim.kozlov@mail.ru
Стать пока не надо, у меня там и так уже куча всего неразобранного!)

А еще нет ссылочки на EViews? А то нашел одну, а там стока манипуляций надо делать с программой, что у меня не фига не получилось, отказалась запускаться!

Спасибо!)
avatar
Макс K0zl0V, ссылочка: rutracker.org/forum/viewtopic.php?t=3458809
avatar
InvestInna, а не пробовали эмулировать метод FAVAR, который Б. Бернанке в свое время пропагандировал, мне кажется, он до сих пор его использует?)
avatar
InvestInna, +++
1) торгуете ли Вы опционы?
2) почему Var неприменим к нестационарным рядам?
bozon, пока не торгую опционами, но есть ряд лиц, которые активно меня вовлекают в это дело))) Обязательно займусь в скором времени :)
avatar
InvestInna, чисто эмпирически Вы правы!
Инна, по идее финансовый ряд не стационарен, но у вас локальная подгонка, так что может не всё так страшно.
avatar
HideYourRichess, нелинейный МНК, который я использовала, позволяет не приводить нестационарный ряд к стационарному.
avatar
InvestInna, :) у меня всегда в этом случае вопрос возникает, который Ширяев задал трейдерам — а что это у вас за процесс на экране?

удачи.
avatar
HideYourRichess, :) Спасибо!..
avatar
InvestInna, ну скииинь материалушечку!) Скинь-скинь-ски-ски-скинь!)))
avatar
Макс K0zl0V, скину, как дома буду, обязательно-обязательно!))
avatar
+4 Автору:
Ваше выступление было одним из лучших (можно даже сказать лучшим), хотя последние 3 я не видел пока, тоже пришлось уехать раньше. Весьма содержательно.
avatar
Borrris, Вы не представляете, как много значат для человека, который в последний момент перед выступлением думал убежать из зала, отказаться от выступления, а после оного, впал в уныние думая, что с треском провалил свой доклад — как много значат Ваши слова!!! :)
Огромное спасибо за них, они буквально дают кислород =)
Мне, в свою очередь, хочется поддержать Вас хотя бы тем, что многим обычно кажется после своего выступления, что оно прошло отвратительно. Но на самом деле редко, когда это совпадает с действительностью.
К сожалению, я ушла раньше Вашего выхода, пока не могу прокомментировать :)
Правда, самокритичность дает стимулы идти вперед, главное — не переборщить! =)
avatar
InvestInna,+++
— отличное выступление!
— попробуйте в следующий раз своими вычислениями всех нагрузить. У меня большие сомнения, что хоть кто-то что-то смог бы возразить!
bozon, спасибо Вам, очень подбадривает! :)
В следующий раз будут уже результаты!.. Надеюсь))
avatar
Инна не сам индекс моделирует, а часовые приращения индекса. Часовые приращения более менее стационарны. Проблема в том, что устойчивые корреляции там найти очень и очень непросто.
avatar
Инна, Вы молодец, что занялись такой «неблагодарной» задачей :)

Но у меня к Вам несколько вопросов, которые я не понял из видео.

1. Какой исходный ряд для модели — сами цены, приращения цен или приращения логарифмов цен?
2. Сколько степеней свободы у подбираемых функций (трендов) и какой размер обучающей выборки?
3. Проверялась стационарность ошибки прогноза на обучающей выборке и out of sample?
4. Если в модели присутствует «Шок», то почему используется метод наименьших квадратов, а не робастыные ранговые или знаковые оценки?
avatar
А. Г.,
Благодарю Вас за поддержку!.. С интересом смотрю и слушаю Ваши доклады и выступления =)

Ответы на вопросы получились следующие:
1. Исходный ряд — цены закрытия, но модель можно использовать для прогноза изменений любого показателя, который демонстрирует какие-то закономерности, например, были пробы использовать: (O+H+C+L)/4 и MA(3);
2. У подбираемых функций 151 степень свободы (тренд описывался экспоненциальной функцией, колебания рядами Фурье), число наблюдений, было равно 197;
3. Да, проверялась: было показано, что ошибка представляет собой «белый шум»;
4. Спасибо за подсказку с робастостью, надо будет разобраться =) На сколько я знаю, знаковые оценки не приспособлены для решения нелинейных задач.
avatar
InvestInna,

Уточните про п. 3. Я имел ввиду, что выборка делится на две части. На одной подбирается функция, на другой просто прогоняется и сравниваются распределения остатков модели на равенство распределений. Это исследование проводилось?
avatar
А. Г., Нет, не проводилось. Я подгоняла параметры и оценивала остатки по одной и той же выборке.
avatar
InvestInna,

Вот это желательно делать, чтобы избежать подгонки.
avatar
А. Г., подозреваю, что мы вкладываем разный смысл в термин «подгонка». Решение задачи нелинейного МНК в программе Stata осуществляется методом подгонки: программа просто подбирает наилучшее приближенное решение. С другой стороны, мы можем оценивать параметры на одной выборке, а тестировать свойства модели на другой.
avatar
InvestInna,

Ну я это имел ввиду, что без теста на другой выборке мы можем случайно подогнать параметры под результат. И в будущем наша модель работать не будет.
avatar
А. Г., поняла =) С этим нельзя не согласиться!
avatar
А. Г., но на другой выборке может лучше работать другая функция.
avatar
InvestInna,

Но ведь тогда непонятно, как применять метод в неизвестном будущем. Если у нас в будущем будет работать другая функция, а та, которую мы подобрали на прошлом, работать не будет, то это же неприменимо для реальной торговли.
avatar
А. Г., пока тенденция сохраняется и не подает явные сигналы о своем изменении — можно применять функцию, предполагается такое применение.
avatar
Инна, скжите, а есть ли такие мдели, которые анализируют несколько рядов. например в нашем случае нет особого смысла, на мой «недомыленный» взгляд ;-), анализировать скажем приращения индекса fRTS. а вот проанализировать их его во связи с нефтью, долларом, и парой фишек — было бы ну очень интересно! Есть ли софт для такого анализа.
avatar
Виталий, я отвечу, да есть, тот же самый, что Инна и использовала!)

Сам недавно увлекся это интересно!)
avatar
Присоединяюсь к А.Г. Хорошее выступление Инны — мне понравилось. Подход спорен, но если соблюдать методологию и двигать шаг за шагом такой путь может быть интересен и наверное эффективен. Попытка раскрыть вопрос методологии и подхода был, по сути, провален но вины Инны в этом нет. Шовинизм процветает и это бесит, все родились гениями и со знанием рынка. Увы смарт не был бы смартом — под видом компетенции задавали совершенно дурацкие вопросы с целью потролить (Инне пришлось объяснять элементарные вещи вместо того чтобы раскрыть модель по существу)
Андреев Андрей, благодарю Вас, спасибо за понимание!.. =)
avatar
«Цена практически любого актива нестационарна, прирост цены и доходность – стационарные ряды.»

спорное утверждение :)
avatar
Зотова (Яроцкая) Майя, это так… в общем!)
avatar
Max K0zl0v, )))
avatar
Зотова (Яроцкая) Майя, да, соглашусь, прирост цены и доходность могут быть как стационарными, так и нестационарными — добавлю это сейчас :)
avatar
Я конечно придираюсь, но тиковые цены не являются временным рядом. Скорее они являются некими «сдельными рядам»)))
А по сему вопрос, если эти модели делают прогноз на основе временных рядов на некое кол-во периодов в будущее, то по идее, анализируя «сдельные ряды», прогноз должен идти на некое кол-во сделок. Однако у сделки гораздо больше показателей которые надо прогнозировать.
1) Возможно ли вообще приложение эконометрики к тиковым рядам? На ваш взгляд.
2) Если да, то как осуществлять это прогнозирование в связи с большой зависимостью от стакана и большой волатильностью в размерах заявок? Фильтры или другие способы?
3) Может быть стоит использовать агрегированные по объёмам тики? Т.е. 1 свечка — это все тики, набравшие кумулятивно определённый объём.
Надеюсь понятно выразил свои мысли))
avatar
migs911, в эконометрическом моделировании можно все что угодно считать и прогнозировать, все зависит от вашего подхода, вообще это спорная наука со стороны экономистов!

А чтобы тики моделировать, да и еще в реальном времени, нужен мощный компьютер!)
avatar
Макс K0zl0V, спорная, да!.. =)
avatar
migs911, спасибо, я в посте уточнила! Конечно же, тиковые данные не являются временным рядом, потому что между ними нет одинаковых промежутков времени.
Эконометрический анализ к тиковым данным не применим.
avatar
Инна, увлекался прогнозированием котировок анализируя их как временные ряды в 94-95 годах. Соотв софт, позволяющий применить большинство имеющихся на тот момент моделей, был доступен и тогда. По прошествии, без малого, 20-лет никаких новых, прорывных теорий я не знаю. Вообще, с теоретической точки зрения, учебник Колмогорова из 80-х с запасом покрывает все потребности.

Практический вывод: если удается предсказать временной ряд, из этого следует, что присутствует некая закономерность, которую можно понятно объяснить не прибегая, так сказать.
avatar
Глупости это все :)))
avatar
Brain Slug, случайность, хаотичность — эти понятия имеют четкое определение. Было бы все совсем просто, если бы рынки были просто хаотичными.
Brain Slug, свечки графика цены — не информация? Или Вы имеете ввиду информацию из вне?
Brain Slug, +++
— «Коллектив воздействует на индивида, перенормируя вероятности его поведения, устремляя к нулю вероятности одних действий и резко повышая вероятности других. При этом со стороны коллектива не требуется, как правило, силовых воздействий — индивид просто не может вести себя иначе.» — сильное утверждение, трудно поспорить!
— есть еще такой момент как воспитание коллективом — индивид (скорее всего лидер в коллективе) через коллектив воздействует на другого индивида, который "… просто не может вести себя иначе". Т.е. не только и не всегда макроструктура определяет микроструктуру.
Если напишете доступно про ARFIMA, буду весьма признателен. Помнится когда-то читал, но с наскоку вникунуть не удалось
avatar
q-trader, договорились, попробую, в течение двух недель, найду, когда времени побольше будет!
avatar
InvestInna, Спасибо. Вообще продолжайте тему — думаю будет заинтересованная аудитория
avatar
q-trader, да, тема интересная, будем стараться развивать!..
avatar
q-trader, нашла статью про ARFIMA приличную: algoritmus.ru/?p=2889, возможно, поможет. А пост обязательно сделаю!..
avatar
Присоединяюсь к просьбе про ARFIMA и семейство AR- вообще. Формулы понятны, суть нет.
Вообще, у меня от них такое ощущение, что это банальные вещи, давно известные из других областей, но изложенные каким-то дико извращенным методом ))))
В ответ могу тоже объяснить что-нибудь из анализа временных рядов, ЦОС, и т.п., вдруг и у вас есть заковыристые вопросы )))
avatar
barabas, сделаю, найдем общие точки соприкосновения!.. :)
avatar
barabas, нашла статью про ARFIMA приличную: algoritmus.ru/?p=2889, возможно, поможет. А пост обязательно сделаю!..
avatar
InvestInna,
спасибо, прочитал. Правда, ясности это не добавило :)
Вот простой пример: я могу сделать линейную аппроксимацию и экстраполировать ее вперед, это будет линейная модель тренда (не котировок!). И она даже будет хорошо работать, пока тренд не начнет разворачиваться. Могу сделать параболическую, и даже аппроксимацию синусом, во всех случаях понятно, что является моделью и каким образом строится прогноз.
А вот какая сущность является моделью в ARx, совершенно непонятно.
В статье есть одна фраза, которая вроде бы отвечает на этот вопрос: «цены в ней образуются регрессией на себя». Но это только вызывает еще больше вопросов — из формул регрессия в явном виде не прослеживается, и вообще непонятно, что является парами значений.
avatar
InvestInna,
вот для авторегрессии более-менее доходчиво изложено:
fnow.ru/ru/stati/obzor-algoritmov/avtoregressija
но тогда получается, модель АР — это обычный цифровой фильтр, да еще и с постоянными параметрами (упрощенно говоря, экспоненциальное сглаживание).
Непонятно, какая может быть польза от такой «модели» и как по ней можно что-то прогнозировать.
Отдельный вопрос, это пример данных, на которых они там строят прогноз. Это же практически шумовой сигнал, и надеяться, что очередной отсчет будет линейной комбинацией предыдущих, по-моему, наивно. Та точность прогнозирования, которую они там пытаются получить, на мой взгляд принципиально невозможна.
avatar
Brain Slug,… выжимание информации.

Читайте на SMART-LAB:
Фото
Вблизи тренда: три бумаги с потенциалом роста
Российский рынок акций продолжает восхождение наверх. Некоторые бумаги убежали далеко вперед, но есть и такие акции, которые находятся вблизи...
Рейтинговое агентство АКРА подтвердило ПАО «ГК «Самолет» рейтинг на уровне ESG-4(AA-)
Друзья, и снова хорошие новости: ⚡️ Агентство АКРА подтвердило нам ESG-рейтинг на уровне ESG-4(АA-) , что соответствует очень высокой оценке...
Фото
Обзор новых размещений на рынке ВДО
На фоне волны дефолтов сектор ВДО позволяет зафиксировать повышенную доходность, однако требует более тщательного анализа финансовой...
Фото
Сохрани себе эту супер-таблицу, проверишь результаты в конце года!
Мы собрали для вас все макро-прогнозы от брокеров и управляющих компаний и свели их в одну таблицу.   Сохрани себе, проверишь в конце года у...

теги блога InvestInna

....все тэги



UPDONW
Новый дизайн