Мысли вслух, после пары месяцев использования MCMC и SV, критика и замечания приветствуются.
Это ренгеновский аппарат который выявляет скрытые проблемы. Там где обычный фиттинг проблемной модели даст некий результат, MCMC сломается и явно покажет проблему. Похоже когда двигатель ставят на испытательный стенд, долго гоняют в разных режимах, и смотрят что получилось.
Это можно сделать и без MCMC, доверительные интервалы, зависимость параметров, и т.п. можно посчитать. Но это требует усилий, написания кода, понимания как это все сделать. MCMC делает много сходу и автоматом, пара строчек кода и куча графиков диагностики, все просто, явно, наглядно, понятно (например на графиках определенных параметров для SV модели видно что параметр nu плохо определен).
Цена — скорость. MCMC скорость фиттинга ниже на несколько порядков, может даже в тысячу, или десятки тысяч раз. Можно выбрать чем заплатить — умом и усилиями и сделать быструю и сложную модель, с дополнительной диагностикой. Либо заплатить скоростью CPU и с MCMC получить все автоматом.
И MCMC не может работать с дискретными моделями, сильными нелинейностями. Что вычеркивает много полезных вещей как например Hidden Markov Model. И создает много сложностей при создании модели (например MCMC не может работать с SV Self Exciting Jumps или Markov Switching Multifractal которые судя по всему ближе всего к реальным ценам).
Мне кажется простой тест может ли помоч MCMC - если данных много, сложные модели ищущие случайные и непонятные закономерности без четкой структуры и понимания что именно происходит, выявление случайных закономерностей, например алготрейдинг, арбитраж, пятиминутки, минутки и т.п. mcmc наверно не нужен.
Если мало, например 20 лет истории годовой или квартальной отчетности, медленное, долгосрочное фундаментальн инвестир, модель имеет четкую структуру, причинно следств связи и т.п. — mcmc может дать лучшее понимание задачи, выявить неявные проблемы.
Я использую медленный, долгосрочный, фундаментальный подход плюс чуть алготрейдинга для ребалансировки. не использую корреляции, только причинно следств связи либо корреляции которые можно как то обьяснить.
В частотном подходе это доверительные интервалы (confidence), в байесовском — критиальные (credible). Это разные сущности. У тебя остается много винегрета и без этого.
И я бы сказал это еще плюс к MCMC, credible интервал интуитивнее. confidence в частотном подходе это некая странная вещь, не то что ожидаешь интуитивно.
доверительные интервалы (confidence) используются в классической (частотной) статистике. Главная фишка: считаем параметры системы фиксированными, а данные — случайными. Confidence это про надежность метода (процедуры).
Критиальные (credible) используются в байесовской статистике. Здесь всё наоборот: данные фиксированы (мы их уже получили), а вот параметры — случайны и описываются распределением вероятностей. Credible это про вероятность конкретного результата для конкретных данных.
Я имел ввиду что доверительный интервал это некая абстракция, на практике почти всегда нужен credible интервал, но часто используют вместо него доверительный потому что его получить проще и они для многих случаев близки.