Талеб в разных вариантах упоминал что варианс использовать нельзя, потому что ее нельзя точно измерить. И как следствие GARCH который основан на измерении варианс использовать нельзя. Меня это заявление беспокоило, поскольку я гарч использую, и несколько недель в фоне размышлял.
For silver, in 46 years 94 percent of the kurtosis came from one single observation. We cannot use standard statistical methods with financial data. GARCH (a method popular in academia) does not work because we are dealing with squares. The 52 a non-technical overview — the darwin college lecture variance of the squares is analogous to the fourth moment. We do not know the variance. But we can work very easily with Pareto distributions. They give us less information, but nevertheless, it is more rigorous if the data are uncapped or if there are any open variables. // Statistical Consequences of Fat Tails
Я думаю он прав и не прав одновременно. Прав что использовать варианс в чистом виде, как статистику по r^2 походу реально смысла нет, вот как она выглядит (картинка1).
Но, дело в том что ее именно в таком виде, как как r^2 — уже давным давно никто не использует, а используют например log r^2 или |r| и тогда получается вполне нормально (картинка2). (подробней, я рассмотрел разные меры волатильности на дневных ценах
www.youtube.com/watch?v=9-WqmU7A718)


Либо, ее меряют как IV, или RV intraday (интрадей использует варианс и считает RV = sum(r_min^2), но, вроде как данные интрадея ближе к нормальным чем дневные цены, там нет таких диких скачков как на дневных ценах, по идее проблемы либо вообще нет либо сильно меньше, я пока интрадей не использую, когда буду использовать посмотрю подробней).
Либо, используют SV модели (которые основаны на log r^2) вместо GARCH.
Итого, формально Талеб наверно прав. На практике — не имеет значения, именно как статистику по r^2 волатильность давно никто не меряет, используют другие варианты которые нормально работают.
П.С.
У GARCH, любых вариантов, другая проблема — он всегда предполагает волатильность как фиксированный, детерминированный процесс. Это нормально для предсказания на 1 шаг в будущее. Но не достаточно для симуляции N шагов в будущее. Для этого требуется представить волатильность как случайный процесс, чего GARCH сделать не может и нужна SV модель.
чтоб сказать что что-то «не очень» нужен бы бенчмарк, относительно него посчитать правдоподобие бенчмарк-модели и «не очень»-модели, тогда да, можно сказать, что «не очень»-модель — не очень
так-то и log r^2 кроме того, что картинка компактнее кучкуется ничего особенно не даёт, пока какой-то метрики нет
если считануть самый банальный реалайзед вол (на него можно смотреть как на вырожденный гарч) окном на пару месяцев и взять iv с двух месячных опционов — получится плюс-минус одинаковое правдоподобие
сам не проверял, но статьи на arxiv'е попадались, там еще за одно часто пишут, что iv всё-таки систематически завышен
Мы не можем наблюдать истинное распределение генерирующее события непосредственно, поэтому мы моделируем его, например используя нормальное распределение, которое Талеб так не любит. Хороший пример как использовать нормальное распределение с переменными средним и дисперсией, видео и jupiter notebook www.youtube.com/watch?v=Bru4Mkr601Q&t=3090s