Проблема с которой я столкнулся в прошлых постах, при попытке определить степень тяжести хвостов распределения EVT Peak Over Threschold эстиматор дает огромные ошибки.
Если рассмотреть идеальный случай:
[1 / fit(GeneralizedPareto, rand(GeneralizedPareto(0, 1, 1/3), 500)).ξ for _ in 1:10]
получим
2.3747
3.4744
2.9658
2.3281
4.3979
2.7633
3.3022
4.7440
2.6349
2.9094
И это при а) идеальном совпадении структуры (форма кривой), б) гиперпараметров (трешхолда=0), и в) достаточно большого сэмпла 500 точек, что не всегда возможно при «изоляции» хвоста (x > u) на реальных данных, обычно трешхолд ~ 0.98-0.99 квантиль, соотв чтобы получить хвост 500 точек нужен сэмпл 25к.
И даже в таком идеальном случае, ошибки 2.4-4.7. Ну а когда эти условия не идеальные — ошибка больше, что мы и наблюдали на графиках в прошлых постах.
Вывод — эстиматоры POT GPD MLE а также WM — совершенно не применимы на практике, и почему об этом не говориться на первой же странице книг и статей по EVT, чтоб не тратить на них время и сразу переходить к другим - непонятно (либо я все еще допускаю где то ошибку, но я ее не вижу...)
Они сходятся «в асимптоте» — но на практике нету столько данных
Что делать — использовать настроенные эстиматоры DEDH и HILL.