Alex Craft
Alex Craft личный блог
12 августа 2025, 12:59

Отгдадка, почему Теор. Экстрим Знач, определение степени тяж хвоста не работает, часть 2

Проблема с которой я столкнулся в прошлых постах, при попытке определить степень тяжести хвостов распределения EVT Peak Over Threschold эстиматор дает огромные ошибки.

Если рассмотреть идеальный случай:
[1 / fit(GeneralizedPareto, rand(GeneralizedPareto(0, 1, 1/3), 500)).ξ for _ in 1:10]
получим
2.3747
 3.4744
 2.9658
 2.3281
 4.3979
 2.7633
 3.3022
 4.7440
 2.6349
 2.9094
И это при а) идеальном совпадении структуры (форма кривой), б) гиперпараметров (трешхолда=0), и в) достаточно большого сэмпла 500 точек, что не всегда возможно при «изоляции» хвоста (x > u) на реальных данных, обычно трешхолд ~ 0.98-0.99 квантиль, соотв чтобы получить хвост 500 точек нужен сэмпл 25к.

И даже в таком идеальном случае, ошибки 2.4-4.7. Ну а когда эти условия не идеальные — ошибка больше, что мы и наблюдали на графиках в прошлых постах.

Вывод — эстиматоры POT GPD MLE а также WM — совершенно не применимы на практике, и почему об этом не говориться на первой же странице книг и статей по EVT, чтоб не тратить на них время и сразу переходить к другим -  непонятно (либо я все еще допускаю где то ошибку, но я ее не вижу...)

Они сходятся «в асимптоте» — но на практике нету столько данных

Что делать — использовать настроенные эстиматоры DEDH и HILL.
0 Комментариев

Активные форумы
Что сейчас обсуждают

Старый дизайн
Старый
дизайн