ПЕРЕПОДГОНКА ч.2
В предыдущей заметке https://smart-lab.ru/blog/628025.php
я описал пример применения метода Монте-Карло для оценки переподгонки на базе дневных данных по фьючерсу на индекс РТС. Поскольку мало кто понял, о чем я, собственно, веду речь, и зачем это вообще нужно, продолжу.
Весь расчет был сделан для считающегося условно-безопасным случая 3 – х индикаторов (2^3=8 кластеров). Резонный вопрос, а если кластеров больше или меньше, что будет. Для начала провел моделирование для случая 2, 4, 8, 16, 32 кластеров и привел эмпирическую формулу, связывающую результат с числом степеней свободы (число коих на 1 меньше числа кластеров).
Число кластеров |
Степеней свободы |
Средний Шарп |
Приведенный Шарп |
2 |
1 |
0,214 |
0,214 |
| 4 |
3 |
0,375 |
0,216 |
8 |
7 |
0,573 |
0,217 |
16 |
15 |
0,836 |
0,216 |
32 |
31 |
1,191 |
0,214 |
Связь очень простая, средний финансовый результат (или Шарп, в данном случае это одно и тоже с точностью до множителя) от числа кластеров подгонки пропорционален корню из числа степеней свободы. С точностью до 3 знака. Каждое измерение состояло из 100 000 случайных попыток построить эквити. Так что расхождения в 3 знаке трактовать как наличие более сложной зависимости нет оснований. Гистограмма распределения финрезов эквитей выглядит во всех случаях почти как гауссовский колокол. В общем, ничего удивительного, ЦПТ она такая, созданная из корня.
Приведу таблицу, аналогичную предыдущей, но в терминах среднегодовой доходности.
Число кластеров |
Степеней свободы |
Среднегодовая доходность |
СКО среднегодовой доходности |
2 |
1 |
8,8% |
6,6% |
4 |
3 |
15,1% |
6,5% |
8 |
7 |
23,1% |
6,5% |
16 |
15 |
33,6% |
6,4% |
32 |
31 |
48,0% |
6,3% |
Всего 32 кластера – и чудовищно высокая 1,48 ^ 13 > в 500 раз за 13 лет доходность!
А если мы имеем освященный временем индикатор, и замешаем его в подгонку? Возьмем в качестве такого индикатора экспоненциальное скользящее среднее, а в качестве порогового условия для него – сравнение с ценой закрытия дня. Больше или меньше. По формуле
S(i)=S(i-1)+(C(i)-S(i-1))*(1/P)
используем случайный вещественный параметр P в диапазоне 2-32. В стандартной терминологии это, примерно, от 4 до 64 дней. Среднегодовая доходность 16,4%, её СКО 2,2%. То есть этот индикатор по потенциалу примерно соответствует двум случайным индикаторам.
Сразу тянутся руки добавить еще один простой индикатор – и вот оно, счастье. К сожалению, дальше все не так просто. Например, RSI вообще не имеет смысла.
Возможно продолжение...
все энто при наличие Мощнейшего бычьего тренда с середины 80 до начала нулевых…
и вновь входил, когда индикатор настроения очень умных и не очень… приходил в движение в их сторону…..