SergeyJu
SergeyJu личный блог
28 июня 2020, 09:44

ПЕРЕПОДГОНКА ч.2

ПЕРЕПОДГОНКА ч.2

В предыдущей заметке https://smart-lab.ru/blog/628025.php

я описал пример применения метода Монте-Карло для оценки переподгонки на базе дневных данных по фьючерсу на индекс РТС. Поскольку мало кто понял, о чем я, собственно, веду речь, и зачем это вообще  нужно, продолжу.

Весь расчет был сделан для считающегося условно-безопасным случая 3 – х индикаторов (2^3=8 кластеров). Резонный вопрос, а если кластеров больше или меньше, что будет. Для начала провел моделирование для случая 2, 4, 8, 16, 32 кластеров и привел эмпирическую формулу, связывающую результат с числом степеней свободы (число коих на 1 меньше числа кластеров).

Число кластеров

Степеней свободы

Средний Шарп

Приведенный Шарп

2

1

0,214

0,214

4

3

0,375

0,216

8

7

0,573

0,217

16

15

0,836

0,216

32

31

1,191

0,214

 

Связь очень простая, средний финансовый результат (или Шарп, в данном случае это одно и тоже с точностью до множителя) от числа кластеров  подгонки пропорционален корню из числа степеней свободы. С точностью до 3 знака. Каждое измерение состояло из 100 000 случайных попыток построить эквити. Так что расхождения в 3 знаке трактовать как наличие более сложной зависимости нет оснований. Гистограмма распределения финрезов эквитей выглядит во всех случаях почти как гауссовский колокол. В общем, ничего удивительного, ЦПТ она такая, созданная из корня.

Приведу  таблицу, аналогичную предыдущей, но в терминах среднегодовой доходности.

Число кластеров

Степеней свободы

Среднегодовая доходность

СКО среднегодовой доходности

2

1

8,8%

6,6%

4

3

15,1%

6,5%

8

7

23,1%

6,5%

16

15

33,6%

6,4%

32

31

48,0%

6,3%

 

Всего 32 кластера – и чудовищно высокая 1,48 ^ 13 > в 500 раз  за 13 лет доходность!  

А если мы имеем освященный временем индикатор, и замешаем его в подгонку? Возьмем в качестве такого индикатора экспоненциальное скользящее среднее, а в качестве порогового условия для него – сравнение с ценой закрытия дня. Больше или меньше. По формуле

S(i)=S(i-1)+(C(i)-S(i-1))*(1/P)

используем случайный вещественный параметр P в диапазоне 2-32. В стандартной терминологии это, примерно, от 4 до 64 дней. Среднегодовая  доходность 16,4%, её СКО 2,2%. То есть этот индикатор по потенциалу примерно соответствует двум случайным индикаторам.

Сразу тянутся руки добавить еще один простой индикатор – и вот оно, счастье. К сожалению, дальше все не так просто. Например, RSI вообще не имеет смысла.
Возможно продолжение...

51 Комментарий
  • wistopus
    25 ноября 2023, 21:27
    по памяти годовую доходность  по индексу S&P  в 48%  имел Гэри Смит… правда, что такое кластеры  понятия не имел, а спрыгивали при малейшем шухере с взаимных фондов… 
    все энто при наличие Мощнейшего бычьего тренда  с середины 80 до начала нулевых…

    и вновь  входил, когда индикатор настроения очень умных и не очень… приходил в движение в их сторону…..
  • wistopus
    28 июня 2020, 12:11
    о чем Вы пишите я, естественно, не понимаю… возможно, что энто и к лучшему…

Активные форумы
Что сейчас обсуждают

Старый дизайн
Старый
дизайн