Иллюстрация переоптимизации на примере подбора кривых: пусть дана какая-либо кривая. Подбираем любую кривую (многочлен, тригонометрические функции и т.д.) так, чтобы она по возможности совпадала с данной кривой. (см. в поисковике — аппроксимация, а также интерполяция).
Вердикт всех спецов по алготрейдингу – это плохо. За пределами отрезка, где происходила аппроксимация, неизбежно происходит расхождение. И следует совет: брать как можно меньше параметров (один, два, макс три). И это будет нормальный, хороший алготрейдинг.
Ну, хорошо взяли один, два, макс три параметра, создали алгоритм и начинаем тестировать его на разных инструментах. С математической точки зрения мы взяли очень грубую кривую и прикладываем на множество замысловатых кривых, пытаясь найти совпадение. Тут сразу же обнаруживаем, что из всей кучи инструментов этот алгоритм с трудом подходит только для одного — двух инструментов (чаще вообще ни одному). Даже если повезет, и мы нечто найдем, то нам предлагается по этому алгоритму торговать годами. Нет – десятилетиями! (Вайсман, Куртис).
Не кажется ли вам, что здесь присутствует тоже переоптимизация, хоть и другого рода (грубой кривой аппроксимировать множество сложных кривых)? Таким образом, расхождение может начаться в любой момент.
Переоптимизация первого рода – честнее: мы знаем, что имеет место переоптимизация, и не прячем голову в песок. Можно по ней торговать? Хоть и сложно, но можно. Если мы знаем, что с вероятностью, скажем, 60%, аппроксимация будет хорошо описывать кривую какой-то период времени. Какой период времени и какая вероятность: все надо считать и проверять. Муторно? — согласен. Пардо Р. рекомендует брать срок годности модели 1/8-1/4 от оптимизируемого периода.
Переоптимизация второго рода опасна тем, что мы ей полностью доверяем и можем неоправданно много средств вложить в стратегию (берегитесь коммона!). Рано или поздно слом стратегии все равно произойдет (ведь это, как не крути, остается переоптимизацией!). Необходимо заранее планировать точку выхода: как правило, — это 2-3 макс исторической просадки. Исходя из этого можно определить размер капитала, которым можно рискнуть.
есть еще вариант… любой интервал данных можно удвоить легко...
тестишь и оптимизируешь на лонг, а потом смотришь что получилось в шорт
В общем обосновать свою точку зрения не смогу. Формально если нам удается строить устойчивые модели на оптимизации то нет причин погружаться в гипотезы и исследования инструмента.
если нам удается строить устойчивые модели на оптимизации то нет причин погружаться в гипотезы и исследования инструмента
Если он буксует на одном а на другом зарабатывает, значит скорее всего начинка иллюзорная. Пазлы не сходятся.