Всем известна гипотеза, по которой движение цены на графике является не более, чем хаотичным блужданием. Большинство трейдеров с ней, конечно, не согласны. Одни просто потому, что надеются на лучшее — надо же во что-то верить. Другие потому, что в совершенстве овладели искусством штамповки переподогнанных граалей и по этой причине искренне заблуждаются.
На самом деле, чем тщательнее исследуется рынок, тем больше поводов для грусти. Если взять любой кусок данных конечной длины, то несложно подобрать факторы и построить модель, которая какую-то часть цены объясняет, уменьшает дисперсию. Однако должно быть понятно, что просто взять данные и построить по ним модель — это не решение задачи. Это подгонка под данные.
Любой фактор взятый с потолка даст какую-то корреляцию с изменениями цены, не бывает факторов с нулевой корреляцией. Казалось бы — насочиняй кучу факторов, сложи всех в модель — и вот оно, счастье.
В суровой реальности оказывается, что подавляющее большинство факторов уменьшают дисперсию на тренировочных данных, но увеличивает ее на тестовых. То есть ничего не объясняют, а просто мешаются. Каждый фактор в модели должен пройти какую-то дополнительную проверку, например кросс-валидацию. Ну или ее варианты для чайников — out-of-sample, форвардное тестирование, хоть что-нибудь. Если прошел — тогда да, фактор можно положить в модель, иначе — в мусор. И вот тут оказывается, что почти все идет в мусор, а на том. что не идет, грааля с супердоходностью не построить. И начинают в голову лезть гипотезы случайного блуждания.
(
Читать дальше )