Блог им. roev_ae

Метод перебора данных или комбинаторный взрыв

При написании торговых систем, все мы используем бэк-тестинг, т.е. проверяем, как бы работал алгоритм на исторических данных.
Очень часто необходимо прогнать одни и те же данные сотни или даже тысячи раз, подставляя разные параметры.
Большинство из нас пользуется старым добрым перебором, к-й гарантирует нам подобрать оптимальное решение, но временные нагрузки неограниченны.
Предлагаю ознакомиться с эпическим мультиком, под названием «комбинаторный взрыв»:


Решением может стать отказ от тупого перебора, я нашел для себя градиентный метод нахождения экстремумов. А чем пользуетесь вы?

P.S. Японцы красавцы — обучающий мультик вполне себе.
Данная публикация является личным мнением автора. Мнение владельца сайта может не совпадать с мнением автора.
287 | ★3
2 комментария
смысла нет… по этому поводу есть отличная статья на сайте механизатора… жаль нет кома под рукой а то бы дал ссыль… вкратце замес в том что каждый параметр оптимизации требует увеличения времени наблюдения вдвое… т.к. 2 параметра оптимизации уже есть по умолчанию = таймфрейм+выбранная бумага то дополнительные параметры это писец в квадрате…
avatar
ves2010, про переоптимизацию — умный текст…
Существует еще одна проблема: каждый раз, когда вы делите систему на два или более состояния, вы по определению сокращаете количество наблюдений в каждом состоянии. Чтобы проиллюстрировать это, представьте, что каждый из 37 классификаторов в моей IWM-системе имеет лишь 2 состояния – лонг или кэш. Тогда существует 2^37 = 137 млрд. возможных состояний системы. Напомним, что статистическая значимость зависит от числа наблюдений, таким образом, уменьшение количества наблюдений на состояние в системе снижает статистическую значимость наблюдаемых результатов для каждого состояния, а также для системы в целом. Например, возьмем дневную торговую систему с 20-летней историей тестирования. Если вы разделите 20 лет (~5000 дней) на 137 млрд. возможных состояний, каждое состояние будет иметь в среднем всего 5000/137 млрд. = 0,00000004 наблюдения на состояние! Очевидно, что 20 лет истории не достаточно, чтобы быть уверенным в этой системе; вам потребуется период тестирования более 3 млн. лет, чтобы получить статистический уровень значимости.

Как правило, чем больше степеней свободы имеет ваша модель, тем больше должен быть размер выборки, чтобы доказать статистическую значимость. Верно и обратное: при одинаковом размере выборки модель с меньшим числом степеней свободы, скорее всего, будет иметь более высокую статистическую значимость. В мире инвестирования, если вы смотрите на результаты бэктестирования двух инвестиционных моделей с аналогичными результатами, как правило, следует отдать предпочтение модели с меньшим числом степеней свободы. По крайней мере, можно сказать, что результаты этой модели будут иметь большую статистическую значимость, и большую вероятность того, что результаты при работе будут согласоваться с тем, что наблюдалось при тестировании.
Хорошо сказал…
avatar

Читайте на SMART-LAB:
Фото
GBP/CHF: Быки капитулируют. Медведи готовят глубокий разворот?
Кросс-курс GBP/CHF протестировал область сопротивления, сформированную между уровнями 1.0675 и 1.0700. При этом сформировались доджи, которые...
Фото
Мы усиливаем позиции на рынке средств защиты конечных устройств
— одном из крупнейших сегментов российского кибербеза и входим в лидеры в классе EDR Этот сегмент прошел длинный путь: от классических...
Вероятная сделка США и Ирана оказала давление на стоимость нефти
США и Иран согласовали мирное соглашение, официальное подписание которого ожидается 19 июня в Швейцарии. Для мировых финансовых рынков главный...
Фото
Подлый рынок с подливою. 3 группы факторов. Мозговой штурм. Weekly #121
14 недель подряд доминируют продажи на российском рынке.  Три основных вопроса я ставил сегодня на еженедельном обсуждении: 1. Какова...

теги блога Андрей Роев

....все тэги



UPDONW
Новый дизайн