Метод перебора данных или комбинаторный взрыв

20 июля 2014, 16:07
|
Андрей Роев

При написании торговых систем, все мы используем бэк-тестинг, т.е. проверяем, как бы работал алгоритм на исторических данных.
Очень часто необходимо прогнать одни и те же данные сотни или даже тысячи раз, подставляя разные параметры.
Большинство из нас пользуется старым добрым перебором, к-й гарантирует нам подобрать оптимальное решение, но временные нагрузки неограниченны.
Предлагаю ознакомиться с эпическим мультиком, под названием «комбинаторный взрыв»:

Решением может стать отказ от тупого перебора, я нашел для себя градиентный метод нахождения экстремумов. А чем пользуетесь вы?

P.S. Японцы красавцы — обучающий мультик вполне себе.

Данная публикация является личным мнением автора. Мнение владельца сайта может не совпадать с мнением автора.

Ключевые слова:
бэктестинг

287 | ★3

2 комментария

смысла нет… по этому поводу есть отличная статья на сайте механизатора… жаль нет кома под рукой а то бы дал ссыль… вкратце замес в том что каждый параметр оптимизации требует увеличения времени наблюдения вдвое… т.к. 2 параметра оптимизации уже есть по умолчанию = таймфрейм+выбранная бумага то дополнительные параметры это писец в квадрате…

ves2010

20 июля 2014, 18:58
Ответить

ves2010, про переоптимизацию — умный текст…
Существует еще одна проблема: каждый раз, когда вы делите систему на два или более состояния, вы по определению сокращаете количество наблюдений в каждом состоянии. Чтобы проиллюстрировать это, представьте, что каждый из 37 классификаторов в моей IWM-системе имеет лишь 2 состояния – лонг или кэш. Тогда существует 2^37 = 137 млрд. возможных состояний системы. Напомним, что статистическая значимость зависит от числа наблюдений, таким образом, уменьшение количества наблюдений на состояние в системе снижает статистическую значимость наблюдаемых результатов для каждого состояния, а также для системы в целом. Например, возьмем дневную торговую систему с 20-летней историей тестирования. Если вы разделите 20 лет (~5000 дней) на 137 млрд. возможных состояний, каждое состояние будет иметь в среднем всего 5000/137 млрд. = 0,00000004 наблюдения на состояние! Очевидно, что 20 лет истории не достаточно, чтобы быть уверенным в этой системе; вам потребуется период тестирования более 3 млн. лет, чтобы получить статистический уровень значимости.

Как правило, чем больше степеней свободы имеет ваша модель, тем больше должен быть размер выборки, чтобы доказать статистическую значимость. Верно и обратное: при одинаковом размере выборки модель с меньшим числом степеней свободы, скорее всего, будет иметь более высокую статистическую значимость. В мире инвестирования, если вы смотрите на результаты бэктестирования двух инвестиционных моделей с аналогичными результатами, как правило, следует отдать предпочтение модели с меньшим числом степеней свободы. По крайней мере, можно сказать, что результаты этой модели будут иметь большую статистическую значимость, и большую вероятность того, что результаты при работе будут согласоваться с тем, что наблюдалось при тестировании.
Хорошо сказал…

ves2010

20 июля 2014, 22:13
Ответить

Читайте на SMART-LAB:

EUR/CHF: Медведи возвращаются к привычной работе?

Кросс-курс EUR/CHF пробует закрыть текущий день (четверг) разворотной моделью с длинным верхним фитилем (падающей звездой), которая при этом...

Олег Свиргун

21:15

АПРИ утвердил проект планировки территори на 180 тысяч квадратных метров в Ленинградской области

АПРИ утвердил проект планировки территории на 180 тысяч квадратных метров в Ленинградской области ПАО «АПРИ» утвердило проект...

APRI

13:39

💡 У «НОВАТЭКа» есть только два союзника: дефицит и флот

🔹 С начала года акции «НОВАТЭКа» снизились на 10%, тогда как индекс Мосбиржи потерял 6,6%. При этом рыночные условия улучшились: нефть марки...

ВТБ Мои Инвестиции

18:08

Технический комментарий для наших подписчиков. Weekly №119

IMOEX = 2580. С начала апреля рынок перевернулся вниз и пока продолжает развиваться нисходящая тенденция . Рынок снижается 9 из 11 последних...

Тимофей Мартынов

19:33

Ленты

Форумы

Участники

Котировки

Акции

Календарь

Информация

Книги

Метод перебора данных или комбинаторный взрыв

полезные записи за 24 часа

Лучшие записи за 24 часа

самые обсуждаемые сегодня

Календарь: акции | экономика | облигации

торговые сигналы

корпоративные блоги

теги блога Андрей Роев

Авторизация

Ленты

Форумы

Участники

Котировки

Акции

Календарь

Информация

Книги

Метод перебора данных или комбинаторный взрыв

полезные записи за 24 часа

Лучшие записи за 24 часа

самые обсуждаемые сегодня

Календарь: акции | экономика | облигации

торговые сигналы

корпоративные блоги

теги блога Андрей Роев