Блог им. Op_Man

Зафиналить тему подгонки систем под исторические данные хотелось бы.

Почему любой прогноз цены — это «подгонка»

Мое имхо: все без исключения методы прогнозирования цены являются «подгонкой» под исторические данные. Продолжение smart-lab.ru/blog/1179192.php

Это фундаментальное ограничение работы с будущим — у нас есть только прошлое как источник информации.

Технический анализ

Источник данных:

  • Исторические цены
  • Объемы торгов

Почему это «подгонка»:

  • Индикаторы (RSI, MACD, скользящие средние и прочие шалости) выводятся из наблюдений за прошлым поведением цены
  • Графические паттерны (голова-плечи, флаги или что там вам ещё померещилось) основаны на исторических повторениях
  • Параметры стратегий оптимизируются на исторических данных
  • Успешность в прошлом не гарантирует успеха в будущем из-за изменчивости рынков

Фундаментальный анализ

Источник данных:

  • Финансовая отчетность (выручка, прибыль, долги)
  • Макроэкономические показатели (ВВП, инфляция, ставки)
  • Отраслевые тренды
  • Новости и события

Почему это «подгонка»:

  • Модели оценки (DCF, сравнительный анализ) используют исторические мультипликаторы
  • Предположения о будущих денежных потоках основаны на экстраполяции прошлых данных
  • Прогнозы темпов роста базируются на исторических тенденциях
  • Интерпретация новостей основана на том, как похожие события влияли в прошлом

Количественные модели и машинное обучение

Источник данных:

  • Любые исторические данные (цены, фундаментал, альтернативные данные)

Почему это «подгонка»:

  • Алгоритмы обучаются на исторических данных
  • Выявляют сложные паттерны и зависимости из прошлого
  • Качество модели зависит от качества и репрезентативности прошлых данных
  • Высок риск «переобучения» — когда модель запоминает шум вместо реальных закономерностей
Почему это неизбежно?

У нас есть только один источник информации — ПРОШЛОЕ. Данных из будущего нет.

Любой прогноз — это:

  • Экстраполяция (продолжение существующих тенденций)
  • Интерпретация (придание смысла данным на основе прошлого опыта)
  • Выявление паттернов (поиск повторяющихся шаблонов в истории)

Модели создаются и «настраиваются» на том, что уже произошло, в надежде, что выявленные закономерности сохранятся.

Важное различие: разумная подгонка vs. переобучение (overfitting)

Разумная модель

  • Проходит строгую проверку на независимых исторических данных (out-of-sample)
  • Тестируется в реальном времени (форвард-тест)
  • Следует принципу простоты («бритва Оккама» — не усложняет без необходимости)
  • Признает неопределенность и ограниченность прогнозов
  • Фокусируется на устойчивых, статистически значимых закономерностях

Переобучение (Overfitting)

  • Идеально работает только на данных, под которые подгонялась
  • Учитывает случайный шум, а не реальные закономерности
  • Чрезмерно сложная модель с множеством параметров
  • Бесполезна на новых данных
  • Создает ложное впечатление точности прогноза
Понятненько?

Подгонка под исторические данные — неотъемлемая часть создания любой прогнозной модели.

Ценность модели определяется не отсутствием подгонки, а тем, насколько строго проверена ее способность обобщать выявленные в прошлом закономерности на новые, неизвестные условия.

Настоящая проверка любой модели — будущее, которое всегда остается неопределенным.

 

609
9 комментариев
подгоненную страту перепроверь на отдельных временных промежутках.
если средн. норм результат показывает на разных годах то норм
avatar

Только overfitting — мастхев,

а вот зло это curvefitting. 

Игорь Шепелев, наоборот
avatar
Если что-то мерещится уже не первую сотню лет и это происходит
ежедневно на разных таймфреймах разных торговых инструментов...
То может оно и не мерещится?

Не хватит ли пугаться и креститься при виде паровоза на экране?
avatar

VladMih, ничего против не имею людей, которые ищут графические фигуры на ценах. 

Если нравится и получается — только рад буду. Участники разные нужны.

avatar
  • Чрезмерно сложная модель с множеством параметров
А вы расскажите синоптикам как сделать прогноз на двух параметрах
Заодно расскажите им, что у них подгонка под историю ))
Вот уж ребята повеселятся!
avatar

VladMih, мы вроде про цены биржевые. 

Синоптики ошибаются не реже аналитиков.

avatar
Op_Man💰, какая разница что прогнозировать? Принципы ЕДИНЫ!
Вы ещё и, как минимум, путаете ошибку в пределах погрешности (точность прогноза) с ошибкой в направлении, как у аналитиков.
Ну где вы, блин, видели, чтобы синоптики сказали о потеплении, а наступило похолодание?! Вы в себе?

После этого, да еще и вкупе с вашим высокомерным "участники жертвы разные нужны", полностью потерял к вам интерес.
avatar
Избежать подгонки в алго нельзя. Можно только пытаться научиться её применять. 
avatar

Читайте на SMART-LAB:
Серебро обновляет рекорды на фоне эскалации вокруг Венесуэлы
Серебро на спотовом рынке обновило исторический максимум и поднималось выше $66 за тройскую унцию, прибавляя до 4,5% за сессию. Золото также...
Фото
Инвестиции с защитой от инфляции: реальные активы в портфеле МГКЛ
📈 Когда цены растут, особенно важно понимать, что лежит в основе бизнеса. В МГКЛ эта основа — реальные активы: товары, техника, залоги, золото. Это...
Фото
Российский сектор здравоохранения: два перспективных эмитента
«МД Медикал Груп» «МД Медикал» — один из ведущих игроков на рынке частных услуг здравоохранения в РФ. Группа компаний «МД Медикал»...

теги блога Op_Man💰

....все тэги



UPDONW
Новый дизайн