Ликбез по независимым переменным, степеням свободы и переобученности модели
Пусть есть некоторый поток эмпирических данных. И есть некоторая модель, нацеленная на максимизацию некоторого критерия на этих данных. И в этой модели 100500 параметров (коэффициентов), но значения всех этих параметров получаются («порождаются») в результате вычисления некоторой линейной регрессии, построенной на (работающей с) этих эмпирических данных, то есть эти параметры суть коэффициенты регрессии, а не «ручки, которые мы крутим, настраивая модель».
Вопрос: можно ли в этом случае говорить, что эти 100500 параметров (коэффициентов) являются независимыми переменным и «степеням свободы» модели? И, соответственно, опасаться, что модель «переобучится» — из-за того, что в ней слишком много параметров?
«Переобучить» можно даже модель с одним-единственным параметром. Тут всё довольно сильно зависит от того, как устроена модель и по какому алгоритму она обучается.
Какими 'независимыми переменными'??
Они у Вас на схеме 'нейронными связями' соединены. Наглядно зависимости изображены.
Во временном ряде цен есть внутренняя характеристика, показывающая, можно ли на данном участке каким-либо простым алгоритмом забрать больше, чем отдать, или нет. И все модели со связями лишь помогают точно или не очень получить значение этой характеристики.
Характеристика — усреднённая по интервалу наблюдений. Переобученность будет означать, что Вы не усреднённую уже считаете, а чуть ли не на каждой свече своё значение. Что не имеет практического применения для торговли на следующих свечах.
Нужно из общих принципов понимать какое значение характеристики будет в случае белого шума на данном интервале, а какое уже покажет некий неслучайный эффект.
Т-технологии планируют консолидировать 100% акций АО “Точка”. Компания объявила о намерении приобрести одну из самых быстрорастущих финансовых организаций. Для этой цели компания выпустит новые...
Займер: спрос на займы заметно вырос в конце января 🔥
В рамках исследования для СМИ мы изучили спрос на займы в январе и получили любопытную статистику. 🟢 Оказалось, что в конце января люди показали самый высокий за месяц интерес к займам. Так, за...
📆 Друзья, по традиции делимся датами публикации годовой отчетности Positive Technologie
▶️ Предварительные данные по отгрузкам за 2025 год мы опубликуем 9 февраля. ▶️ А 7-го апреля представим консолидированную финансовую отчетность за 2025 год и разместим годовой отчет. Следите...
Коллекторские агентства в 2025 году приобрели рекордный за три года объем просроченной задолженности МФО — ₽113,4 млрд, что на 27,4% больше г/г — Ведомости В 2025 году коллекторские агентства приобрел...
ЧИГ Калита, если бы речь шла об акциях, то да, наверное лучше было бы продать, но облигации другое дело
с чего мне продавать свое право требовать от эмитнета выплаты купона и погашения номинально...
Доллар недооценил противника Первая реакция – не всегда верная. Как показывают события 2026, практически всегда не верная. Доллар падал из-за тарифных угроз Белого дома Европе, из-за поддержки Дональд...
Крупнейшие в Китае биржевые фонды, обеспеченные золотом, зафиксировали самый масштабный суточный отток средств за всю историю наблюдений — было выведено ¥6,8 млрд, или около $980 млн — BBG Крупнейшие ...
Никель в центре технологического прогресса Компания Tesla запатентовала технологию модернизации литийионных аккумуляторов, которая может значительно увеличить срок их службы — до 1,6 млн километров пр...
Они у Вас на схеме 'нейронными связями' соединены. Наглядно зависимости изображены.
Во временном ряде цен есть внутренняя характеристика, показывающая, можно ли на данном участке каким-либо простым алгоритмом забрать больше, чем отдать, или нет. И все модели со связями лишь помогают точно или не очень получить значение этой характеристики.
Характеристика — усреднённая по интервалу наблюдений. Переобученность будет означать, что Вы не усреднённую уже считаете, а чуть ли не на каждой свече своё значение. Что не имеет практического применения для торговли на следующих свечах.
Нужно из общих принципов понимать какое значение характеристики будет в случае белого шума на данном интервале, а какое уже покажет некий неслучайный эффект.