Ликбез по независимым переменным, степеням свободы и переобученности модели

Пусть есть некоторый поток эмпирических данных. И есть некоторая модель, нацеленная на максимизацию некоторого критерия на этих данных. И в этой модели 100500 параметров (коэффициентов), но значения всех этих параметров получаются («порождаются») в результате вычисления некоторой линейной регрессии, построенной на (работающей с) этих эмпирических данных, то есть эти параметры суть коэффициенты регрессии, а не «ручки, которые мы крутим, настраивая модель».

Вопрос: можно ли в этом случае говорить, что эти 100500 параметров (коэффициентов) являются независимыми переменным и «степеням свободы» модели? И, соответственно, опасаться, что модель «переобучится» — из-за того, что в ней слишком много параметров?

Данная публикация является личным мнением автора. Мнение владельца сайта может не совпадать с мнением автора.

оптимизация модели регрессия торговые роботы

Ivan FXS

Москва

151

с 1 мая 2018

27 Комментариев

Большой Брат
07 марта 2023, 10:30
Это степени не свободы, а несвободы.
0
Пафос Респектыч
07 марта 2023, 10:42
«Переобучить» можно даже модель с одним-единственным параметром. Тут всё довольно сильно зависит от того, как устроена модель и по какому алгоритму она обучается.
+2
svgr
07 марта 2023, 11:03
Какими 'независимыми переменными'??
Они у Вас на схеме 'нейронными связями' соединены. Наглядно зависимости изображены.
Во временном ряде цен есть внутренняя характеристика, показывающая, можно ли на данном участке каким-либо простым алгоритмом забрать больше, чем отдать, или нет. И все модели со связями лишь помогают точно или не очень получить значение этой характеристики.
Характеристика — усреднённая по интервалу наблюдений. Переобученность будет означать, что Вы не усреднённую уже считаете, а чуть ли не на каждой свече своё значение. Что не имеет практического применения для торговли на следующих свечах.
Нужно из общих принципов понимать какое значение характеристики будет в случае белого шума на данном интервале, а какое уже покажет некий неслучайный эффект.
0
SergeyJu
07 марта 2023, 11:47
А сколько параметров у линейной регрессии?
0

Читайте на SMART-LAB:

📈 Что сегодня делает МГКЛ одной из самых интересных компаний на российском рынке?

Каждый инвестор самостоятельно принимает инвестиционные решения, но есть ряд факторов, благодаря которым Группа «МГКЛ» остается одной из самых быстрорастущих публичных компаний своего...

МГКЛ

10:03

📅 День инвестора и результаты SOFL за 6 месяцев 2026 года — уже 27 августа!

Друзья, 27 августа мы приглашаем вас на День инвестора ПАО «Софтлайн»! ❓Что там будет? Наши топ-менеджеры: • подробно расскажут о ключевых направлениях развития бизнеса SOFL • презентуют...

Softline

09:05

Сделки в портфеле PRObonds Акции / Деньги

Если Индекс МосБиржи пробивает вверх 2 101 п., увеличиваем вес корзины акций (формируется в соответствии с Индексом голубых фишек) в портфеле PRObonds Акции / Деньги с де-факто примерно 51% до 52%...

Иволга Капитал

10:21

Включаем "Антикризис" на полную катушку! А вдруг?

Сегодня я был снова вынужден прервать свой отвратительный отпуск, чтобы заниматься делами своего инвестиционного портфеля и даже для того, чтобы записать еженедельную вечернюю программу...