Ликбез по независимым переменным, степеням свободы и переобученности модели
Пусть есть некоторый поток эмпирических данных. И есть некоторая модель, нацеленная на максимизацию некоторого критерия на этих данных. И в этой модели 100500 параметров (коэффициентов), но значения всех этих параметров получаются («порождаются») в результате вычисления некоторой линейной регрессии, построенной на (работающей с) этих эмпирических данных, то есть эти параметры суть коэффициенты регрессии, а не «ручки, которые мы крутим, настраивая модель».
Вопрос: можно ли в этом случае говорить, что эти 100500 параметров (коэффициентов) являются независимыми переменным и «степеням свободы» модели? И, соответственно, опасаться, что модель «переобучится» — из-за того, что в ней слишком много параметров?
«Переобучить» можно даже модель с одним-единственным параметром. Тут всё довольно сильно зависит от того, как устроена модель и по какому алгоритму она обучается.
Какими 'независимыми переменными'??
Они у Вас на схеме 'нейронными связями' соединены. Наглядно зависимости изображены.
Во временном ряде цен есть внутренняя характеристика, показывающая, можно ли на данном участке каким-либо простым алгоритмом забрать больше, чем отдать, или нет. И все модели со связями лишь помогают точно или не очень получить значение этой характеристики.
Характеристика — усреднённая по интервалу наблюдений. Переобученность будет означать, что Вы не усреднённую уже считаете, а чуть ли не на каждой свече своё значение. Что не имеет практического применения для торговли на следующих свечах.
Нужно из общих принципов понимать какое значение характеристики будет в случае белого шума на данном интервале, а какое уже покажет некий неслучайный эффект.
Приглашаем принять участие в конкурсе «Лучший частный инвестор 2026»!
АЛОР БРОКЕР объявляет о начале регистрации в конкурсе «Лучший частный инвестор 2026», который проводит Московская Биржа. Инвесторы могут принять участие в конкурсе с 17 марта по 17...
Как и любой бизнес, торговый центр должен приносить прибыль, причем, не только его собственнику, но и арендаторам. А прибыль зависит от трафика и конверсии – количества посетителей, числа и...
Чтобы вовремя заметить выгодную сделку или, наоборот, не тратить время на то, что не актуально для портфеля, важно видеть разницу между закрытым и открытым размещением новых бумаг. ⚡Открытая...
Мой Рюкзак #65: Ставка на энергетический и продовольственный кризис из-за перекрытия проливов
Если февраль радовал стоимостных инвесторов, то март пока радует только валютных спекулянтов и миноритариев Роснефти и Совкомфлота (в совкомфлоте идею подсветил в нефтяном срезе, но сам прошел...
Marat Gab, просто в бумагу зашли очень-очень позитивные люди, которые верят в НЭППИ. Может люди связанные с НЭППИ специально держат счета пустыми, чтоб дефолтится, потом покупать за бесценок свои б...
ЧИГ Калита,
12.01.2026
"… Условия реструктуризации будут представлены владельцам облигаций в январе 2026 года…
31.01.2026
"… Монополия вернется с информацией по коммерчески...
Контейнерный рынок России в 2026 году останется на уровне 2025 года — около 6,3 млн TEU — прогноз Fesco Контейнерный рынок России в 2026 году, по прогнозу Fesco, останется на уровне 2025 года — около ...
Они у Вас на схеме 'нейронными связями' соединены. Наглядно зависимости изображены.
Во временном ряде цен есть внутренняя характеристика, показывающая, можно ли на данном участке каким-либо простым алгоритмом забрать больше, чем отдать, или нет. И все модели со связями лишь помогают точно или не очень получить значение этой характеристики.
Характеристика — усреднённая по интервалу наблюдений. Переобученность будет означать, что Вы не усреднённую уже считаете, а чуть ли не на каждой свече своё значение. Что не имеет практического применения для торговли на следующих свечах.
Нужно из общих принципов понимать какое значение характеристики будет в случае белого шума на данном интервале, а какое уже покажет некий неслучайный эффект.