Ликбез по независимым переменным, степеням свободы и переобученности модели
Пусть есть некоторый поток эмпирических данных. И есть некоторая модель, нацеленная на максимизацию некоторого критерия на этих данных. И в этой модели 100500 параметров (коэффициентов), но значения всех этих параметров получаются («порождаются») в результате вычисления некоторой линейной регрессии, построенной на (работающей с) этих эмпирических данных, то есть эти параметры суть коэффициенты регрессии, а не «ручки, которые мы крутим, настраивая модель».
Вопрос: можно ли в этом случае говорить, что эти 100500 параметров (коэффициентов) являются независимыми переменным и «степеням свободы» модели? И, соответственно, опасаться, что модель «переобучится» — из-за того, что в ней слишком много параметров?
«Переобучить» можно даже модель с одним-единственным параметром. Тут всё довольно сильно зависит от того, как устроена модель и по какому алгоритму она обучается.
Какими 'независимыми переменными'??
Они у Вас на схеме 'нейронными связями' соединены. Наглядно зависимости изображены.
Во временном ряде цен есть внутренняя характеристика, показывающая, можно ли на данном участке каким-либо простым алгоритмом забрать больше, чем отдать, или нет. И все модели со связями лишь помогают точно или не очень получить значение этой характеристики.
Характеристика — усреднённая по интервалу наблюдений. Переобученность будет означать, что Вы не усреднённую уже считаете, а чуть ли не на каждой свече своё значение. Что не имеет практического применения для торговли на следующих свечах.
Нужно из общих принципов понимать какое значение характеристики будет в случае белого шума на данном интервале, а какое уже покажет некий неслучайный эффект.
По данным Росстата, с 7 по 13 апреля инфляция в России оказалась нулевой после 0,19% неделей ранее. В годовом сопоставлении показатель составил до 5,77% после 5,95% на 6 апреля. Это уже не просто...
Мы уже рассказали, что Наблюдательный совет ДОМ.РФ принял решение рекомендовать к выплате 246,88 рубля дивидендов на одну акцию.
Следующий шаг – Годовое общее собрание акционеров, на котором...
Как замена оборудования влияет на безопасность и эффективность
Модернизация техники — постоянный процесс для «Норникеля». Это снижает риски, делает работу стабильнее и помогает точнее управлять производством. Рассказываем о последних изменениях.
🔹 На...
Что делать с валютой: капитулировать перед высокими ценами на нефть или наращивать позицию?
Здравствуйте! С учетом высокой волатильности на валютном рынке, считаю необходимым актуализировать взгляд на валютную позицию.
В сентябре был установлен рейтинг 4 для облигаций и спот...
РОССИЯ-ИНФЛЯЦИЯ-РИСКИ-АНАЛИТИКИ-ЦБ
16.04.2026 15:42:27
Жесткость денежно-кредитных условий пока нужно поддерживать, это позволит быстрее перейти к нейтральной ДКП — аналитики ЦБ РФ
Москва....
Сокол, сделку свою покажи, клоун, как твой стоп сработал, какая разница на каком тф. А если ты без стопа был, я тебе могу тысячи таких проколов принести, которые не откупили. Думаешь один раз форта...
Селигдар 001P-11: привлекательная доходность под старые проблемы. Почему против
Частота, с которой эмитент вынужден снова и снова возвращаться на долговой рынок за новыми займами, вызывает се...
Переработка приостановлена на газоперерабатывающем комплексе «Новатэка» в Усть-Луге (атакован 25 марта), на Киришском НПЗ «Сургутнефтегаза» (атакован 26 марта), а также на независимом Афипском НПЗ (ат...
Они у Вас на схеме 'нейронными связями' соединены. Наглядно зависимости изображены.
Во временном ряде цен есть внутренняя характеристика, показывающая, можно ли на данном участке каким-либо простым алгоритмом забрать больше, чем отдать, или нет. И все модели со связями лишь помогают точно или не очень получить значение этой характеристики.
Характеристика — усреднённая по интервалу наблюдений. Переобученность будет означать, что Вы не усреднённую уже считаете, а чуть ли не на каждой свече своё значение. Что не имеет практического применения для торговли на следующих свечах.
Нужно из общих принципов понимать какое значение характеристики будет в случае белого шума на данном интервале, а какое уже покажет некий неслучайный эффект.