Ликбез по независимым переменным, степеням свободы и переобученности модели
Пусть есть некоторый поток эмпирических данных. И есть некоторая модель, нацеленная на максимизацию некоторого критерия на этих данных. И в этой модели 100500 параметров (коэффициентов), но значения всех этих параметров получаются («порождаются») в результате вычисления некоторой линейной регрессии, построенной на (работающей с) этих эмпирических данных, то есть эти параметры суть коэффициенты регрессии, а не «ручки, которые мы крутим, настраивая модель».
Вопрос: можно ли в этом случае говорить, что эти 100500 параметров (коэффициентов) являются независимыми переменным и «степеням свободы» модели? И, соответственно, опасаться, что модель «переобучится» — из-за того, что в ней слишком много параметров?
«Переобучить» можно даже модель с одним-единственным параметром. Тут всё довольно сильно зависит от того, как устроена модель и по какому алгоритму она обучается.
Какими 'независимыми переменными'??
Они у Вас на схеме 'нейронными связями' соединены. Наглядно зависимости изображены.
Во временном ряде цен есть внутренняя характеристика, показывающая, можно ли на данном участке каким-либо простым алгоритмом забрать больше, чем отдать, или нет. И все модели со связями лишь помогают точно или не очень получить значение этой характеристики.
Характеристика — усреднённая по интервалу наблюдений. Переобученность будет означать, что Вы не усреднённую уже считаете, а чуть ли не на каждой свече своё значение. Что не имеет практического применения для торговли на следующих свечах.
Нужно из общих принципов понимать какое значение характеристики будет в случае белого шума на данном интервале, а какое уже покажет некий неслучайный эффект.
💡Размещения или вторичный рынок — где спрятана допвыгода от валютных облигаций?
Валютные облигации остаются в фокусе внимания инвесторов как основной инструмент для управления рисками, связанными с колебаниями курсов валют. На этой неделе состоятся два размещения...
«Деньги не спят»: Василий Олейник обо всем самом важном на рынке
Рубль всемогущий, а рынок — нет: сколько продлится падение?
Обсуждаем все самое важное для инвесторов в новом выпуске «Деньги не спят». Василий Олейник разберет причины падения акций:...
Группа компаний «А101» получила разрешение на ввод в эксплуатацию (РВЭ) жилого дома № 27 в «Скандинавии» — одном из самых экологичных и современных районов Москвы. Заселение уже началось: первые...
Ну что могу сказать, Трам классический торгаш. Сначала пускает инфу о 500% санкциях и их вот вот объявят, но потом заявляет об их снижении и дает время подумать.
Но на самом деле не все так забавно ...
Кто выкупил допку МТС банка и зачем ему доп капитал? Ну что, кто-нить понял?
👉кто купил допку МТС Банка
👉для какой цели было это пополнение капитала?
Жду ваши идеи в комментах 👇 Авто-р...
📊 График Ри
По стратегии 750 было два усилия — каждое из них дало по 750 пунктов прибыли, итого +1500 пунктов.
Несмотря на то, что согласно самой стратегии эти усилия выполнили своё дело, м...
Иван Иванов, да доллар явно не в лучшей форме. Ведь за ним сейчас нет промышленной мощи США. Была функция мировой валюты. Но Трамп и БАйден просто спускают ее в унитаз. А если нельзя спокойно долла...
Они у Вас на схеме 'нейронными связями' соединены. Наглядно зависимости изображены.
Во временном ряде цен есть внутренняя характеристика, показывающая, можно ли на данном участке каким-либо простым алгоритмом забрать больше, чем отдать, или нет. И все модели со связями лишь помогают точно или не очень получить значение этой характеристики.
Характеристика — усреднённая по интервалу наблюдений. Переобученность будет означать, что Вы не усреднённую уже считаете, а чуть ли не на каждой свече своё значение. Что не имеет практического применения для торговли на следующих свечах.
Нужно из общих принципов понимать какое значение характеристики будет в случае белого шума на данном интервале, а какое уже покажет некий неслучайный эффект.