Ликбез по независимым переменным, степеням свободы и переобученности модели
Пусть есть некоторый поток эмпирических данных. И есть некоторая модель, нацеленная на максимизацию некоторого критерия на этих данных. И в этой модели 100500 параметров (коэффициентов), но значения всех этих параметров получаются («порождаются») в результате вычисления некоторой линейной регрессии, построенной на (работающей с) этих эмпирических данных, то есть эти параметры суть коэффициенты регрессии, а не «ручки, которые мы крутим, настраивая модель».
Вопрос: можно ли в этом случае говорить, что эти 100500 параметров (коэффициентов) являются независимыми переменным и «степеням свободы» модели? И, соответственно, опасаться, что модель «переобучится» — из-за того, что в ней слишком много параметров?
«Переобучить» можно даже модель с одним-единственным параметром. Тут всё довольно сильно зависит от того, как устроена модель и по какому алгоритму она обучается.
Какими 'независимыми переменными'??
Они у Вас на схеме 'нейронными связями' соединены. Наглядно зависимости изображены.
Во временном ряде цен есть внутренняя характеристика, показывающая, можно ли на данном участке каким-либо простым алгоритмом забрать больше, чем отдать, или нет. И все модели со связями лишь помогают точно или не очень получить значение этой характеристики.
Характеристика — усреднённая по интервалу наблюдений. Переобученность будет означать, что Вы не усреднённую уже считаете, а чуть ли не на каждой свече своё значение. Что не имеет практического применения для торговли на следующих свечах.
Нужно из общих принципов понимать какое значение характеристики будет в случае белого шума на данном интервале, а какое уже покажет некий неслучайный эффект.
Лента опубликовала финансовые результаты за 1-й кв. 2026 года. Выручка выросла на 23,4% до 307 млрд руб. Валовая прибыль выросла на 22,2% до 67 млрд руб. EBITDA прибавила только 0,7% до...
📊 МГКЛ продолжает внедрять лучшие практики корпоративного управления
ПАО «МГКЛ» продолжает последовательно усиливать корпоративное управление и совершенствовать внутренние процедуры контроля по мере роста бизнеса и увеличения числа инвесторов компании. В...
Самый интересный пост: что внутри портфелей у нашей команды + короткое объяснение по каждой позиции
Сегодня пришло время совершить квартальное раскрытие наших инвестиционных портфелей. Что внутри? ✅Состав портфелей каждого из наших аналитиков ✅Короткое мнение каждого аналитика по каждой...
Алексей Шаульский,
проблема в том, что большинство горазды только на диване принимать решения мирового масштаба,
а отвечать за подобные решения могут лишь немногие,
а хотят почти никто
Михаил Трейдунов,
Нет, бкс в этом случае не причем.
Все праздничные дни деньги от тгк-14, поступившие на счет НРД еще 30 апреля, находились у них, на счету в НРД!!
НРД сам это подтв...
d'queen, вижу тебя не только я один. Ты бы, братан, не смеялся саркастически над этим, а лучше вместе с Чингачгуком поднимал данную отрасль. Что бы ты и потом ваши не правильно воспитанные потомки ...
vaders, Считаю, что не совсем так, что не относится к финансовому состоянию. Они хотели реорганизоваться в АО (акционерное общество!)с присвоением нового ИНН и т.д., чтобы далее выйти на IPO и по с...
Григорий Еремин, про какие ежедневные убытки речь? Цена сейчас ниже менее чем на 2 процента. На любом мало-мальском позитиве это отыграется на раз-два. Помню при цене Сбера в 104 руб тоже потом при...
Лента 1 кв. 2026 г. - сказка кончилась?
Лента опубликовала финансовые результаты за 1-й кв. 2026 года.Выручка выросла на 23,4% до 307 млрд руб.Валовая прибыль выросла на 22,2% до 67 млрд руб. EBITD...
Они у Вас на схеме 'нейронными связями' соединены. Наглядно зависимости изображены.
Во временном ряде цен есть внутренняя характеристика, показывающая, можно ли на данном участке каким-либо простым алгоритмом забрать больше, чем отдать, или нет. И все модели со связями лишь помогают точно или не очень получить значение этой характеристики.
Характеристика — усреднённая по интервалу наблюдений. Переобученность будет означать, что Вы не усреднённую уже считаете, а чуть ли не на каждой свече своё значение. Что не имеет практического применения для торговли на следующих свечах.
Нужно из общих принципов понимать какое значение характеристики будет в случае белого шума на данном интервале, а какое уже покажет некий неслучайный эффект.