Ликбез по независимым переменным, степеням свободы и переобученности модели
Пусть есть некоторый поток эмпирических данных. И есть некоторая модель, нацеленная на максимизацию некоторого критерия на этих данных. И в этой модели 100500 параметров (коэффициентов), но значения всех этих параметров получаются («порождаются») в результате вычисления некоторой линейной регрессии, построенной на (работающей с) этих эмпирических данных, то есть эти параметры суть коэффициенты регрессии, а не «ручки, которые мы крутим, настраивая модель».
Вопрос: можно ли в этом случае говорить, что эти 100500 параметров (коэффициентов) являются независимыми переменным и «степеням свободы» модели? И, соответственно, опасаться, что модель «переобучится» — из-за того, что в ней слишком много параметров?
«Переобучить» можно даже модель с одним-единственным параметром. Тут всё довольно сильно зависит от того, как устроена модель и по какому алгоритму она обучается.
Какими 'независимыми переменными'??
Они у Вас на схеме 'нейронными связями' соединены. Наглядно зависимости изображены.
Во временном ряде цен есть внутренняя характеристика, показывающая, можно ли на данном участке каким-либо простым алгоритмом забрать больше, чем отдать, или нет. И все модели со связями лишь помогают точно или не очень получить значение этой характеристики.
Характеристика — усреднённая по интервалу наблюдений. Переобученность будет означать, что Вы не усреднённую уже считаете, а чуть ли не на каждой свече своё значение. Что не имеет практического применения для торговли на следующих свечах.
Нужно из общих принципов понимать какое значение характеристики будет в случае белого шума на данном интервале, а какое уже покажет некий неслучайный эффект.
За первую половину марта российская валюта ослабла к основным на 6-9%. Что на это повлияло и чего ждать дальше — рассказывают аналитики МР. В начале года рубль держался за счет сильного...
Tickmill и TradingView: профессиональный анализ становится бесплатным
Трейдеры часто сталкиваются с дилеммой: либо платить за качественные инструменты анализа, либо довольствоваться урезанными бесплатными версиями. TradingView давно стал стандартом для...
Прощай, промежуточный клиринг! Как 23 марта изменится срочный рынок Московской биржи
Главное: Торги больше не будут прерываться. Все сделки и финансовые результаты за одни сутки будут относиться к одному дню. Увеличиваются сроки для закрытия маржинальных требований....
Макрон: новый французский авианосец назовут «Свободная Франция»
красивый, а почему не Emmanuelle?
www.rbc.ru/rbcfreenews/69bae57d9a79472d334a0cdf?from=newsfeed
formalist, действительно, рубль упал на 10 процентов, нефть выросла за день на 10 и продолжает расти, а рубль падать, защитный актив серебро защищает только от своих же денег, падает уже 2 недели, ...
Они у Вас на схеме 'нейронными связями' соединены. Наглядно зависимости изображены.
Во временном ряде цен есть внутренняя характеристика, показывающая, можно ли на данном участке каким-либо простым алгоритмом забрать больше, чем отдать, или нет. И все модели со связями лишь помогают точно или не очень получить значение этой характеристики.
Характеристика — усреднённая по интервалу наблюдений. Переобученность будет означать, что Вы не усреднённую уже считаете, а чуть ли не на каждой свече своё значение. Что не имеет практического применения для торговли на следующих свечах.
Нужно из общих принципов понимать какое значение характеристики будет в случае белого шума на данном интервале, а какое уже покажет некий неслучайный эффект.