Ликбез по независимым переменным, степеням свободы и переобученности модели
Пусть есть некоторый поток эмпирических данных. И есть некоторая модель, нацеленная на максимизацию некоторого критерия на этих данных. И в этой модели 100500 параметров (коэффициентов), но значения всех этих параметров получаются («порождаются») в результате вычисления некоторой линейной регрессии, построенной на (работающей с) этих эмпирических данных, то есть эти параметры суть коэффициенты регрессии, а не «ручки, которые мы крутим, настраивая модель».
Вопрос: можно ли в этом случае говорить, что эти 100500 параметров (коэффициентов) являются независимыми переменным и «степеням свободы» модели? И, соответственно, опасаться, что модель «переобучится» — из-за того, что в ней слишком много параметров?
«Переобучить» можно даже модель с одним-единственным параметром. Тут всё довольно сильно зависит от того, как устроена модель и по какому алгоритму она обучается.
Какими 'независимыми переменными'??
Они у Вас на схеме 'нейронными связями' соединены. Наглядно зависимости изображены.
Во временном ряде цен есть внутренняя характеристика, показывающая, можно ли на данном участке каким-либо простым алгоритмом забрать больше, чем отдать, или нет. И все модели со связями лишь помогают точно или не очень получить значение этой характеристики.
Характеристика — усреднённая по интервалу наблюдений. Переобученность будет означать, что Вы не усреднённую уже считаете, а чуть ли не на каждой свече своё значение. Что не имеет практического применения для торговли на следующих свечах.
Нужно из общих принципов понимать какое значение характеристики будет в случае белого шума на данном интервале, а какое уже покажет некий неслучайный эффект.
Доллар как бенефициар нефтяного шока: почему рынок снова идет в защиту
Во вторник укрепление доллара выглядело не просто реакцией на рост глобальной тревожности, а результатом наложения сразу факторов. Первый — классический спрос на защитный актив на фоне риска...
Brent по $90, Urals по $61, а золото по $6000: к чему может привести конфликт на Ближнем Востоке
Из-за известных военных событий вокруг Ирана в начале недели произошел скачок цен на нефть на 8,5%: стоимость Brent достигла $80/барр. – самый высокий уровень с января 2025 года. Активные...
Какие инвестидеи открывает война в Иране: видеообзор аналитика Т-Инвестиций
Какие инвестидеи открывает война в Иране: видеообзор аналитика Т-Инвестиций
Новая война на Ближнем Востоке может пойти по разным сценариям — от этого зависит, какие активы и как будут...
Vsevolod Voronin,
Мне нравится бондфинам.ру, там всё есть и всё понятно, единственное, что не устраивает, это нет как в смартлабе, доходностей по всем выпускам на одной странице. Хотя, да он в п...
По технике «двойное дно», теханализ работает. Тем более, ещё с дивотсечки бумага не восстановилась. Так долго обычно бумаги по статистике не лежат на лоях. А если 80% толпы считает, что бумага пойдёт ...
Давно пора повысить. Раза в два, а то и в три.
И, думаю, это будет сделано в ближайшее время вслед за налогами и пошлинами.
Социалистическая сказка заканчивается спустя 30 лет переходного пе...
Они у Вас на схеме 'нейронными связями' соединены. Наглядно зависимости изображены.
Во временном ряде цен есть внутренняя характеристика, показывающая, можно ли на данном участке каким-либо простым алгоритмом забрать больше, чем отдать, или нет. И все модели со связями лишь помогают точно или не очень получить значение этой характеристики.
Характеристика — усреднённая по интервалу наблюдений. Переобученность будет означать, что Вы не усреднённую уже считаете, а чуть ли не на каждой свече своё значение. Что не имеет практического применения для торговли на следующих свечах.
Нужно из общих принципов понимать какое значение характеристики будет в случае белого шума на данном интервале, а какое уже покажет некий неслучайный эффект.