Различных методов Machine Learning очень много, но все они работают примерно одинаково. Это и нейросети, и леса-деревья, и Байесовские классификаторы, и многое другое. Найти и прочитать как ходят-как сдают, как обучают и проверяют правильность обучения — не проблема.
Но пользователи часто забывают одно правило: мусор на входе — мусор на выходе. Для обучения недостаточно сделать обучающую последовательность с правильными ответами — результатом будут хорошие результаты на обучающей последовательности, и никакие на реальных данных.
Таким образом, мы должны четко себе представлять, чему именно мы учим, и это вовсе не правильные ответы, а правильные ответы на правильные вопросы. Если не хотите получать дурацкие ответы — не задавайте дурацкие вопросы.
Т.е., для обучения МЛ нам нужно сформулировать адекватные вопросы и ответы на них. Только в этом случае метод МЛ реально обучится и будет реально работать не только на обучающейся последовательности.
Вопрос ещё в том, что обычно мы не знаем и правильных вопросов.
Но это дело поправимое Мы формируем какую либо гипотезу, например — три солдата показывают нам то-то и то-то. Мы как-то ищем этих трёх солдат на истории, там же находим ответы на них, обучаем на этом метод МЛ, проверяем на независимом отрезке истории, и выясняем — действительно ли эти 3 солдаты так важны для нашей торговли, или ну их на фиг.
Понятно, что и при обучении и на реале нам надо задавать МЛ только значимые вопросы, а именно, показывать МЛ не все данные подряд, а только наших трёх солдат.
Ну, а если солдаты воевать не желают, проверяем значимость вороны на шесте.) И так, пока действительно не найдем что-то стоящее.
Ретейлер представил отчет по МСФО за 4 квартал и весь прошлый год Фикс Прайс (FIXR) ➡️ Инфо и показатели Результаты за 4 квартал — выручка: ₽85,5 млрд (+2,6%) — скорр....
Цена на природный газ на нидерландской бирже TTF взлетела на 31,8%, до $710,8 за тыс. куб. м, после скачка почти на 50%, $539 за тыс. куб. м, накануне. Текущий уровень соответствует максимума...
Мой Рюкзак #64: Усиление в банковском секторе в ожидании справедливой переоценки
Февраль продолжает радовать стоимостных и смелых инвесторов
Прошлый пост тут — smart-lab.ru/company/mozgovik/blog/1265828.php
Было 26,3 млн на 13.02.25
Стало...
Почемц продал Т-Технологии (было 20% портфеля) Т-Техно
по дневным
Тренд с середины февраля слабый
Да,
рентабельность более 30%
Но, покупка Точка банка, вероятно, не вовремя (Точка банк...
Koshchei, не, на 75% останусь в рубле. остальное — золотой эквивалент и замещайки. сейчас голову ломаю над долями внутри рублевой позы (флоатеры, счета и длинные/короткие фиксы). ставки по рублям к...
В оманском порт Дукм из-за атак БПЛА повреждено нефтехранилище — СМИ В оманском порт Дукм из-за атак БПЛА повреждено нефтехранилище, сообщает агентство ONA.
Дукм — крупнейший в султанате Оман тор...
командор,
Я только седня заметила, что usd index второй день резкий рост. Деньги в этот раз побежали не в драг металлы, а в доллар. Надо ждать, пока usd index хотя бы остановится, там уже пробов...
Machine Learning — сила!!!