Различных методов Machine Learning очень много, но все они работают примерно одинаково. Это и нейросети, и леса-деревья, и Байесовские классификаторы, и многое другое. Найти и прочитать как ходят-как сдают, как обучают и проверяют правильность обучения — не проблема.
Но пользователи часто забывают одно правило: мусор на входе — мусор на выходе. Для обучения недостаточно сделать обучающую последовательность с правильными ответами — результатом будут хорошие результаты на обучающей последовательности, и никакие на реальных данных.
Таким образом, мы должны четко себе представлять, чему именно мы учим, и это вовсе не правильные ответы, а правильные ответы на правильные вопросы. Если не хотите получать дурацкие ответы — не задавайте дурацкие вопросы.
Т.е., для обучения МЛ нам нужно сформулировать адекватные вопросы и ответы на них. Только в этом случае метод МЛ реально обучится и будет реально работать не только на обучающейся последовательности.
Вопрос ещё в том, что обычно мы не знаем и правильных вопросов.
Но это дело поправимое Мы формируем какую либо гипотезу, например — три солдата показывают нам то-то и то-то. Мы как-то ищем этих трёх солдат на истории, там же находим ответы на них, обучаем на этом метод МЛ, проверяем на независимом отрезке истории, и выясняем — действительно ли эти 3 солдаты так важны для нашей торговли, или ну их на фиг.
Понятно, что и при обучении и на реале нам надо задавать МЛ только значимые вопросы, а именно, показывать МЛ не все данные подряд, а только наших трёх солдат.
Ну, а если солдаты воевать не желают, проверяем значимость вороны на шесте.) И так, пока действительно не найдем что-то стоящее.
🌍 Техподдержка мирового уровня от SOFL: большой проект для «Лаборатории Касперского»
Друзья, в этом посте делимся подробностями по крупному сервисному проекту с международной ИБ-компанией. Аутсорсинг центр «Софтлайн Коннект» (входит в Группу Софтлайн) обеспечивает техподдержку...
🔍Тенденции на рынке жилья и ипотеки в России — 2025—2026
Аналитический центр ДОМ.РФ подвел итоги жилищной сферы в 2025 году и дал прогноз на 2026-ой.
❓Каким был 2025 г.
1. Выросла доля сделок за наличные и в рассрочку (с 24 до 28% от...
Ресейл Инвест: более 100 млн рублей выданных займов за первые два месяца работы
Платформа «Ресейл Инвест» — новый игрок на рынке инвестиционных займов — показала активный старт. За первые два месяца работы через платформу уже выдано займов на сумму 110 млн рублей....
РУСАГРО: выкупить акции и спасти Мошковича - могут ли акции вырасти на 100% от текущих ценах, подробный разбор
Начинаем покрытие компании РУСАГРО этим постом, надеюсь удастся под микроскопом разглядеть инвестиционную привлекательность или хотя бы сделать пост полезным/интересным. Пост будет длинным,...
🧱 Как лучше вложиться в золото?
Драгметаллы пробуют отскочить после коррекции. Причины для роста есть фундаментальные (альтернатива трежерис, геополитическая неопределённость) и спекулятив...
🧱 Как лучше вложиться в золото?
Драгметаллы пробуют отскочить после коррекции. Причины для роста есть фундаментальные (альтернатива трежерис, геополитическая неопределённость) и спекулятив...
В новом кейсе читайте, как Свой Банк построил гибридную IT-инфраструктуру для высоких нагрузок О компании
Свой Банк — это динамично развивающийся российский необанк. У компании более 63 тысяч клиент...
❓ На маркетплейсы снова нападают, насколько просядут котировки?
Помним про конфликт с банками. Пока он не решён и как будто бы про него все забыли. Теперь включились офлайн-ритейлеры.
📌 ...
Выработка электроэнергии в РФ в 2025г. по Росстату и сильный рост потребления энергии в январе 2026г. Росстат представил данные по выработке электроэнергии в РФ в декабре 2025г.:👉выработка электроэнер...
Выработка электроэнергии в РФ в 2025г. по Росстату и сильный рост потребления энергии в январе 2026г. Росстат представил данные по выработке электроэнергии в РФ в декабре 2025г.:👉выработка электроэнер...
Machine Learning — сила!!!