3Qu
3Qu личный блог
01 января 2021, 22:30

Как работает Machine Learning.

Различных методов Machine Learning очень много, но все они работают примерно одинаково. Это и нейросети, и леса-деревья, и Байесовские классификаторы, и многое другое. Найти и прочитать как ходят-как сдают, как обучают и проверяют правильность обучения — не проблема.
Но пользователи часто забывают одно правило: мусор на входе — мусор на выходе. Для обучения недостаточно сделать обучающую последовательность с правильными ответами — результатом будут хорошие результаты на обучающей последовательности, и никакие на реальных данных.
Таким образом, мы должны четко себе представлять, чему именно мы учим, и это вовсе не правильные ответы, а правильные ответы на правильные вопросы. Если не хотите получать дурацкие ответы — не задавайте дурацкие вопросы.

Т.е., для обучения МЛ нам нужно сформулировать адекватные вопросы и ответы на них. Только в этом случае метод МЛ реально обучится и будет реально работать не только на обучающейся последовательности.
Вопрос ещё в том, что обычно мы не знаем и правильных вопросов.
Но это дело поправимое  Мы формируем какую либо гипотезу, например — три солдата показывают нам то-то и то-то. Мы как-то ищем этих трёх солдат на истории, там же находим ответы на них, обучаем на этом метод МЛ, проверяем на независимом отрезке истории, и выясняем — действительно ли эти 3 солдаты так важны для нашей торговли, или ну их на фиг.
Понятно, что и при обучении и на реале нам надо задавать МЛ только значимые вопросы, а именно, показывать МЛ не все данные подряд, а только наших трёх солдат.
Ну, а если солдаты воевать не желают, проверяем значимость вороны на шесте.) И так, пока действительно не найдем что-то стоящее.
26 Комментариев
  • gurovofficial
    01 января 2021, 22:39
    Сразу видно новичков:) машинленинг и диипленинг разные вещи, а вы в кашу замещали всё:)
  • bocha
    01 января 2021, 22:40
    Представил трех солдат. Представил, что они могут показать... 
    Machine Learning — сила!!!
  • Иван Файртрейдов
    02 января 2021, 00:14
    Диплернинг тоже вроде неоднороден, несколько метод, по идее при скармливании достаточных данных должен быть не хуже человека, с чистых мд дак точно
  • Roman Ivanov
    02 января 2021, 00:23
    Началось с ML, а потом перетекло «мы формулирует гипопезу». И где же тут сила ML?

Активные форумы
Что сейчас обсуждают

Старый дизайн
Старый
дизайн