Datamining алгоритм - что выбрать?
Вопрос к тем, кто использует Датамайнинг алгоритмы, какой вы выбрали, и почему.
От себя отмечу, что выбрал алгоритм Random Forest (деревья делает С 4.5), так как данный алгоритм с моей точки зрения:
1) достаточно хорошо устойчив к шуму данных (видел несколько исследований которые показывают что деревья самый устойчивый алгоритм при повышении шума в данных).
2) Может отделить слабо значимые данные (можно удалить слабозначимые взодящие данные и заменить их более эффективными)
3) Показывает область «неуверенности» — класические деревья показывают только вероятность по одной из моделей.
Если есть те кто кто пользуется подобными алгоритмами — напишите подалуйста свои мысли.
47 |
Читайте на SMART-LAB:
Стратегия 2026. Часть I: извлекаем правильные уроки из ошибок 2025
Those who cannot remember the past are condemned to repeat it - © George Santayana, 1905
В начале 2026 года у нас на руках стратегии 13...
Спекуляции 2026: драгметаллы и рубль
2025 год выдался для меня не урожайным на спекуляции. В начале весны избавился от избытка акций в портфеле Акции / Деньги, со второй...
Природный газ: покупателям приготовиться к выходу?
Котировки газа продолжают нисходящее движение к нижней границе широкого торгового коридора. Сейчас контроль над ситуацией полностью в руках...
Инвест идея по тренду длиной в 1 день или бесконечность - шанс заработать с минимальным риском?
Новый год — время новых инвест идей спекулятивного характера
Держите одну из них (сам взял сегодня на спекулятивный счет, скину если алюминий...