Datamining алгоритм - что выбрать?
Вопрос к тем, кто использует Датамайнинг алгоритмы, какой вы выбрали, и почему.
От себя отмечу, что выбрал алгоритм Random Forest (деревья делает С 4.5), так как данный алгоритм с моей точки зрения:
1) достаточно хорошо устойчив к шуму данных (видел несколько исследований которые показывают что деревья самый устойчивый алгоритм при повышении шума в данных).
2) Может отделить слабо значимые данные (можно удалить слабозначимые взодящие данные и заменить их более эффективными)
3) Показывает область «неуверенности» — класические деревья показывают только вероятность по одной из моделей.
Если есть те кто кто пользуется подобными алгоритмами — напишите подалуйста свои мысли.
43 |
Читайте на SMART-LAB:
Операционные результаты Группы «Аэрофлот» за ноябрь 2025 года
✈️ Объем перевозок вырос на 2,8% по сравнению с ноябрем 2024 года и достиг 4,1 млн пассажиров. ✈️ На внутренних линиях перевезено 3,0 млн...
Валютные облигации, как не попасть впросак и получить ожидаемую доходность?
Робот для уплаты комиссий брокеру за маржинальную торговлю, в тестере OsEngine.
Рассмотрим робот PayOfMarginBot , который предназначен для ежедневного расчета маржинальной комиссии при тестировании стратегий в OsEngine. Этот...