Datamining алгоритм - что выбрать?
Вопрос к тем, кто использует Датамайнинг алгоритмы, какой вы выбрали, и почему.
От себя отмечу, что выбрал алгоритм Random Forest (деревья делает С 4.5), так как данный алгоритм с моей точки зрения:
1) достаточно хорошо устойчив к шуму данных (видел несколько исследований которые показывают что деревья самый устойчивый алгоритм при повышении шума в данных).
2) Может отделить слабо значимые данные (можно удалить слабозначимые взодящие данные и заменить их более эффективными)
3) Показывает область «неуверенности» — класические деревья показывают только вероятность по одной из моделей.
Если есть те кто кто пользуется подобными алгоритмами — напишите подалуйста свои мысли.
48 |
Читайте на SMART-LAB:
Стратегия на II квартал 2026 года. Рынок акций
Алексей Девятов Инвестиционная Стратегия на II квартал 2026 года предлагает ориентиры для управления портфелем. Ведущие аналитики...
Займер: более 80% желающих взять займы столкнулись с отказом по кредиту за последний год
Делимся свежей аналитикой, которую Займер собрал для ТАСС в ходе опроса. 📝 За последний год 85,3% россиян, желающих взять займы, хотя бы...
ПАО «ЭсЭфАй» погасило казначейские акции в размере 3,2% уставного капитала
Решение о погашении казначейских акций холдинга в размере 1 614 614 штук было принято акционерами на общем собрании 14 декабря 2025 года.
С 3...
Ваш любимый Мозговой штурм спешит на помощь! Мнение по текущему рынку простыми словами
В нашем рейтинге акций знаменательное событие! Рекордное число акций с рейтингом 4 — 14 штук!!!
И, вероятно, будет еще больше!
Сегодня я...