Datamining алгоритм - что выбрать?
Вопрос к тем, кто использует Датамайнинг алгоритмы, какой вы выбрали, и почему.
От себя отмечу, что выбрал алгоритм Random Forest (деревья делает С 4.5), так как данный алгоритм с моей точки зрения:
1) достаточно хорошо устойчив к шуму данных (видел несколько исследований которые показывают что деревья самый устойчивый алгоритм при повышении шума в данных).
2) Может отделить слабо значимые данные (можно удалить слабозначимые взодящие данные и заменить их более эффективными)
3) Показывает область «неуверенности» — класические деревья показывают только вероятность по одной из моделей.
Если есть те кто кто пользуется подобными алгоритмами — напишите подалуйста свои мысли.
48 |
Читайте на SMART-LAB:
📈 Потенциал роста акций МГКЛ составляет 89% — ИБ Синара
Аналитики Банка Синара обновили оценку по ПАО «МГКЛ» с учётом сильных операционных результатов компании. Новая целевая цена установлена на...
Идеальные коридоры: три картины с прицелом на рост
Один из эффективных способов заработка на рынке — торговля теми акциями, которые движутся в ярко выраженном коридоре. Принципы такой торговли, а...
Палладий + масло, на котором жарили котлеты, = ?
🔬 Команда исследователей из Университета Южной Каролины нашла способ с помощью палладия превратить использованное растительное масло в...
Сбер РПБУ февраль 2026 г. - снижение резервов помогло удержать рекордную прибыль
Сбер опубликовал результаты за 2 месяца работы в 2026 году по РСБУ.
Чистая прибыль за 2 месяца составила 325 млрд руб. (+21,4%). За февраль...