Блог им. sgluhov

Datamining алгоритм - что выбрать?

Вопрос к тем, кто использует Датамайнинг алгоритмы, какой вы выбрали, и почему.

От себя отмечу, что выбрал алгоритм Random Forest (деревья делает С 4.5), так как данный алгоритм с моей точки зрения:
1) достаточно хорошо устойчив к шуму данных (видел несколько исследований которые показывают что деревья самый устойчивый алгоритм при повышении шума в данных).
2) Может отделить слабо значимые данные (можно удалить слабозначимые взодящие данные и заменить их более эффективными)
3) Показывает область «неуверенности» — класические деревья показывают только вероятность по одной из моделей.

Если есть те кто кто пользуется подобными алгоритмами — напишите подалуйста свои мысли.
48 | ★3

Читайте на SMART-LAB:
Фото
Экспортёры в Индексе МосБирже. Кто выигрывает от более слабого рубля
Новости о вероятном ужесточении бюджетного правила уже привели к заметному ослаблению рубля. На этом фоне мы решили рассмотреть, кому в Индексе...
🖥 Ростелеком: в ожидании выхода "дочек"
Интернет-провайдер отчитался по МСФО за 4 квартал и весь год   Ростелеком (RTKM) ➡️ Инфо и показатели     Результаты за 4 квартал —...
ГК «Самолет»: завершение оформления наследственных прав
Друзья, привет! ОМД-Капитал, family office сооснователя ПАО ГК «Самолет» Михаила Борисовича Кенина, сообщает о завершении оформления...
Фото
Какие юаневые облигации можно приобрести на фоне ужесточения бюджетного правила?

теги блога sgluhov

....все тэги



UPDONW
Новый дизайн