Datamining алгоритм - что выбрать?
Вопрос к тем, кто использует Датамайнинг алгоритмы, какой вы выбрали, и почему.
От себя отмечу, что выбрал алгоритм Random Forest (деревья делает С 4.5), так как данный алгоритм с моей точки зрения:
1) достаточно хорошо устойчив к шуму данных (видел несколько исследований которые показывают что деревья самый устойчивый алгоритм при повышении шума в данных).
2) Может отделить слабо значимые данные (можно удалить слабозначимые взодящие данные и заменить их более эффективными)
3) Показывает область «неуверенности» — класические деревья показывают только вероятность по одной из моделей.
Если есть те кто кто пользуется подобными алгоритмами — напишите подалуйста свои мысли.
49 |
Читайте на SMART-LAB:
AUD/JPY: Медвежье эхо у линии тренда
Кросс-курс AUD/JPY провел прошлую неделю в узком диапазоне. Пара тестировала серией свечных доджи пробитую линию поддержки восходящего канала...
Акция МГКЛ: дарим 100 акций
Если вы ещё не участвовали — сейчас самое время. Условия участия:
— купить от 100 акций $MGKL в период до 30 апреля
— написать пост в...
Средние доходности облигаций в зависимости от кредитного рейтинга. От B- до AA+
👉 Наш канал в MAX 👈
👉 Чат Иволги в MAX 👈
Средние доходности облигаций в зависимости от рейтинга (бледные столбцы...
Русснефть: полицейский разворот прибыли в нефтянке - все видно в 1-м квартале по РСБУ
Русснефть — не самый интересный актив на просторах российского нефтегаза. Мутный мажоритарий, не платит дивиденды, но многих привлекает график, где...