Блог им. alex09x

Классификация ТС

Развлекался вчера с алгоритмами классификации. Для проверки решил взять данные из профиля участников http://smart-lab.ru/ конкретно график P&L. Робот собрал данные из профиля участников и запустил процесс автоматической классификации. В результате было получено более 10 классов, 3 из которых доминируют.

Классификация ТС 
Класс 1

Классификация ТС 
Класс 2

Классификация ТС 
Класс 3 


Вопрос:
1. как бы вы охарактеризовали каждый класс
2. как вы нормализуете данные для классификации
3. какие алгоритмы используете для оценки временных рядов 
81
13 комментариев
1. Новичкам/дуракам всегда везет
2. Учился, учился и все еще учусь
3. Граальный робот. Слил, с-ка все, что нажито непосильным трудом
avatar
Какова популяция доминирующих классов? Размер общей выборки? Класс с горизонтальным P&L сами отбросили? Ведь большинство не заполняют этот график.
avatar
r0man, выборка в районе сотен экземпляров. выбраны били только профили с динамикой.
1) Интутивная торговля. В данный момент «работа на дядю».
2) Искал грааль, нашел, при 600% съехала крыша...
3) «Системы иногда перестают работать»
avatar
Morosso, формулы как таковой нет, думайте что это многочлен. в рынке слишком много данных по этому я задал вопрос номер 2.
Александр, а по какому признаку (признакам) тогда выполнена классификация. Или робот тупо искал «похожие» кривые доходностей. Сделали работу — делитесь подробностями. Какие данные робот собирал, какие вы признаки сформировали, какой алгоритм классификации использовали.
avatar
r0man, классификация без учителя. к сожалению подробности рассказывать не буду, нюансы это часть очередной ТС.
Александр, получается, что вы решаете задачу кластеризации. В найденных кластерах будете смотреть, как ведет себя цена, допустим. Потом из кластеров с похожими направлениями цен, можно будет выделить набор признаков для прогноза. Это мои предположения, может у вас все по другому. Я тоже для «очередной ТС» пилю машин лернинг, но выбрал обучение с учителем. Данные особо не нормализую, но делаю препроцессинг методом главных компонент.
avatar
r0man, да, мне успешная классификация без «знания признаков»… не видел такого.
avatar
Morosso, к сожалению у меня не было МЛ в универе. ткните в книжку если знаете хорошую.

Читайте на SMART-LAB:
Фото
Т-тех покупает Точку
Т-технологии планируют консолидировать 100% акций АО “Точка”.  Компания объявила о намерении приобрести одну из самых быстрорастущих финансовых...
Фото
Оценки вероятностей дефолтов от российских рейтинговых агентств
Во вчерашнем посте мы посмотрели статистику рейтинговых действий за прошедший год, сегодня хочется ещё раз обратить внимание, что эти...
Сообщаем результаты оферты по выпуску облигаций серии БО-П13
Друзья, привет! ⚡️Делимся итогами оферты по выпуску наших облигаций серии БО-П13. В рамках оферты мы погасили облигации на общую сумму в 15,2...
Фото
Хэдхантер. Ситуация на рынке труда в январе. Хуже - чем просто хуже некуда
Вышла статистика рынка труда за январь 2026 года, которую Хедхантер публикует ежемесячно, что же там интересного: Динамика hh.индекса...

теги блога Михаил Пиписькин

....все тэги



UPDONW
Новый дизайн