Задачка по скринингу
Вам дали 10000 числовых рядов формата (календарная дата; число) и предложили рассортировать их пополам на «похожие на (цены) американские акции» и непохожие. Или, скажем, «более похожие» и «менее похожие». Как вы будете это делать?
228
Читайте на SMART-LAB:
Совкомфлот: танкеры сошли с якоря - текущий год будет ЛУЧШЕ предыдущего, вопрос насколько и стоит ли покупать акции?
Совкомфлот отчитался за 4-й квартал 2025 года — компания продолжает работать в 0 на операционном уровне (всему виной прощальные SDN санкции...
Какая часть сбережений граждан может перейти на рынок недвижимости?
Реконцепция ТЦ «Сокольники»: через тернии к звёздам
«Если важный проект выпадает на сложные времена, он становится великим», — кто-то из классиков 😉 Проект реконцепции ТЦ «Сокольники» застал...
Татнефть отчиталась по МСФО за 2025 год: всё по прогнозу, но главный вопрос — что дальше при текущих ценах на нефть.
Татнефть отчиталась по МСФО — в целом без сюрпризов и ровненько по прогнозу (я оказался ближе всех). Прогноз публиковал в нефтяном срезе...
2. Вычислить меру похожести для каждого из рядов.
3. Рассортировать.
Самое сложное/интересное, конечно, в первом пункте. Тут вся загвоздка: «похожесть» это абстракция, кто как её формализовал, тот так и понимает. Так что тот кто «заказывает» сортировку тот и должен предоставить формализацию ну или хотя бы что больше конкретики про понятие «похожие».
«как вы эту похожесть планируете использовать» — хочу разделить ценовые ряды реальных американских акций на такие, которые ведут себя «нормально», и такие, которые ведут себя «не нормально».
Вот, идея-то здравая! Были у меня у самого подобные мысли. Я так чисто сначала докопался, сорри). Ну как по мне не хватило условий в задаче для её решения). Терь хватает).
Если теперь по существу: Ну тут много нюансов. Дальше что-то типа мозгового штурма:
Думаю, «нормально» может быть не одно. Думаю, возможно несколько точек притяжения и, думаю, так правильнее будет делать. Можно придумать какие-то метрики, характеризующие ценовой ряд (причем не за всю историю, а на некотом участке, т.е. по факту это акция в некотором состоянии, которое можно разложить на «характер» акции + примесь каких-то внешних факторов), дальше можно попробовать кластеризовать с помощью ML. Если модель сможет вычленить точки притяжения (кластеры), дальше уже будет и мера похожести — по факту расстояние до центра кластера. Дальше надо смотреть, экспериментировать. Смотреть как меняется в динамике эта мера, может там какие-то паттерны в этом. Дальше можно разные типы стратегий для разных кластеров смотреть — где какая лучше ложится. И т.д., дальше сложнее фантазировать, потому что всё туманней становится, дальше нужно фантзировать уже по ходу исследований).