Задачка по скринингу

28 января 2023, 20:35
|
Ivan FXS

Вам дали 10000 числовых рядов формата (календарная дата; число) и предложили рассортировать их пополам на «похожие на (цены) американские акции» и непохожие. Или, скажем, «более похожие» и «менее похожие». Как вы будете это делать?

Данная публикация является личным мнением автора. Мнение владельца сайта может не совпадать с мнением автора.

231

6 комментариев

1. Нужно выработать меру похожести.
2. Вычислить меру похожести для каждого из рядов.
3. Рассортировать.

Самое сложное/интересное, конечно, в первом пункте. Тут вся загвоздка: «похожесть» это абстракция, кто как её формализовал, тот так и понимает. Так что тот кто «заказывает» сортировку тот и должен предоставить формализацию ну или хотя бы что больше конкретики про понятие «похожие».

Replikant_mih

28 января 2023, 20:50
Ответить

Replikant_mih, Естественно, речь о «мере похожести», только задачка в том и состоит, чтобы вы её сформулировали. Если бы она была предоставлена «заказчиком», то вообще никакой задачки бы не было: вычислить и рассортировать это вообще не задачка.

Ivan FXS

28 января 2023, 21:28
Ответить

Ivan FXS, Ну, например, я возьму российские акции, посчитаю среднюю цену по ним в среднем по рядам, сделаю то же по американским. Например, американская средняя будет ниже, я посчитаю мерой похожести близость средней цены ряда к нулю. И буду прав для этого критерия похожести. Но вас же такой вариант не устроит. Но я же не знаю, что у вас за «похожесть» в голове. Ну или не знаю, как вы эту похожесть планируете использовать, тогда бы меру похожести я бы вырабатывал под критерий целей дальнейшего использования — тоже совсем другое дело.

Replikant_mih

28 января 2023, 22:12
Ответить

Replikant_mih, «возьму… акции, посчитаю среднюю цену по ним в среднем по рядам» — получите для каждой акции некое число, все числа будут разными… и что это дает?

«как вы эту похожесть планируете использовать» — хочу разделить ценовые ряды реальных американских акций на такие, которые ведут себя «нормально», и такие, которые ведут себя «не нормально».

Ivan FXS

28 января 2023, 22:19
Ответить

Ivan FXS,

хочу разделить ценовые ряды реальных американских акций на такие, которые ведут себя «нормально», и такие, которые ведут себя «не нормально».

Вот, идея-то здравая! Были у меня у самого подобные мысли. Я так чисто сначала докопался, сорри). Ну как по мне не хватило условий в задаче для её решения). Терь хватает).

Если теперь по существу: Ну тут много нюансов. Дальше что-то типа мозгового штурма:

Думаю, «нормально» может быть не одно. Думаю, возможно несколько точек притяжения и, думаю, так правильнее будет делать. Можно придумать какие-то метрики, характеризующие ценовой ряд (причем не за всю историю, а на некотом участке, т.е. по факту это акция в некотором состоянии, которое можно разложить на «характер» акции + примесь каких-то внешних факторов), дальше можно попробовать кластеризовать с помощью ML. Если модель сможет вычленить точки притяжения (кластеры), дальше уже будет и мера похожести — по факту расстояние до центра кластера. Дальше надо смотреть, экспериментировать. Смотреть как меняется в динамике эта мера, может там какие-то паттерны в этом. Дальше можно разные типы стратегий для разных кластеров смотреть — где какая лучше ложится. И т.д., дальше сложнее фантазировать, потому что всё туманней становится, дальше нужно фантзировать уже по ходу исследований).

Replikant_mih

28 января 2023, 22:29
Ответить

Читайте на SMART-LAB:

GBP/USD: Импульс пробоя открывает путь к затяжной коррекции

«Старый джентльмен» все-таки оттолкнулся от сопротивления 1.3560, которое не поддавалось штурму несколько недель. Сейчас пара пробила...

Олег Свиргун

22:18

Золото и серебро остаются в «бычьем» тренде

На торгах 13 мая котировки золота подорожало на 0,37%, до $4703,9 за тройскую унции, при повышении индекса доллара США DXY на 0,16%, в район 98...

Freedom Finance Global

11:37

В России хотят изменить правила страхования жилья от природных бедствий

Сейчас законопроект об обязательном страховании жилья от ЧС рассматривают Минфин, МЧС, Банк России и Всероссийский союз страховщиков. После...

Ренессанс страхование

12:20

Нефтяной срез: выпуск №9. Ормуз перекрыт, но акции нефтегаза падают. Надо ли покупать или сидеть на заборе в LQDT? Ищем лучших в секторе, где растет прибыль!

Продолжаю выпускать рубрику — Нефтяной срез. Цель: отслеживать важные бенчмарки в нефтяной отрасли, чтобы понимать куда дует ветер. Прошлый пост:...

Олег Кузьмичев

22:43

Ленты

Форумы

Участники

Котировки

Акции

Календарь

Информация

Книги

Задачка по скринингу

полезные записи за 24 часа

Лучшие записи за 24 часа

самые обсуждаемые сегодня

теги блога Ivan FXS

Авторизация

Ленты

Форумы

Участники

Котировки

Акции

Календарь

Информация

Книги

Задачка по скринингу

полезные записи за 24 часа

Лучшие записи за 24 часа

самые обсуждаемые сегодня

теги блога Ivan FXS