Вам дали 10000 числовых рядов формата (календарная дата; число) и предложили рассортировать их пополам на «похожие на (цены) американские акции» и непохожие. Или, скажем, «более похожие» и «менее похожие». Как вы будете это делать?
1. Нужно выработать меру похожести.
2. Вычислить меру похожести для каждого из рядов.
3. Рассортировать.
Самое сложное/интересное, конечно, в первом пункте. Тут вся загвоздка: «похожесть» это абстракция, кто как её формализовал, тот так и понимает. Так что тот кто «заказывает» сортировку тот и должен предоставить формализацию ну или хотя бы что больше конкретики про понятие «похожие».
Replikant_mih, Естественно, речь о «мере похожести», только задачка в том и состоит, чтобы вы её сформулировали. Если бы она была предоставлена «заказчиком», то вообще никакой задачки бы не было: вычислить и рассортировать это вообще не задачка.
Ivan FXS, Ну, например, я возьму российские акции, посчитаю среднюю цену по ним в среднем по рядам, сделаю то же по американским. Например, американская средняя будет ниже, я посчитаю мерой похожести близость средней цены ряда к нулю. И буду прав для этого критерия похожести. Но вас же такой вариант не устроит. Но я же не знаю, что у вас за «похожесть» в голове. Ну или не знаю, как вы эту похожесть планируете использовать, тогда бы меру похожести я бы вырабатывал под критерий целей дальнейшего использования — тоже совсем другое дело.
Replikant_mih, «возьму… акции, посчитаю среднюю цену по ним в среднем по рядам» — получите для каждой акции некое число, все числа будут разными… и что это дает?
«как вы эту похожесть планируете использовать» — хочу разделить ценовые ряды реальных американских акций на такие, которые ведут себя «нормально», и такие, которые ведут себя «не нормально».
хочу разделить ценовые ряды реальных американских акций на такие, которые ведут себя «нормально», и такие, которые ведут себя «не нормально».
Вот, идея-то здравая! Были у меня у самого подобные мысли. Я так чисто сначала докопался, сорри). Ну как по мне не хватило условий в задаче для её решения). Терь хватает).
Если теперь по существу: Ну тут много нюансов. Дальше что-то типа мозгового штурма:
Думаю, «нормально» может быть не одно. Думаю, возможно несколько точек притяжения и, думаю, так правильнее будет делать. Можно придумать какие-то метрики, характеризующие ценовой ряд (причем не за всю историю, а на некотом участке, т.е. по факту это акция в некотором состоянии, которое можно разложить на «характер» акции + примесь каких-то внешних факторов), дальше можно попробовать кластеризовать с помощью ML. Если модель сможет вычленить точки притяжения (кластеры), дальше уже будет и мера похожести — по факту расстояние до центра кластера. Дальше надо смотреть, экспериментировать. Смотреть как меняется в динамике эта мера, может там какие-то паттерны в этом. Дальше можно разные типы стратегий для разных кластеров смотреть — где какая лучше ложится. И т.д., дальше сложнее фантазировать, потому что всё туманней становится, дальше нужно фантзировать уже по ходу исследований).
Весенняя корректировка отраслевого портфеля самых перспективных акций 2026
Обновим портфель бумаг из различных секторов рынка, обладающий максимальным прогнозным фундаментальным потенциалом годовой доходности. Новые вводные и цели Индекс МосБиржи с начала года +4%,...
Почти половина россиян испытывает стресс при подготовке к свиданиям
Пятничный пост от нас. Дейтинг сервис Мамба и аналитики платформы психологической поддержки и управления состоянием «Просебя» (входит в Группу Ренессанс Страхование) провели опрос* среди россиян...
Друзья, привет!
🔥 Пока вы продолжаете следить за ценами на сырье и валютой — наш кредитный рейтинг возвращается к исходному стабильному прогнозу.
⚡️Рейтинговое агентство НКР изменило...
ЛУКОЙЛ: капитал за год упал на 3 триллиона рублей - списали иностранные активы, но все ли так плохо? Ушла эпоха, разбираемся вместе
ЛУКОЙЛ отчитался по МСФО — долгожданный отчет, все ждали сюрприза после SDN санкций (будут ли списывать активы и увидим ли убыток)
Увидели!
Как всегда — дьявол в мелочах, но...
я просто смотрю, все выпуски от 32го года и дальше дают доходность в среднем на 0.49% меньше ставки. И только 238й выпуск на 1.3% меньше.
я же когда-то в надежде что двинется ближе к толпе ушёл из ...
greedy_gnom, в 2016 средний курс немного ниже (берём открытие года и закрытие года, считаем среднюю), почему вы берёте 0.6255, а не саму инфляцию 0.3745/умножение на 1.3745 (если вы хотите сделать ...
Думаю купить ММК но непонятно когда) Мож до 25 додавят? тогда бы сразу набрал) Жирный Жэк поди тоже собрался брать, раз на всех углах воздух портит )))) (хотя мож это чисто физиологическое))
ЕвроТранс: — Будущее за электротранспортом.
В настоящее время в эксплуатацию введены 51 быстрая электрозарядная станция (ЭЗС),
на которых установлено 172 точки для быстрой зарядки (мощностью ...
Доллар укрепился с 87 рублей до 83 данные от 19 марта, трейдеры крайне возбудились на фоне роста доллара, очередной перекос настроений балансируется, а сказочки как всегда новые появятся по причинам.....
ИКС5 - смотрим последний отчет и решаем, что делать с акцией!
На днях компания выложила свежий отчет за 2025 год. Давайте разберём его, а так же проанализируем котировки и дивиденды, чтобы понять, ...
2. Вычислить меру похожести для каждого из рядов.
3. Рассортировать.
Самое сложное/интересное, конечно, в первом пункте. Тут вся загвоздка: «похожесть» это абстракция, кто как её формализовал, тот так и понимает. Так что тот кто «заказывает» сортировку тот и должен предоставить формализацию ну или хотя бы что больше конкретики про понятие «похожие».
«как вы эту похожесть планируете использовать» — хочу разделить ценовые ряды реальных американских акций на такие, которые ведут себя «нормально», и такие, которые ведут себя «не нормально».
Вот, идея-то здравая! Были у меня у самого подобные мысли. Я так чисто сначала докопался, сорри). Ну как по мне не хватило условий в задаче для её решения). Терь хватает).
Если теперь по существу: Ну тут много нюансов. Дальше что-то типа мозгового штурма:
Думаю, «нормально» может быть не одно. Думаю, возможно несколько точек притяжения и, думаю, так правильнее будет делать. Можно придумать какие-то метрики, характеризующие ценовой ряд (причем не за всю историю, а на некотом участке, т.е. по факту это акция в некотором состоянии, которое можно разложить на «характер» акции + примесь каких-то внешних факторов), дальше можно попробовать кластеризовать с помощью ML. Если модель сможет вычленить точки притяжения (кластеры), дальше уже будет и мера похожести — по факту расстояние до центра кластера. Дальше надо смотреть, экспериментировать. Смотреть как меняется в динамике эта мера, может там какие-то паттерны в этом. Дальше можно разные типы стратегий для разных кластеров смотреть — где какая лучше ложится. И т.д., дальше сложнее фантазировать, потому что всё туманней становится, дальше нужно фантзировать уже по ходу исследований).