Объём данных
В последние недели очень увлекла возможность анализировать настроение рынка с помощью ключевых слов, которые встречаются в комментариях Пульсе. Из миллиона постов, которые мы обрабатывали (с помощью Claude), только 156,000 были использованы для статистического подбора фраз, потому что остальные были связаны с новостями ил другим шумом.
Для анализа использовались 6 активов: Индекс МосБиржи, Сбербанк, Газпром, Нефть Brent, Газ (NG), USD/RUB с января 2021 по июнь 2026.
Как найти ключевые фразы и слова ?
Мы разделили цены в каждом активе на 4 фазы. Каждый день каждого актива мы отнесли к одной из фаз по импульсу цены и глубине просадки от максимума:
Рост: цена уверенно растёт, но ещё не у пика.
Эйфория: цена у локального максимума после роста.
Падение: резкое снижение, но просадка ещё неглубокая.
Дно: глубокая просадка от максимума и продолжающееся падение.
Мы привязали каждый пост к фазе того дня, в который он был написан, и посчитали, какие слова встречаются в каждой фазе чаще всего. Для этого использовали метрику lift: во сколько раз слово появляется в данной фазе чаще, чем в среднем по всем постам. Если lift больше единицы — слово характерно именно для этой фазы.
Из словаря мы выбросили всё, что не универсально: сырьёвой фон (баррель, запасы), новости и геополитику (Иран, санкции, пошлины), тикеры и рекламу каналов. Осталось только то, что описывает эмоции и работает для любого актива.
Какие слова доминируют в каждой фазе ?
На росте актива: «ралли, оптимизм, зелёный, позитив, потенциал, апсайд, иксы, уверен, держу».
На пике актива: На вершине цены доминируют слова-предупреждения: «перекуплено, жду откат, фиксирую, коррекция, хай, максимум».
На падении актива: «слабо, вяло, осторожно, сомневаюсь, снижение, отскок, выкуп, докупаю, жду, распродажа».
На дне актива: «днище, льют, сливают, усредняю, паника, отчаяние, капец, жесть».
Самое важное: центры четырёх ценовых фаз легли каждый в свой квадрант, как видно на картинке (рост — право-низ, эйфория — право-верх, страх — лево-низ, капитуляция — лево-верх). То есть действительно существует язык толпы, который разделяет фазы так же, как движение цены. Это подтверждает, что действительно в каждой фазе рынка доминируют определенные эмоции, слова и фразы .
Карта настроения рынка
На графиках зоны раскрашены по словам. Логика трёх цветов:
-Зелёный: бычьи слова (оптимизм и эйфория)
— Красный: медвежьи слова (страх).
— Фиолетовый (пик боли): Когда доля слов капитуляции резко превышает свою норму, день красится фиолетовым. Так выделяются только самые острые моменты паники.
Один важный технический момент: бычьи и медвежьи настроения мы сравниваем не по «голым долям» слов — там оптимизм всегда впереди просто потому, что его пишут чаще, а по отклонению каждого настроения от его собственной нормы. Только так сравнение становится честным.
Как вам результат и исследование ?
Мы пока подумаем, как можно еще улучшить подобную систему, если ее использовать.
Если у вас есть мысли или идеи, то пишите в комментариях, мы всегда это ценим.
https://t.me/MSCinsider — телеграмм канал
Mscinsider.com — мониторим позиции участников рынка
Господа, огромнейшее спасибо!
Чрезвычайно увлекательно!