Сразу скажу что не преследую цель потроллить или еще чего. Я решил проверить популярную стратегию «Торгуй против Василия».
Что я сделал:
1. Спарсил 2000 постов Василия с сайта
2. Посчитал сентимент каждого поста
3. Построил индекс Василия и торговую стратегию
Кому не терпится вот еквити этой стратегии в лучшие времена Василия )
В качестве оценки сентимента я использовал сервис
https://indico.io они дают удобный API. У этого способа есть ряд недостатков, к примеру методы которые предоставляет сервис считают сентимент текста, а не рыночный сентимент, что делает его интерпритацию не весьма очевидной, к примеру Василий может писать что все пропало и инфляция будет расти конскими темпами, сентимент будет негативный, однако для нашего рынка это хорошо. В любом случае поиграться получилось )
Сентимент Василия
Вообще говоря начиная с 16 года Василий все меньше стал писать по рынку, стало больше видео и всяких эфиров на радио. Что сказалось на его сентименте, он сместился в положительную зону. В сравнении с индексом это выглядит так
Собственно стратегия простая, если индекс ниже 0.4 то встаем в лонг по
ММВБ, закрываем лонг когда сентимент поднимается выше 0.5. В шорт не встаем. Сама еквити в начале поста. Можно было еще потестить на
Si и
SPY но лень ) Как видно, много заработать бы не получилось, возможно тут можно много что улучшить, но это в другой раз.
PS: Как-нибудь попробую потестить посты Романа Андреева )
Для оценки сентимента используется превалирование тех или иных лексических единиц? Я так понимаю, что библиотека использует бинарную классификацию.
Единственный недостаток, на мой взгляд, это то, что не учитывается специфика текстов — биржевая торговля. Можно дополнить их словарь самостоятельно и посмотреть, будет ли улучшение.
www.nydailynews.com/new-york/new-york-city-snowfall-total-tracker-article-1.2994206