Блог им. egenui

Анализ сентимента Василия на R

Сразу скажу что не преследую цель потроллить или еще чего. Я решил проверить популярную стратегию «Торгуй против Василия».

Что я сделал:

1. Спарсил 2000 постов Василия с сайта
2. Посчитал сентимент каждого поста
3. Построил индекс Василия и торговую стратегию

Кому не терпится вот еквити этой стратегии в лучшие времена Василия )
Анализ сентимента Василия на R

В качестве оценки сентимента я использовал сервис https://indico.io они дают удобный API. У этого способа есть ряд недостатков, к примеру методы которые предоставляет сервис считают сентимент текста, а не рыночный сентимент, что делает его интерпритацию не весьма очевидной, к примеру Василий может писать что все пропало и инфляция будет расти конскими темпами, сентимент будет негативный, однако для нашего рынка это хорошо. В любом случае поиграться получилось )

Сентимент Василия

Анализ сентимента Василия на R

Вообще говоря начиная с 16 года Василий все меньше стал писать по рынку, стало больше видео и всяких эфиров на радио. Что сказалось на его сентименте, он сместился в положительную зону. В сравнении с индексом это выглядит так

Анализ сентимента Василия на R

Собственно стратегия простая, если индекс ниже 0.4 то встаем в лонг по ММВБ, закрываем лонг когда сентимент поднимается выше 0.5. В шорт не встаем. Сама еквити в начале поста. Можно было еще потестить на Si и SPY но лень ) Как видно, много заработать бы не получилось, возможно тут можно много что улучшить, но это в другой раз.

PS: Как-нибудь попробую потестить посты Романа Андреева )

  • Ключевые слова:
  • DrVaska
★9
14 комментариев
Да это грааль)
avatar
Отличный анализ, спасибо.

Для оценки сентимента используется превалирование тех или иных лексических единиц? Я так понимаю, что библиотека использует бинарную классификацию.

Единственный недостаток, на мой взгляд, это то, что не учитывается специфика текстов — биржевая торговля. Можно дополнить их словарь самостоятельно и посмотреть, будет ли улучшение.
avatar
zerohedge, да, именно в специфике текста вся проблема, я возможно как-нибудь займусь и размечу посты топовых писателей на СЛ вручную, и уже буду решать задачу на размеченных данных строя индекс сентимента всего СЛ
avatar
Супер, это что-то новое. А давайте еще анализировать твиты сами знаете кого.
avatar
Uncle Fedor, пожалуйста https://github.com/maxbbraun/trump2cash
avatar
автоследование сделаете?)
avatar
alexBarter, у меня есть некоторая уверенность что если собрать сентимент наиболее читаемых авторов СЛ и так же других площадок типа mfd то можно построить хороший индекс который будет давать сигналы. Может быть я это сделаю таки )
avatar
Статистика по уровню снега в Нью-Йорке. Может, там есть корреляция с S&P?
www.nydailynews.com/new-york/new-york-city-snowfall-total-tracker-article-1.2994206
avatar
На самом деле пофигу какой у вас результат главное зарабатывать!!!
По Роману так не выйдет, у него всегда найдется уровень, даже много уровней для контртренда:)
avatar
Хахахаха! +100500! )))
наконец то нормальный анализ пошел
Припоминаю в каждом посте уверенные рекомендации к покупке на полгода-год мегафона и моэск. ))
avatar
у Вас есть пост про бота на теннис в пинакл, есть предложение о создание бота, рейтинга написать в личное сообщение увы нет, автора прошу связаться со мной [email protected]
avatar

теги блога evgen000

....все тэги



UPDONW
Новый дизайн