Прошла неделя с момента запуска приложения, которое отправляет google поисковые запросы и анализирует частотность получаемых ответов.
Первую неделю накапливались данные по количеству упоминаний голубых фишек за последние 24 часа.
Очевидных результатов данный подход не дал.
Зато просмотр ответов поисковика и опыт одного из коллег по цеху подтолкнул к идее контент-анализа.
Гипотеза очень простая: толпа ошибается.
Исходя из этого предположения с помощью поисковых запросов анализируется количество положительных и негативных ожиданий по акциям.
На примере акций Газпрома. результат первого дня оказался ожидаемым.
Количество ответов, удовлетворяющих положительным ожиданиям, на протяжении дня было меньше количества, негативных ожиданий (500 против 1200).
Т.е. в целом пользователи блогов, новостных лент и т.д. ожидали что акции газпрома будут падать, в то время как газпром вырос на +1,45% по итогам торговой сессии.
Данный результат нельзя назвать статистически значимым, но начало положено.
Последние полгода активно смотрю англоязычные новости в контексте «куда пойдет цена и почему». Профильные ленты новостей, профильные журналы, обще-экономические, аналитические, трейдерские, популярная экономика, много разного.
Сравнивая полезность новостей постфактум, можно выявить и выделить те сми, что пишут по делу и те «которые набрасывают», излагая популярное представление рынка, вводя в заблуждение широкие массы. Оказалось, что все сми так или иначе цепляются к трендовым темам, наверно что бы эти газеты читали, а не отворачивались на сломах шаблона. Также, оказалось, что явные и очевидные сигналы рынка не описываются в набат, можно лишь самому их увидеть в таблице, под которой подписаны лишь второстепенные выводы.
Чтение американских газет оказалось не менее сложной задачей, чем советских, тьфу украинских или российских. Только контексты, только голые цифры, только избранные единицы авторов, только сравнивая с общим шумом.