Италия / Поиск по тегам пользователя / sMart-lab.ru - блоги трейдеров и инвесторов. Форум акций. Котировки акций. Фундаментальный анализ акций. Трейдинг, инвестиции, экономика

Блог им. rotmistrov |Парсинг постов Смартлаба. Темы октября 2018

14 ноября 2018, 15:39
|
Алексей Ротмистров

Предлагаю вашему вниманию пробный пост о применении data mining к текстам, спарсенным из блогов Смартлаба.

Идея исследования: ежемесячно парсить все посты со Смартлаба и применять к ним метод BigARTM из класса методов тематического моделирования.

Методы тематического моделирования (детальное описание: Воронцов К.В. Вероятностное тематическое моделирование: обзор моделей и аддитивная регуляризация) позволяют группировать слова («термы», «токены») из множества документов по темам.

Интерпретация тем – дело исследователя. К сожалению, не всегда удаётся проинтерпретировать набор слов, т.е. по этому набору назвать тему. Я буду приводить как наборы слов по темам, так и мою интерпретацию тем. Вы же при желании сможете дать свою интерпретацию.

В дальнейшем – при накоплении статистики – можно искать связи между событиями и их отражением или не отражением в виде постов на Смартлабе.

В октябре 2018 на смартлабе было опубликовано свыше 4000 постов.

( Читать дальше )

спецраздел:
торговые роботы

Ленты

Форумы

Участники

Котировки

Акции

Календарь

Информация

Книги

Блог им. rotmistrov |Парсинг постов Смартлаба. Темы октября 2018

полезные записи за 24 часа

Лучшие записи за 24 часа

самые обсуждаемые сегодня

Авторизация

Ленты

Форумы

Участники

Котировки

Акции

Календарь

Информация

Книги

Блог им. rotmistrov |Парсинг постов Смартлаба. Темы октября 2018

полезные записи за 24 часа

Лучшие записи за 24 часа

самые обсуждаемые сегодня