Блог им. egenui

R. Распределение времени активности пользователей на СЛ.

Занимаюсь анализом сантимента СЛ на R. Написал парсер, и решил что надо как-то потестить, пришла идея посмотреть, в какие часы наиболее популярные пользователи активны на СЛ. Разделил группу на 2, те для кого писать на СЛ это работа, и те для кого это больше хобби. В группу тех для кого писать на СЛ это хобби выбрал Горчагова и Решпекта, в группу тех для кого это работа выбрал Олейника и Михаила Давыдова. Графики ниже это распределения по часам создания топиков и комментариев.

    Решпект. Наиболее активен в конце рабочего дня и немного в начале торговой сесии. По комментариям достаточно размыто, но существует корреляция с топиками, провал активности где-то с 16 до 18. Пишет даже в конце рабочего дня, после 21:00.R. Распределение времени активности пользователей на СЛ.R. Распределение времени активности пользователей на СЛ.
    Горчаков. Ситуация похожа с Решпектом, однаком в середине рабочего дня на СЛ практически не появляется. Топики пишет в основном после рабочего дня. И это понятно, человек работает, днем как правило занят другими делами. С комментариями стабильно, целый день онлайн, жмет F5 по кд ), однаком четкого паттерна не видно, наиболее активен опять же, после рабочего дня.
R. Распределение времени активности пользователей на СЛ.
R. Распределение времени активности пользователей на СЛ.
    Далее группа наиболее интересных участников, один работает в брокерской фирме и постит обзоры, второй работает хз где, но заказчик там похоже министерство пропаганды.

    Василий Олейник. Посмотрите как сильно его активность по времени отличается от тех кто выше! Топики пишет на протяжении всего дня. Провалов нет, внутри дня стабильно постит и почти никаких топиков до и после рабочего дня! А зачем, никто же не платит за переработку. Однако все же потрепаться после рабочего дня в комментах тоже любит.
R. Распределение времени активности пользователей на СЛ.
R. Распределение времени активности пользователей на СЛ.

    Далее самый, пожалуй, наиболее частый участник списка банов пользователей некто ghbdtn002 ( Михаил Давыдов ). Ну что ж судя по тому как он активно пишет посты внутри рабочего дня говорит как минимум о том что у парня либо нет работы, либо писать на СЛ это и есть его работа. На самом деле я просмотрел несколько больше пользователей, но так в рабочее время не пишет никто из тех кого я смотрел. Как видно, ни до рабочего дня ни после не пишет постов совсем, т.е вообще совсем!

    Если Вася хоть как-то увлечен трейдингом и Сл ему еще и интересен после рабочего дня, то для этого СЛ это только работа и не более. По комментариям наиболее активен в середине рабочего дня, что в общем-то не удивительно, к концу рабочего дня активность падает, устает поцан чтож поделаешь, наверняка не один сайт окучивает.
R. Распределение времени активности пользователей на СЛ.
R. Распределение времени активности пользователей на СЛ.
Код достаточно длинный, поэтому залил сюда http://pastebin.com/ndVgwgcP если кому интересно.
★12
Если кому-то из вас интересно ваше время активности, могу запостить комментом )
avatar

evgen000

Что там с Романом Андреевым?
avatar

Александр Буки

Александр Буки, А что там смотреть ) Он пришел, написал «Ситуация на текущий момент» собрал плюсы и ушел )
avatar

evgen000

Ессно Давыдов за деньги строчит.
avatar

Goreloff

pastebin.com
для кодика)) а на это авно даж переходить не буду
avatar

nameless

nameless, http://pastebin.com/ndVgwgcP Спасибо. Не знал об этом. Залил
avatar

evgen000

evgen000, дату програмер пишет в том формате, в котором Тима попросил. *-)
avatar

cdb/2.1

Можно было грепом не менять даты,
дату можно вытащить as.Date( ,"%d")-ок. (и даже думаю можно поигравшись с параметрами и целиком все вытащить через POSIX, так как время то нормальное), хотя дата вообщем не нужна, а время разделить строку по запятой, а потом Posix забрать это время (оно правда будет с текущим днем, но это не критично, все равно же группировка)
avatar

AlexeyTikhonov

AlexeyT, там геморно, posixom дату можно прочесть скажем такую «1 Декабрь 2015 10:00» но на СЛ дата такая «1 декабрЯ 2015» вот из за этого я не смог стандартными методами забрать дату. Ну либо я просто что-то проморгал )
avatar

evgen000

AlexeyT, Ну да, день забрать наверно не проблема, месяц вот не получится если он написан как на СЛ "декабрЯ
avatar

evgen000

evgen000, я с такой же проблемой столкнулся при парсинге. Функция конвертации по ссылке http://pastebin.com/FhHYYnZj
avatar

r0man

Напишите пожалуйста вкратце, для малограмотных, как программа вытягивает данные  со смарт лаба
avatar

aster

aster, ну конкретно в коде функцией getURL. А на более низком уровне методом GET протокола HTTP
avatar

evgen000

чтобы гистограммы построить используете R? :)

avatar

nbvehrfr

nbvehrfr, ага
avatar

evgen000

Для концентрации и калибровки внимания перед торговой сессией

youtube.com/watch?v=ZDxDacIyJXU
avatar

Nik2

Nik2, отдыхаем, ждёмс


youtube.com/watch?v=ZDxDacIyJXU

avatar

Nik2

Автор сделал графики на основе участников из московского часового пояса, в общем правильно — 70% живет в московском поясе. По часовым поясам, сейчас активны участники сл из Иркутска и Сингапура в этих городах +5мск, в Кемерово и Бангкоке сейчас 11 часов утра и они активны, а в мфц Москва, Санкт-Петербург и Лондон сейчас спят.  
avatar

PattayaRugby

Александр Христианин тоже частенько светит своими постами)
avatar

Серега

Чтобы разорвать статистику встал пораньше и захерачил этот коммент в 7:53 утра. ;-)
avatar

Reshpekt Fund Russia

avatar

Денис Сычёв

офигенно!
avatar

astray

evgen000, да, затупил я, там месяц не тот подставлялся,
но в итоге то все равно не нужна вам дата-то.
делим строку на 2, и вытаскиваем только время.
avatar

AlexeyTikhonov

AlexeyT, Это все так, я все это затеял потому что пишу индикатор который бы отслеживал сантимент СЛ, на анализе эмоциональной окраски текстов популярных топиков, там мне потребовалась дата целиком. А это я сделал просто что бы потестить парсер
avatar

evgen000

evgen000, ааа, здорово, ну как есть зависимость какая от настроения толпы?:)
avatar

AlexeyTikhonov

AlexeyT, да пока не знаю, семантический анализ не самая простая штука, а тем более в русском языке ) Может что-нибудь и выйдет из этого )
avatar

evgen000

evgen000, не смотрели в сторону azure?, и не читали пост про него с кириллицей и R именно?
avatar

AlexeyTikhonov

Reshpekt Fund Russia, ну к примеру открываю страницу http://smart-lab.ru/my/Reshpekt/comment/page1 и xpath'ом достаю комменты, далее перехожу на pag2 и так далее.
avatar

evgen000

Спасибо! Добавил давыдова в черн список
avatar

Мурен(а)


....все тэги
UPDONW