Тузик
Тузик личный блог
18 октября 2014, 17:35

# --> Какова информативность постов смартлаба?

Мы тратим уйму времени просматривая разные посты смартлаба, а время как известно — деньги. Я сейчас занимаюсь информацией с точки зрения лингвистики, можно сказать что топаю к некому автоматическому анализатору потока информации генерируемого социальными группами в реальном времени, ну и само собой смартлаб отличный источник начальной информации для подобных вещей. Вообще у меня есть парочку предложений Мартынову лично, как программиста готового (с предоставлением API из нескольких запросов для моей внешней системы скажем получения в реальном времени потока сообщений пользователей) дополнить функционал смартлаба уникальным функционалом в том числе автомодерированием однако пока как исследовательский софт, но не уверен что ему это прям сейчас будет интересно ) пока не поймет к чему я клоню свои идеи… ;) 

Ну так вот… ради прикола я прогнался своим начальным анализатором по последней тысяче (ну или около того) постов (ведь Тимофей сказал что в эти дни был пик активности а значит выборка будет репрезентативной) и для начала просто составил для каждого поста словарь уникальных слов используемых в топике (так как парсер не доработан, то выдирается концовка поста где указана ссылка и никнейм, поэтому даже в казалось бы пустом топике… слова заголовка тоже учитывается) будет не меньше 12 слов :) )… вот что вышло

Слева ссылка… справа — количество уникальных слов в топике   (так как сюда входит лишь 40000 символов то даю ссылку через свой сайт)


http://micpdn.com/smart/stat.html

вот диаграмма распределения по количеству слов от номера топика (исключены первые топики со словарем больше 1000 :) дабы график был более наглядный)

# --> Какова информативность постов смартлаба? 


Как видите :) контент «твиттер поколения» налицо… информативных топиков — с гулькин нос 

и само собой копаться в такой дребедени — выбрасывать личное время как читателя так и модератора (как подмножество читателей :) ) что не есть гуд, особенно когда молниеносно со срача люди переходят на личности и до того как модератор обнаружит топик люди уже решат что никогда не будут писать больше на смарте — Мартынову это явно не нравится :) но что поделать — нет же функционала который за этим бы следил


еще может оказаться так что в одном или нескольких коментариях читателя в топике не попавшего по разным причинам в фокус внимания читателей будет больше содержания чем в топовом информативном топике за день… такие коменты можно было бы получать автоматом для предоставления статуса «Автоматический топик» ну или в раздел «информативные комментарии в дополнительном разделе Смарта (в отличае от текущего сплошного потока… где сыр бор :) и голова кругом идет через 5 минут прочтения)

так же можно будет подписаться на „тематики“ которые пользователь выберет скажем через указание своих слов (лингвистически можно сделать так чтобы выбирались не точно эти слова а близкие по смыслу в пределах некоего синтетического коэффициента близости смысла)… и получать через RSS все упоминания топики+комментарии пользователей… тем самым повысив свой интерес. Если создать скажем „портфель интересов“ то можно множественными редактированиями списка интересов получить „облик интереса пользователя“  … и эти списки уже сравнивать между собой и автоматически предлагать общение с такими людьми :)
------

продолжу копаться теперь уже в словарном запасе среднестата смартлабчанина :) попробую составить топ „слов паразитов“  топ „уникальных самых длинных и прочие слова :) попробуем заглянуть в “коллективный мозг»
38 Комментариев
  • Eu-Gin
    18 октября 2014, 17:43
    нулевая
  • nika8
    18 октября 2014, 17:44
    так и есть.Люди перестали воспринимать большие тексты которые им напрягают мозг.Всё становится на неком уровне смс общения.
  • Sergii Onyshchenko
    18 октября 2014, 17:45
    Доброго здоровья! Конечно каждый прочитавший топик захочет увидеть именно свой пост- то есть его место на диаграмме. Хорошо бы поиск. Чтобы сразу понять своё место…
  • Aleksander
    18 октября 2014, 17:55
    Тима делает хорошие весчи.

Активные форумы
Что сейчас обсуждают

Старый дизайн
Старый
дизайн