Комментарии пользователя Михаил Шардин

Мои комментарии:в блогах в форуме
Ответы мне:в блогах в форуме
Все комментарии: к моим постам
Не везде есть доллар нового образца а старые принимаются с комиссией.
И любые даже почеркушки на долларах могут не принять
avatar
  • 20 октября 2025, 09:20
  • Еще
V V, хорошо, спасибо вам за подробное объяснение
avatar
  • 19 октября 2025, 11:01
  • Еще

Александр Чекмарев, аккаунт два дня назад зарегистрирован, фотка сгенерирована, упоминаете решение которое не работает.

Реклама?

avatar
  • 17 октября 2025, 14:23
  • Еще
Make_hard, нужен совет по балансировке датасета для задачи классификации текстов.

У меня текстовый датасет из ~104K сообщений, размеченный по трём классам (негативный/-1, нейтральный/0, позитивный/+1) для разных временных окон. Проблема в сильном дисбалансе:

Текущее распределение классов:

* 5 min: -1 (9.7%), 0 (81.1%), 1 (9.2%)
* 15 min: -1 (9.1%), 0 (82.0%), 1 (8.9%)
* 60 min: -1 (8.1%), 0 (84.0%), 1 (7.9%)

Моя идея: удалить из класса 0 «истинно нейтральные» примеры — те, у которых целевая метрика близка к нулю и z-score низкий (нет статистической значимости).

Данные по классу 0 (для 5 мин):

* 61.7% имеют |z-score| < 0.5 (очень низкая значимость)
* 87.8% имеют |z-score| < 1.0 (слабая значимость)
* 99.9% имеют малое абсолютное значение целевой метрики

Мои вопросы:

* Насколько корректен такой подход для балансировки? Не теряю ли я важную информацию о «настоящих нейтральных» примерах?
* Какой порог по z-score посоветуешь использовать? Склоняюсь к |z| < 1.0 (это даст удаление ~74K из 84K нейтральных, останется ~30K примеров с более-менее равными классами).
* Может, есть лучшие стратегии для такой задачи, кроме андерсэмплинга нейтрального класса?
avatar
  • 17 октября 2025, 13:46
  • Еще
Make_hard, может лучше в телеге удастся пообщаться?
avatar
  • 17 октября 2025, 13:08
  • Еще
V V, Вы в теме или так просто комментируете?
avatar
  • 17 октября 2025, 12:11
  • Еще
Выберите надежного брокера, чтобы начать зарабатывать на бирже:
....все тэги
UPDONW
Новый дизайн