Блог им. Kommersant_ru

«Яндекс» и МТС разошлись в способах оценки ИИ

Активно развивающийся рынок искусственного интеллекта начинает сталкиваться с проблемами, характерными для развитых отраслей, например, выбора адекватной методики оценки эффективности. Российские разработчики больших языковых моделей (используются, в частности, для создания голосовых ассистентов) выбрали разные инструменты для публичного сравнения с другими разработками. Так, экспериментальная версия YandexGPT оценивается путем парного сравнения на «чатбот-арене», а модели MTS AI — путем решения заранее определенных задач. Участники рынка указывают на возможность использования разных бенчмарков эффективности для разных вопросов.

Подробнее — в материале «Ъ».
Данная публикация является личным мнением автора. Мнение владельца сайта может не совпадать с мнением автора.
168

Читайте на SMART-LAB:
Обновление кредитных рейтингов в ВДО и розничных облигациях (ООО ПКО «Интел Коллект» повышен ruBB-, ООО МФК «МигКредит» подтвердил ruBB-)
🟢ООО ПКО «Интел Коллект» « Эксперт РА» повысил рейтинг кредитоспособности нефинансовой компании ООО ПКО «Интел Коллект» (далее – Компания, ПКО)...
Фото
Индикатор QStick в OsEngine: формулы, сигналы и бесплатный робот. Видео.
В этом видео разберём индикатор QStick — технический индикатор Тушара Чанде, который смотрит не на весь диапазон свечи, а на разницу между ценой...
Информация о ситуации, связанной с отзывом депозитарной лицензии у АЛОР БРОКЕР
Уважаемые клиенты, коллеги и партнёры! Мы будем открыто и честно информировать вас о развитии ситуации, связанной с отзывом у компании...
Фото
БСПБ: дисконт оправдан до восстановления доходности капитала
Банк Санкт-Петербург подвел итоги за май 2026 года по РСБУ. Чистый процентный доход составил 5,7 млрд рублей (-12,1% г/г); Чистый...

теги блога Коммерсантъ

....все тэги



UPDONW
Новый дизайн