Блог им. Kommersant_ru

«Яндекс» и МТС разошлись в способах оценки ИИ

Активно развивающийся рынок искусственного интеллекта начинает сталкиваться с проблемами, характерными для развитых отраслей, например, выбора адекватной методики оценки эффективности. Российские разработчики больших языковых моделей (используются, в частности, для создания голосовых ассистентов) выбрали разные инструменты для публичного сравнения с другими разработками. Так, экспериментальная версия YandexGPT оценивается путем парного сравнения на «чатбот-арене», а модели MTS AI — путем решения заранее определенных задач. Участники рынка указывают на возможность использования разных бенчмарков эффективности для разных вопросов.

Подробнее — в материале «Ъ».
Данная публикация является личным мнением автора. Мнение владельца сайта может не совпадать с мнением автора.
160

Читайте на SMART-LAB:
Фото
EUR/USD: Линия тренда протягивает покупателям руку помощи?
Европейская валюта протестировала недельную линию восходящего тренда (проведенную через минимумы 03.02.2025 и 31.03.2026) и уровень поддержки...
Фото
⚡️ Результаты ПАО «СТГ» за 1 квартал 2026 года
В первом квартале объем выдач кредитных продуктов вырос более чем в 2 раза — до рекордных 1,5 млрд руб. за квартал (+107% г/г),...
🏦 Как Займер трансформирует свою бизнес-модель?
В последнее время мы много говорили о трансформации бизнеса Группы. Давайте разберемся, в чем именно заключаются эти изменения и почему это важно...
Фото
Две новых инвест идеи на иксы у Элвиса в ПИФ Alenka Capital: подсвечиваем, пока горит
Продолжаем серию ежемесячных постов с отслеживанием покупок/продаж профессиональными управляющими. Особенно теми, кто управляет МИЛЛИАРДАМИ рублей...

теги блога Коммерсантъ

....все тэги



UPDONW
Новый дизайн