Блог им. Replikant_mih

По-дружески стресс-тестим LLM

Был в игривом настроении, решил подловить ИИшку. 

По-дружески стресс-тестим LLM
По-дружески стресс-тестим LLM
По-дружески стресс-тестим LLM

Есть любители занижать оценку возможностей LLM моделей. По мне так текущие модели очень-очень бодрые на текущем уровне и очень очень полезные уже.

 

Есть такая штука как radar chart, типа такой (см. ниже), если декомпозировать интеллект на составляющие и отразить на таком графике картинку меры выраженности скиллов для среднего человека и LLM — да, они будут отличаться, и сильно, конечно. 

 

НО:
— Не факт что площадь фигуры у LLM будет, ниже, чем у человека.
— Так-то все люди между собой тоже нехило так отличаются и по выраженности разных скилов и по равномерности их выраженности и по площади фигуры.

 

По-дружески стресс-тестим LLM

Данная публикация является личным мнением автора. Мнение владельца сайта может не совпадать с мнением автора.
365
2 комментария
|-, Какая модель не помню была, а сервис вот этот: apps.abacus.ai/chatllm
avatar

Читайте на SMART-LAB:
Фото
⚡️ 3 трлн рублей: ДОМ.PФ и Сбер выпустят ипотечные облигации на рекордную сумму
Договорились секьюритизировать портфель ипотечных кредитов банка на нашей платформе до конца 2030 года. Соглашение на полях ПМЭФ подписали Виталий...
Фото
📊 Дивидендная история «МГКЛ»: рост вместе с бизнесом
С момента, как ПАО «МГКЛ» стало публичной компанией, мы последовательно придерживаемся дивидендной политики и ежегодно направляем часть...
Фото
Обзор актуальных размещений облигаций с высоким кредитным качеством
В этой статье рассмотрим параметры новых размещений облигаций от эмитентов с высоким кредитным качеством: АО «Почта России» и ГМК...
Фото
ЦИАН. Отчет МСФО Q1 26г. Такой рентабельности никогда не было
Вышли финансовые результаты по МСФО за Q1 2026г. от компании ЦИАН: 👉Выручка — 3,90 млрд руб. (+17,9% г/г) 👉Операционные расходы — 2,72...

теги блога Replikant_mih

....все тэги



UPDONW
Новый дизайн