Блог им. Replikant_mih

По-дружески стресс-тестим LLM

Был в игривом настроении, решил подловить ИИшку. 

По-дружески стресс-тестим LLM
По-дружески стресс-тестим LLM
По-дружески стресс-тестим LLM

Есть любители занижать оценку возможностей LLM моделей. По мне так текущие модели очень-очень бодрые на текущем уровне и очень очень полезные уже.

 

Есть такая штука как radar chart, типа такой (см. ниже), если декомпозировать интеллект на составляющие и отразить на таком графике картинку меры выраженности скиллов для среднего человека и LLM — да, они будут отличаться, и сильно, конечно. 

 

НО:
— Не факт что площадь фигуры у LLM будет, ниже, чем у человека.
— Так-то все люди между собой тоже нехило так отличаются и по выраженности разных скилов и по равномерности их выраженности и по площади фигуры.

 

По-дружески стресс-тестим LLM

350
2 комментария
|-, Какая модель не помню была, а сервис вот этот: apps.abacus.ai/chatllm
avatar

Читайте на SMART-LAB:
Фото
Почти половина россиян испытывает стресс при подготовке к свиданиям
Пятничный пост от нас. Дейтинг сервис Мамба и аналитики платформы психологической поддержки и управления состоянием «Просебя» (входит в Группу...
Фото
Финансовые результаты X5 за 2025 г.
Друзья, всем привет! В это пятничное утро делимся с вами финансовыми результатами за 2025 год. 🔴Выручка увеличилась на 18,8% до 4,6 трлн руб ....
Кредитный рейтинг вернулся к стабильному прогнозу
Друзья, привет! 🔥 Пока вы продолжаете следить за ценами на сырье и валютой — наш кредитный рейтинг возвращается к исходному стабильному...
Фото
Россети Волга. Отчет МСФО. Считаем дивидендную базу
Компания Россети Волга опубликовала финансовый отчет за 2025г. по МСФО. Я совсем коротко на нем остановлюсь, потому что отчет МСФО и...

теги блога Replikant_mih

....все тэги



UPDONW
Новый дизайн