Блог им. Replikant_mih

По-дружески стресс-тестим LLM

Был в игривом настроении, решил подловить ИИшку. 

По-дружески стресс-тестим LLM
По-дружески стресс-тестим LLM
По-дружески стресс-тестим LLM

Есть любители занижать оценку возможностей LLM моделей. По мне так текущие модели очень-очень бодрые на текущем уровне и очень очень полезные уже.

 

Есть такая штука как radar chart, типа такой (см. ниже), если декомпозировать интеллект на составляющие и отразить на таком графике картинку меры выраженности скиллов для среднего человека и LLM — да, они будут отличаться, и сильно, конечно. 

 

НО:
— Не факт что площадь фигуры у LLM будет, ниже, чем у человека.
— Так-то все люди между собой тоже нехило так отличаются и по выраженности разных скилов и по равномерности их выраженности и по площади фигуры.

 

По-дружески стресс-тестим LLM

Данная публикация является личным мнением автора. Мнение владельца сайта может не совпадать с мнением автора.
364
2 комментария
|-, Какая модель не помню была, а сервис вот этот: apps.abacus.ai/chatllm
avatar

Читайте на SMART-LAB:
Фото
📊 Ресейл Инвест: статистика и развитие платформы
Платформа «Ресейл Инвест» продолжает активно развиваться и набирать обороты внутри экосистемы «МГКЛ». С начала 2026 года на платформе...
Фото
От автопрома до инвестиционного портфеля
◻️ Платиноиды привычно ассоциируются с драгоценными украшениями . Однако главные сферы их применения лежат далеко за пределами витрин ювелирных...
Фото
Обновление терминала БКС: улучшена форма заявки и дополнен виджет котировок
Новое в веб-терминале БКС: улучшена форма заявки и дополнен виджет котировок    В свежем обновлении улучшили работу с заявками и...
Фото
Нефтяной срез: выпуск №9. Ормуз перекрыт, но акции нефтегаза падают. Надо ли покупать или сидеть на заборе в LQDT? Ищем лучших в секторе, где растет прибыль!
Продолжаю выпускать рубрику — Нефтяной срез.  Цель: отслеживать важные бенчмарки в нефтяной отрасли, чтобы понимать куда дует ветер.  Прошлый пост:...

теги блога Replikant_mih

....все тэги



UPDONW
Новый дизайн