Постов с тегом "llm": 3

llm


Монополия Nvidia на рынке LLM в скором времени может закончиться

Монополия Nvidia на рынке LLM в скором времени может закончиться

Демократизация доступа к вычислительным мощностям — один из ключевых драйверов роста развития Generative AI. На сегодняшний день одним из основных сдерживающих факторов для разработки новых больших языковых моделей (LLM), которые обеспечивают работу Generative AI, является крайне высокая цена процессоров (GPU), из-за чего стоимость разработки одной модели может превышать $100M.

Ключевой причиной крайне высоких цен является резкая нехватка процессоров на рынке: в 2023 единственным чипом, адаптированном под создание больших фундаментальных моделей, был H100 от Nvidia, стоимость которого превышает $40k за единицу, в то время как для обучения и работы таких моделей, как Anthropic Claude или GPT-4 OpenAI, требуются тысячи GPU.

Однако рынок начинает меняться и в скором времени монополия Nvidia может закончиться. На этой неделе был представлен новый процессор Intel Gaudi 3 разработанный специально для обучения Generative AI. Согласно пресс-релизу, производительность нового чипа Intel в 1.7х превосходит результаты Nvidia H100 и в 1.3х превышает заявленные результаты H200, нового поколения процессоров Nvidia, релиз которых запланирован в середине 2024.

( Читать дальше )
  • обсудить на форуме:
  • NVIDIA

VK использует пользовательский контент для создания генеративной нейросети - Ъ

VK разработала собственную языковую модель (LLM) для генерации текстов, используя комментарии из открытых групп «ВКонтакте». Первые функции тестируются в сервисах Mail.ru, а также аналогичные технологии изучаются в «Яндексе». Основной упор делается на автоматизацию рабочих задач, а не на добавление функций в соцсеть.

Разработка LLM осуществлялась на основе открытых текстов из интернета и публичных данных «ВКонтакте». Эксперты отмечают перспективы использования таких моделей в рабочих сервисах. Тестирование происходит в сервисах Mail.ru, а также рассматривается в «Яндексе». VK также разрабатывает продукты для госслужащих.

В долгосрочной перспективе VK рассматривает внедрение технологии в рабочие сервисы. Компания располагает вычислительными мощностями для тренировки LLM и имеет достаточные ресурсы для этого. Основным направлением разработки является автоматизация рабочих задач.

Источник: www.kommersant.ru/doc/6533556
  • обсудить на форуме:
  • ВК | VK

Способность больших языковых моделей генерировать текст также позволяет им планировать и рассуждать. Что будет дальше?

Способность больших языковых моделей генерировать текст также позволяет им планировать и рассуждать. Что будет дальше?

Квантовая физика как сонет Шекспира. 

Торговая теория, объясненная пиратом. 

Детская сказка о космическом динозавре. 

Люди с удовольствием просили современных чат-ботов создавать всевозможные необычные тексты. 


Некоторые запросы оказались полезными в реальном мире — например, маршруты путешествий, школьные сочинения или компьютерный код. 


Современные большие языковые модели (ЛМС) могут генерировать их все, хотя тем, кто уклоняется от домашней работы, следует остерегаться: модели могут ошибаться в некоторых фактах и склонны к полетам фантазии, которые их создатели называют «галлюцинациями».


Если не принимать во внимание случайные сбои, все это представляет собой огромный прогресс. Еще несколько лет назад такие программы были бы научной фантастикой. Но штамповка письма по запросу может оказаться не самой важной способностью llm. 

Их умение генерировать текст позволяет им действовать как универсальные логические механизмы. Они могут следовать инструкциям, генерировать планы и отдавать команды для выполнения другими системами.



( Читать дальше )

....все тэги
UPDONW
Новый дизайн