Новости рынков

Новости рынков | Яндекс разрабатывает единую нейросеть для речи и текста

Яндекснанимает сотрудников для работы над мультимодальной моделью SpeechGPT, которая, согласно описанию вакансии, должна будет воспринимать текст и звук и отвечать при их же помощи. Нейросетевые сервисы компании уже обрабатывают как речь, так и текст, но процесс происходит с преобразованием данных из одного вида в другой. Мультимодальные сети призваны улавливать детали, которые теряются при такой конвертации,— например, эмоции и сарказм.

Яндекс работает над еще не анонсированной нейросетевой моделью SpeechGPT и нанимает в соответствующую команду инженера в области машинного обучения, говорится в разделе вакансий компании. Речь идет о мультимодальной модели (то есть способной обрабатывать разные виды вводных данных), которая «умеет воспринимать текст и звук, отвечать текстом и звуком, решать разные задачи на стыке текста и звука». В «Яндексе» пояснили, что работают над мультимодальностью в ассистенте «Алиса» и других сервисах

www.kommersant.ru/doc/6744106
198

Читайте на SMART-LAB:
ИНВЕСТИЦИИ И ТРЕНДЫ. ПЕРМЬ: ОНЛАЙН-ТРАНСЛЯЦИЯ
25 апреля в Перми проходит конференция «Финама» «Инвестиции и тренды-2026». Ее можно посмотреть онлайн из любой точки мира  👇 Смотреть в...
Фото
📍 Сегодня — Profit Conf
Конференция уже началась, и команда МГКЛ работает на площадке. В 11:00 в зале №6 наше выступление — обзательно приходите послушать. И да,...
Фото
⚡️ Генеральный директор ПАО «СТГ» Анна Калугина выступила на форуме ПСБ «Просто капитал»
Анна приняла участие в сессии, где обсуждали важные для технологичного бизнеса вопросы информационной безопасности, их особенности и...
Фото
Обновляем стратегию 2026: год трудный, что изменилось, и в каком направлении мы движемся?
Квартальное обновление стратегии. Стратегия Mozgovik была представлена 17 января: https://smart-lab.ru/mobile/topic/1254157/ Что остается в...

теги блога Все Верно

....все тэги



UPDONW
Новый дизайн