OpenAI представила думающую языковую модель o1

Компания OpenAI представила новую языковую модель o1, обладающую способностью к рассуждению и логически решать задачи. В отличие от предыдущих моделей, o1 способна имитировать человеческий процесс мышления, разбивая сложные задачи на более простые шаги, анализируя разные подходы и исправляя собственные ошибки.

Большая языковая модель (LLM) o1 показала выдающиеся результаты в тестах и соревнованиях, сравнимые с результатами специалистов-людей. По программированию o1 заняла 49-е место на Международной олимпиаде по информатике (IOI) 2024 года и превзошла 89 % людей на платформе Codeforces. По математике o1 вошла в число 500 лучших студентов США на квалификационном этапе Американской математической олимпиады (AIME), продемонстрировав способность решать задачи, предназначенные для самых одарённых школьников, сообщает OpenAI на своём сайте.

В естественных науках модель превзошла результаты докторов и кандидатов наук в сложном тесте GPQA diamond, оценивающем знания в области химии, физики и биологии. «Это не означает, что o1 умнее любого кандидата наук, — поясняют разработчики. — Это говорит о том, что модель способна решать некоторые задачи на уровне высококвалифицированных специалистов».

Модель o1 также продемонстрировала превосходство над предыдущими моделями в различных тестах на интеллект и решение задач, включая MMMU и MMLU. По данным OpenAI, новая модель значительно превосходит предшествующую версию GPT-4o на большинстве задач, связанных с логическим мышлением. «Наши испытания показали, что o1 последовательно улучшает результаты с увеличением объёма ренфорсмент-обучения и времени, потраченного на размышления», — отмечают в компании. В частности, в тестах AIME модель o1 решила в среднем 83 % задач, тогда как результат GPT-4o — 13 %.

Модель о1 значительно меньше галлюцинирует, чем GPT-4o. Однако она медленнее и дороже. Кроме того o1 проигрывает GPT-4o в энциклопедических знаниях и не умеет обрабатывать веб-страницы, файлы и изображения. Кроме того, новая модель может манипулировать данными, подгоняя решение под результат.

Секрет успеха кроется в фундаментально новом алгоритме обучения — «цепочке мыслей». Модель может улучшать эту цепочку, обучаясь по методу «обучение с подкреплением», благодаря которому распознаёт и исправляет свои ошибки, разбивает сложные шаги на более простые и пробует разные подходы в решении задач. Эта методология значительно улучшает способность модели к рассуждению, которая «как и человек может длительное время размышлять перед тем, как ответить на сложный вопрос».

OpenAI уже выпустила предварительную версию модели o1-preview, доступную для использования в ChatGPT и для разработчиков через API. Компания признаёт, что предстоит ещё много работы, чтобы сделать o1 такой же простой в использовании, как и текущие модели. Также подчёркивается безопасность и этичность новой модели, так как её рассуждения можно контролировать, предотвращая потенциально нежелательное поведение. И прежде чем выпустить o1-preview для публичного использования, со стороны OpenAI были проведены тесты на безопасность.

Стоимость использования o1-preview составляет 15 долларов за 1 млн входных токенов и 60 долларов за 1 млн выходных токенов. Для сравнения, GPT-4o предлагает цену в $5 за 1 млн входных токенов и $15 за миллион выходных.

Источник: https://3dnews.ru/

OpenAI искусственный интеллект ChatGPT

Auximen

Краснодар

223

13 247

с 3 июня 2017

47 Комментариев

Alexide
13 сентября 2024, 10:12
Они тупо обгонят нас, развиваясь и изобретая новые технологии. Обидно.
Разрыв в технологиях может стать фатальным для отстающих стран. Фатальным настолько, что будет уже неважно, какая часть бывшей великой империи победит другую часть империи в жестокой борьбе.
+10
wistopus
13 сентября 2024, 10:15
Кроме того o1 проигрывает GPT-4o в энциклопедических знаниях и не умеет обрабатывать веб-страницы, файлы и изображения
еще не вечер…
давно пора заменить углеродную цивилизацию на кремневую...
кремневая, надеюся, не будет убивать друг друга?..

+2
Marco Polo
13 сентября 2024, 11:45
Потом окажется, что они убрали нейронку ))
0
ValeraShelomov 🎅🥂🎄
13 сентября 2024, 12:01
Ну все, новая глава
0

Читайте на SMART-LAB:

Мартовское обновление списка устойчивых ВДО-эмитентов Иволги Капитал

👉 Наш канал в MAX 👈 👉 Чат Иволги в MAX 👈 В списке устойчивых ВДО Иволги Капитал (последним организатором или со-организатором выпусков этих эмитентов явилась Иволга) очередное...

Иволга Капитал

06:31

Стоит ли покупать ОФЗ в юанях

В последние недели на российском рынке заметно ухудшилась юаневая ликвидность, и это сразу отразилось на ценах валютных гособлигаций. Разбираемся, сделало ли это ОФЗ в китайской валюте более...

Альфа-Инвестиции

25.03.2026

«ДОМ.РФ» после IPO: перспективы для инвесторов

Провели онлайн-встречу с представителями «ДОМ.PФ» — обсудили результаты, перспективы и точки роста после IPO. Для всех, кто не смог присоединиться к эфиру, в этом посте делимся основными...

Финам Брокер

25.03.2026

Какую акцию УК Первая в феврале покупала на миллиарды рублей - ищем вместе с Вами

Продолжаю делать серию ежемесячных постов с отслеживанием покупок/продаж профессиональными управляющими. Особенно теми, кто управляет МИЛЛИАРДАМИ рублей в акциях. Зачем? Посмотреть, как думают...