Auximen
Auximen личный блог
Сегодня в 09:56

OpenAI представила думающую языковую модель o1

Компания OpenAI представила новую языковую модель o1, обладающую способностью к рассуждению и логически решать задачи. В отличие от предыдущих моделей, o1 способна имитировать человеческий процесс мышления, разбивая сложные задачи на более простые шаги, анализируя разные подходы и исправляя собственные ошибки.

Большая языковая модель (LLM) o1 показала выдающиеся результаты в тестах и соревнованиях, сравнимые с результатами специалистов-людей. По программированию o1 заняла 49-е место на Международной олимпиаде по информатике (IOI) 2024 года и превзошла 89 % людей на платформе Codeforces. По математике o1 вошла в число 500 лучших студентов США на квалификационном этапе Американской математической олимпиады (AIME), продемонстрировав способность решать задачи, предназначенные для самых одарённых школьников, сообщает OpenAI на своём сайте.


OpenAI представила думающую языковую модель o1

В естественных науках модель превзошла результаты докторов и кандидатов наук в сложном тесте GPQA diamond, оценивающем знания в области химии, физики и биологии. «Это не означает, что o1 умнее любого кандидата наук, — поясняют разработчики. — Это говорит о том, что модель способна решать некоторые задачи на уровне высококвалифицированных специалистов».

Модель o1 также продемонстрировала превосходство над предыдущими моделями в различных тестах на интеллект и решение задач, включая MMMU и MMLU. По данным OpenAI, новая модель значительно превосходит предшествующую версию GPT-4o на большинстве задач, связанных с логическим мышлением. «Наши испытания показали, что o1 последовательно улучшает результаты с увеличением объёма ренфорсмент-обучения и времени, потраченного на размышления», — отмечают в компании. В частности, в тестах AIME модель o1 решила в среднем 83 % задач, тогда как результат GPT-4o — 13 %.

Модель о1 значительно меньше галлюцинирует, чем GPT-4o. Однако она медленнее и дороже. Кроме того o1 проигрывает GPT-4o в энциклопедических знаниях и не умеет обрабатывать веб-страницы, файлы и изображения. Кроме того, новая модель может манипулировать данными, подгоняя решение под результат.

Секрет успеха кроется в фундаментально новом алгоритме обучения — «цепочке мыслей». Модель может улучшать эту цепочку, обучаясь по методу «обучение с подкреплением», благодаря которому распознаёт и исправляет свои ошибки, разбивает сложные шаги на более простые и пробует разные подходы в решении задач. Эта методология значительно улучшает способность модели к рассуждению, которая «как и человек может длительное время размышлять перед тем, как ответить на сложный вопрос».

OpenAI уже выпустила предварительную версию модели o1-preview, доступную для использования в ChatGPT и для разработчиков через API. Компания признаёт, что предстоит ещё много работы, чтобы сделать o1 такой же простой в использовании, как и текущие модели. Также подчёркивается безопасность и этичность новой модели, так как её рассуждения можно контролировать, предотвращая потенциально нежелательное поведение. И прежде чем выпустить o1-preview для публичного использования, со стороны OpenAI были проведены тесты на безопасность.

Стоимость использования o1-preview составляет 15 долларов за 1 млн входных токенов и 60 долларов за 1 млн выходных токенов. Для сравнения, GPT-4o предлагает цену в $5 за 1 млн входных токенов и $15 за миллион выходных.

Источник: https://3dnews.ru/

43 Комментария
  • Alexide
    Сегодня в 10:12
    Они тупо обгонят нас, развиваясь и изобретая новые технологии. Обидно.
    Разрыв в технологиях может стать фатальным для отстающих стран. Фатальным настолько, что будет уже неважно, какая часть бывшей великой империи победит другую часть империи в жестокой борьбе.
    • mapik
      Сегодня в 11:39
      Alexide, а мне кажется что тревожность по факту развития AI завышенна. Какую практическую ценность можно извлечь из этой игрушки? БредоГенератор может создавать илюзию человеко подобных текстов и картинкок, ну так против этого уже строиятся фаерволы по пириметрам стран. Такой же хайп был при взрывном росте производительности компьютерной техники. Много ли компьютеры изменили в базовых отраслях? 
      • averbin
        Сегодня в 12:01
        mapik, вы не правы. Смотрите — в 2012 примерно появились сверточные сети, которые очень удачно имитируют процесс человеческого зрения. Это был прорыв в распознавании образов и с тех пор сетки видят лучше людей.

        GPT отлично справляется с превращением языка в смыслы и назад из смыслов в текст, звук или картинки. Нет сомнений, что тут тоже угадали и создали что-то близкое к тому, что у нас в голове. Если интересно, то «смыслы» это вектора в >12000-мерном пространстве. Направления отвечают за различные аспекты, типа «мужское», «женское». Если сместить «смысл» «сын» по направлению «женское», то получаем «дочь». Сместим далее по направлению «родственники» и получим «племянница». Так появляется возможность вычислять «смыслы».

        Угадать как работает логическое мышление задача того же порядка как угадать как работает язык. Если не сейчас, то через 10 лет точно сделают. И будет ИИ с интеллектом доктора наук. Программисты реально будут не нужны. Вообще люди будут не нужны.
        • Liberalism
          Сегодня в 13:49
          averbin, вообще это сильно начинает напоминать реализацию меморандума Бромберга…
      • *FXRB*
        Сегодня в 12:24
        mapik, я думаю в этом одна неприятная вещь, запилят ангажированный gpt, подсадят на него людей через телефон и будут продвигать свою повестку (лгбт и всякую другую блевотину) мягко и ненавязчиво в том числе выбирать страны как врагов человеческих ценностей и настраивать против них население планеты, это легко сделать.
        • mapik
          Сегодня в 12:37
          *FXRB*, думается что обилие дешового контента преведет к трансформации интернета. Такую вольницу прекроют: вход по паспорту с регистрацией через МФЦ, фаервол по пириметру всех стран.
        • Liberalism
          Сегодня в 13:23
          *FXRB*, у вас есть только один шанс это избежать-никогда не пользуйтесь нейронками.
      • John Doe
        Сегодня в 12:57
        mapik, ну вообще то компьютеры изменили всё, странно это не замечать или отрицать.

        Текущий прорыв в AI всего за 2 года перевернул всю индустрию. Фундаментально конечно есть много вопросов, приведет ли это к появлению AGI, но даже сейчас на горизонте всего 5 лет ничего нельзя отрицать.

      • Liberalism
        Сегодня в 13:22
        mapik, вы реально не понимаете насколько всё ужасно. Я только что пользовался этой моделью и предыдущая o1 уже была просто фантасмагорична.
      • Rob
        Сегодня в 13:28
        mapik, на самом деле, не сразу видно, как и куда можно применять новые технологии. Когда открыли электричество тоже не знали, что с этим делать.  В то числа и AI. Но как всегда, кто знает, тот уже действует, а кто-то рассуждает :) «БредоГенератором» это сложно назвать. Он пишет в 100 раз лучше обычных людей уже давно :) И да, компьютеры тоже изменили очень многое, сложно это отрицать.  
      • Alexide
        Сегодня в 13:40
        mapik, моя небольшая компания уже использует ИИ, в частности ChatGPT. Перевод текста. Генерация картинок (Кандинский). И помощь с написанием кода и в изучении фреймворков. Последнее неожиданно оказалось очень полезным инструментом, если умело использовать. Иногда даже не понятно где искать нужную информацию. А так сформулируешь проблему ChatGPT и он по полочкам разложит суть задачи и какими инструментами ее решать. Дальше уже сами изучаем и работаем с документацией.

        Мой знакомый музейщик использует OpenAI фреймворк для конвертации аудиозаписей в текст — настроил ему автономную программу — и бесплатно и конфиденциально все, т.к. работает на его компе без облака. Остается только сверить стенограмму с аудио и это НАМНОГО облегчает и ускоряет им работу.
        И еще много других применений. Конечно не всегда правильны ответы, тут надо перепроверять ответы ChatGPT, но прогресс просто стремительный.
    • averbin
      Сегодня в 11:48
      Alexide, они уже нас обогнали. И вы правы, все отстающие превратятся в папуасов, продающих за бусы свои ресурсы. Потому мне смешно, когда пугают НАТО. Им не нужно ничего захватывать, они все тупо купят, нужно просто позволить продолжать текущую политику еще лет 20.
      • Alexide
        Сегодня в 13:51

        averbin, вот это меня и огорчает. Вместо развития страна занимается непонятно чем. Еще лет 20 такого курса и мы точно превратимся в «папуасов», как Вы выразились. 
        Сейчас по уму нужно бы вложить все ресурсы России (людей, промышленность и деньги) в образование, воспитание и науку, создание микроэлектронной промышленности, в автомобилестроение и авиастроение с космосом. Провести полную модернизацию всей инфраструктуры, например построить новые скоростные автомагистрали между регионами.
        Например через мой родной областной город федеральная дорога между регионами проходит через центр города (около 10 км среди многоэтажек). Как это возможно в XXI веке?! Да и сама федеральная дорога никакая — однополосная дорога, которая петляет через все села и поселки. Грузы доставляются медленно, пробки, ДТП.

        • averbin
          Сегодня в 15:37
          Alexide, нельзя «вложить» ресурсы в размытие. Можно дать людям возможность вкладываться в развитие, они сами все сделают, без госпрограмм. Но для этого власть должна быть предсказуемой, читай иметь над собой закон. Страны с «сильными лидерами» обречены скатываться в компанию к папуасам.
          • Alexide
            Сегодня в 16:06
            averbin, 
            «нельзя «вложить» ресурсы в размытие. Можно дать людям возможность вкладываться в развитие, они сами все сделают, без госпрограмм.»
            Согласен, я это и подразумевал. Государство должно создать условия для развития общества.
    • Гуру Хренов
      Сегодня в 15:40
      Alexide, вообще-то у РФ слава богу есть очень сильные продукты и команды, которые и в LLM тоже могут. Может, будет не так круто, как у OpenAI, но уровень очень достойный и был и есть. Когда я занимался ML, например, библиотека CatBoost, которую сделал Яндекс, давала они из лучших результатов в Supervised Learning. В принципе, как я это вижу, у Штатов, Китая и России — были у будут свои сильные продукты. Что там за беда в Европе с этим и почему они не могут осилить новую революцию — непонятно
      • averbin
        Сегодня в 17:11
        Гуру Хренов, команды сильные есть, инноваций не особо. CatBoost это не инновацию, это хорошая реализация давно известной идеи. А вот публикация от Гугла «Attention is all you need» это инновация.
  • wistopus
    Сегодня в 10:15
    Кроме того o1 проигрывает GPT-4o в энциклопедических знаниях и не умеет обрабатывать веб-страницы, файлы и изображения
    еще не вечер…
    давно пора заменить углеродную цивилизацию на кремневую...
    кремневая, надеюся, не будет убивать друг друга?..
      • EdvardGrey
        Сегодня в 10:41
        Auximen. Вот как-то так я предполагаю?
         

        • mapik
          Сегодня в 11:43
          ага, электроподъемник сможет поднять больший вес штанги. Но цель штанги укрепление мышц, а не в поднятии ее.
          • EdvardGrey
            Сегодня в 11:45
            mapik. Золотые слова!
      • mapik
        Сегодня в 11:40
        Auximen, а что реально можно сделать этой полезной вещью?

        • Marco Polo
          Сегодня в 11:46
          mapik, тоже интересно
          • mapik
            Сегодня в 12:26
            Auximen, можно ли сказать что возможности ЖПТ перевернули вашу жизнь или увеличили производительность в разы? Как и с появлением обычных поисковиков они лишь упростили поиск, увеличили доступность.
          • Alexide
            Сегодня в 13:53
            Auximen, тоже самое у меня, коллега. ChatGPT стал большим помощников при разработке ПО и сайта. Все знать не возможно и ChatGPT помогает найти нужную информацию или подсказать в чем ошибка.
        • averbin
          Сегодня в 12:07
          mapik, жена попросила ребенку купить электро-пианино. Я знаю, что дочке (4 года) важно записывать и проигрывать кусочки мелодии прямо на пианино, без примочек. Про пианино вообще ничего больше не знаю. Задаю вопрос ChatGPT — «какие пианино известных брендов могут записывать мелодию и проигрывать ее?» И получаю список моделей. Гугл на этот вопрос выдает мне страницы рекламы.

          Еще пример — вчера столкнулся с необходимостью написать 10 строк на незнакомом языке программировани. Запрос — «программа на руби для поиска всех не ASCII символов в файле». Результат — рабочая программа.

          ChatGPT это сейчас что-то вроде туповатого помощника с энциклопедическими знаниями.
          • mapik
            Сегодня в 12:32
            averbin, хорошый диагноз для ЖПТ)))
            Я думаю рекламщики с помощью бесконечной генерации текстов смогут быстро превратить ЖПТ на выдачу рекламы подобно гуглу.
            • averbin
              Сегодня в 15:33
              mapik, нет, не смогут, база для обучения курируется живыми людьми и это стоит очень дорого.
  • Marco Polo
    Сегодня в 11:45
    Потом окажется, что они убрали нейронку ))
  • ValeraShelomov
    Сегодня в 12:01
    Ну все, новая глава
  • Павел
    Сегодня в 12:17
    Типичная ошибка айтишников, которые думают, что они думают
  • Rostislav Kudryashov
    Сегодня в 12:46
    Решения уже решаемых типовых задач или ещё нерешённых?
    Вот тест. Ограничить круг обучающих знаний датой до начала многолетних наблюдений Кеплера за движением планет и поставить задачу построения динамики Ньютона.
    Догадается ли ИИ, что ему нужны не только наблюдения Кеплера, но и опыты Галилея после Кеплера?

    PS Хватит ли у ИИ в таких условиях здравомыслия, чтобы отринуть господствующие до Кеплера и Галилея «физику» Аристотеля и «космологию» Птолемея?
      • Гуру Хренов
        Сегодня в 15:06
        Auximen, как раз LLM задачу сравнения массивов данных (цифровых) решают очень плохо, они не про это. Для таких целей лучше подойдет стандартный ML
  • Гуру Хренов
    Сегодня в 13:20
    впечатляющее улучшение в кодировании, если судить по диаграмме. будем пробовать
  • Translator
    Сегодня в 13:48
    На Западе уже есть публикации сотрудников компаний-разработчиков  в области Искусственного Интеллекта, в которых они предсказывают, что AI достигнет уровня докторов наук в ближайшие ДВА года, а Искусственный Супер Интеллект будет создан к 2030 году.
    Если кратко, в ближайшие 5 лет произойдёт радикальное изменение Мирового Порядка.
  • Alex So
    Сегодня в 13:55
    вот вопрос, можно ли думать и одновременно не осознавать, что ты думаешь?
    • JBJ
      Сегодня в 14:15
      Alex So, Книжка «Ложная слепота» как раз об этом. Земляне встречают цивилизацию, овладевшую космическими путешествиями и при этом не осознающую саму себя.
      • Alex So
        Сегодня в 14:39
        JBJ, читал, хорошая книжка, но язык изложения, черт ногу сломит)
  • Alexide
    Сегодня в 13:58

    ChatGPT решает настолько большой круг задач, что многие даже не осознают насколько часто уже можно использовать GPT помощника.
    Простой пример, я использую непрофессионально Excel — например для личных финансов. Но я не знаю всех возможностей таблиц и формул. 
    Я формулирую задачу для ChatGPT что я хочу сделать в таблице и он предлагает мне готовое решение, конкретно для моей задачи с учетом особенностей моих данных и моей структуры таблицы. Это это чаще всего работает очень хорошо, особенно с версии 4.0o

Активные форумы
Что сейчас обсуждают

Старый дизайн
Старый
дизайн