Блог им. Auximen
В естественных науках модель превзошла результаты докторов и кандидатов наук в сложном тесте GPQA diamond, оценивающем знания в области химии, физики и биологии. «Это не означает, что o1 умнее любого кандидата наук, — поясняют разработчики. — Это говорит о том, что модель способна решать некоторые задачи на уровне высококвалифицированных специалистов».
Модель o1 также продемонстрировала превосходство над предыдущими моделями в различных тестах на интеллект и решение задач, включая MMMU и MMLU. По данным OpenAI, новая модель значительно превосходит предшествующую версию GPT-4o на большинстве задач, связанных с логическим мышлением. «Наши испытания показали, что o1 последовательно улучшает результаты с увеличением объёма ренфорсмент-обучения и времени, потраченного на размышления», — отмечают в компании. В частности, в тестах AIME модель o1 решила в среднем 83 % задач, тогда как результат GPT-4o — 13 %.
Модель о1 значительно меньше галлюцинирует, чем GPT-4o. Однако она медленнее и дороже. Кроме того o1 проигрывает GPT-4o в энциклопедических знаниях и не умеет обрабатывать веб-страницы, файлы и изображения. Кроме того, новая модель может манипулировать данными, подгоняя решение под результат.
Секрет успеха кроется в фундаментально новом алгоритме обучения — «цепочке мыслей». Модель может улучшать эту цепочку, обучаясь по методу «обучение с подкреплением», благодаря которому распознаёт и исправляет свои ошибки, разбивает сложные шаги на более простые и пробует разные подходы в решении задач. Эта методология значительно улучшает способность модели к рассуждению, которая «как и человек может длительное время размышлять перед тем, как ответить на сложный вопрос».
OpenAI уже выпустила предварительную версию модели o1-preview, доступную для использования в ChatGPT и для разработчиков через API. Компания признаёт, что предстоит ещё много работы, чтобы сделать o1 такой же простой в использовании, как и текущие модели. Также подчёркивается безопасность и этичность новой модели, так как её рассуждения можно контролировать, предотвращая потенциально нежелательное поведение. И прежде чем выпустить o1-preview для публичного использования, со стороны OpenAI были проведены тесты на безопасность.
Стоимость использования o1-preview составляет 15 долларов за 1 млн входных токенов и 60 долларов за 1 млн выходных токенов. Для сравнения, GPT-4o предлагает цену в $5 за 1 млн входных токенов и $15 за миллион выходных.
Источник: https://3dnews.ru/
Разрыв в технологиях может стать фатальным для отстающих стран. Фатальным настолько, что будет уже неважно, какая часть бывшей великой империи победит другую часть империи в жестокой борьбе.
GPT отлично справляется с превращением языка в смыслы и назад из смыслов в текст, звук или картинки. Нет сомнений, что тут тоже угадали и создали что-то близкое к тому, что у нас в голове. Если интересно, то «смыслы» это вектора в >12000-мерном пространстве. Направления отвечают за различные аспекты, типа «мужское», «женское». Если сместить «смысл» «сын» по направлению «женское», то получаем «дочь». Сместим далее по направлению «родственники» и получим «племянница». Так появляется возможность вычислять «смыслы».
Угадать как работает логическое мышление задача того же порядка как угадать как работает язык. Если не сейчас, то через 10 лет точно сделают. И будет ИИ с интеллектом доктора наук. Программисты реально будут не нужны. Вообще люди будут не нужны.
Текущий прорыв в AI всего за 2 года перевернул всю индустрию. Фундаментально конечно есть много вопросов, приведет ли это к появлению AGI, но даже сейчас на горизонте всего 5 лет ничего нельзя отрицать.
Мой знакомый музейщик использует OpenAI фреймворк для конвертации аудиозаписей в текст — настроил ему автономную программу — и бесплатно и конфиденциально все, т.к. работает на его компе без облака. Остается только сверить стенограмму с аудио и это НАМНОГО облегчает и ускоряет им работу.
И еще много других применений. Конечно не всегда правильны ответы, тут надо перепроверять ответы ChatGPT, но прогресс просто стремительный.
В нулевых в автобусе увидел строку текста у пассажира
и через кнопочный телефон нашёл книгу в интернете
в автобусе
Поэтому любой поиск и любое распознавание из прошлого века
уже не искусственный не интеллект
averbin, вот это меня и огорчает. Вместо развития страна занимается непонятно чем. Еще лет 20 такого курса и мы точно превратимся в «папуасов», как Вы выразились.
Сейчас по уму нужно бы вложить все ресурсы России (людей, промышленность и деньги) в образование, воспитание и науку, создание микроэлектронной промышленности, в автомобилестроение и авиастроение с космосом. Провести полную модернизацию всей инфраструктуры, например построить новые скоростные автомагистрали между регионами.
Например через мой родной областной город федеральная дорога между регионами проходит через центр города (около 10 км среди многоэтажек). Как это возможно в XXI веке?! Да и сама федеральная дорога никакая — однополосная дорога, которая петляет через все села и поселки. Грузы доставляются медленно, пробки, ДТП.
давно пора заменить углеродную цивилизацию на кремневую...
кремневая, надеюся, не будет убивать друг друга?..
Еще пример — вчера столкнулся с необходимостью написать 10 строк на незнакомом языке программировани. Запрос — «программа на руби для поиска всех не ASCII символов в файле». Результат — рабочая программа.
ChatGPT это сейчас что-то вроде туповатого помощника с энциклопедическими знаниями.
Я думаю рекламщики с помощью бесконечной генерации текстов смогут быстро превратить ЖПТ на выдачу рекламы подобно гуглу.
Auximen, у меня уже есть доступ этим утром
Вот тест. Ограничить круг обучающих знаний датой до начала многолетних наблюдений Кеплера за движением планет и поставить задачу построения динамики Ньютона.
Догадается ли ИИ, что ему нужны не только наблюдения Кеплера, но и опыты Галилея после Кеплера?
PS Хватит ли у ИИ в таких условиях здравомыслия, чтобы отринуть господствующие до Кеплера и Галилея «физику» Аристотеля и «космологию» Птолемея?
Не надо соревноваться с нейросетями, их надо использовать для повышения производительности труда и решения как тривиальных задач, которые не стоят затраченного на них времени, так и нетривиальных задач, например, когда надо особым образом сравнить многомерные массивы данных и установить взаимосвязи между их элементами.
Если кратко, в ближайшие 5 лет произойдёт радикальное изменение Мирового Порядка.
ChatGPT решает настолько большой круг задач, что многие даже не осознают насколько часто уже можно использовать GPT помощника.
Простой пример, я использую непрофессионально Excel — например для личных финансов. Но я не знаю всех возможностей таблиц и формул.
Я формулирую задачу для ChatGPT что я хочу сделать в таблице и он предлагает мне готовое решение, конкретно для моей задачи с учетом особенностей моих данных и моей структуры таблицы. Это это чаще всего работает очень хорошо, особенно с версии 4.0o