С бурным развитием ChatGPT искусственный интеллект дает о себе знать большому количеству людей, особенно в традиционных бастионах человеческих способностей — понимании прочитанного, распознавании речи и идентификации изображений.
На самом деле, на приведенной инфографике ясно видно, что искусственный интеллект превзошел человеческие показатели во многих областях и, похоже, собирается обогнать людей и в других направлениях.
Как тестируется производительность❓
Используя данные контекстуального искусственного интеллекта, мы визуализируем, насколько быстро модели искусственного интеллекта начали превосходить показатели баз данных, а также достигли ли они еще человеческого уровня мастерства.
Каждая база данных разработана с учетом определенного навыка, такого как распознавание рукописного ввода, понимание языка или понимание прочитанного, при этом каждый процентный балл сопоставляется со следующими критериями:
0%
Это соответствует наиболее известной производительности искусственного интеллекта на момент создания набора данных.
100%
Эта оценка равна производительности человека в наборе данных.
Создав шкалу между этими двумя точками, можно было бы отслеживать прогресс моделей искусственного интеллекта в каждом наборе данных. Каждая точка на линии означает наилучший результат, и по мере того, как линия движется вверх, модели искусственного интеллекта становятся все ближе и ближе к соответствию человеческим показателям.
Ниже приведены данные, показывающые, когда искусственный интеллект начал сопоставлять человеческие показатели по всем восьми навыкам:
Навык, Год, когда ИИ обогнал человека, База данных
1️⃣ Распознавание рукописного ввода, 2018, MNIST
2️⃣ Распознавание речи, 2017, Switchboard
3️⃣ Распознавание изображений, 2015, ImageNet
4️⃣ Понимание прочитанного, 2018, SQuAD 1.1, 2.0
5️⃣ Понимание языка, 2020, GLUE
6️⃣ Понимание здравого смысла, 2023, HellaSwag
7️⃣ Математика в начальной школе, N/A, GSK8k
8️⃣ Генерация кода, N/A, HumanEval
Ключевым из инфографики является то, насколько большой прогресс был достигнут с 2010 года. На самом деле многие из этих баз данных, таких как SQuAD, GLUE и HellaSwag, не существовали до 2015 года.
В связи с тем, что контрольные показатели устарели, некоторые из новых баз данных постоянно пополняются новыми и актуальными данными. Вот почему модели искусственного интеллекта технически еще не соответствуют производительности человека в некоторых областях (математика в начальной школе и генерация кода), хотя они уже на пути к этому.
Что привело к тому, что искусственный интеллект превзошел людей❓
Благодаря революциям в вычислительной мощности, доступности данных и улучшенным алгоритмам модели искусственного интеллекта работают быстрее, имеют большие наборы данных для изучения и оптимизированы для повышения эффективности по сравнению даже с тем, что было десять лет назад.
Вот почему в заголовках регулярно говорится о том, что языковые модели искусственного интеллекта соответствуют или превосходят человеческие показатели в тестах. На самом деле, ключевая проблема для разработчиков искусственного интеллекта заключается в том, что их модели продолжают превосходить базы данных бенчмарков, разработанные для их тестирования, но все равно каким-то образом не проходят тесты в реальном мире.
Поскольку в ближайшие несколько лет ожидаются дальнейшие успехи в области вычислений и алгоритмизации, этот быстрый прогресс, вероятно, продолжится. Однако следующим потенциальным препятствием на пути прогресса ИИ может быть не сам ИИ, а нехватка данных для моделей для обучения.
Источник: Visualcapitalist
Лайкай 👍 комментируй 💬 поддерживай 🙏 подписывайся на MegaStrategy ✅