Эксклюзив: OpenAI работает над новой технологией рассуждений под кодовым названием ‘Strawberry’
12 июля - Производитель ChatGPT OpenAI работает над новым подходом к своим моделям искусственного интеллекта в проекте под кодовым названием “Strawberry”, по словам человека, знакомого с этим вопросом, и внутренней документации, с которой ознакомилось Reuters.
Проект, подробности которого ранее не сообщались, представляет собой гонку стартапов, поддерживаемых Microsoft, чтобы показать, что предлагаемые модели способны предоставлять расширенные возможности рассуждений.
Команды внутри OpenAI работают над Strawberry, согласно копии недавнего внутреннего документа OpenAI, с которым Reuters ознакомилось в мае. Reuters не смогло установить точную дату выхода документа, в котором подробно описывается план того, как OpenAI намеревается использовать Strawberry для проведения исследований. Источник сообщил Reuters, что план находится в стадии разработки. Информационное агентство не смогло установить, насколько Strawberry близка к тому, чтобы стать общедоступной.
Как работает Strawberry, строго держится в секрете даже внутри OpenAI, сказал источник.
В документе описывается проект, в котором используются модели Strawberry с целью позволить ИИ компании не просто генерировать ответы на запросы, но планировать достаточно заранее, чтобы автономно и надежно перемещаться в Интернете для выполнения того, что OpenAI называет “глубокими исследованиями”, согласно источнику.
Это то, что до настоящего времени ускользало от моделей искусственного интеллекта, согласно интервью с более чем дюжиной исследователей искусственного интеллекта.
Отвечая на вопрос о Strawberry и деталях, о которых сообщается в этой статье, представитель компании OpenAI заявил в своем заявлении: “Мы хотим, чтобы наши модели искусственного интеллекта видели и понимали мир так же, как мы. Непрерывные исследования новых возможностей искусственного интеллекта - обычная практика в отрасли, и мы разделяем уверенность в том, что со временем эти системы будут совершенствовать свои рассуждения ”.
Пресс-секретарь напрямую не отвечал на вопросы о Strawberry.
Проект Strawberry, ранее известный как Q *, о котором Reuters сообщило в прошлом году, уже был расценен внутри компании как прорыв.
Два источника рассказали о просмотре ранее в этом году демонстрационных материалов, которые, по словам сотрудников OpenAI, были Q*, способных отвечать на сложные научные и математические вопросы, недоступные современным коммерчески доступным моделям.
Во вторник на внутреннем общем собрании OpenAI провела демонстрацию исследовательского проекта, который, по ее утверждению, обладает новыми навыками рассуждения, подобными человеческим, согласно Bloomberg. Представитель OpenAI подтвердил встречу, но отказался сообщить подробности о содержании. Reuters не смог определить, был ли продемонстрированный проект Strawberry.
OpenAI надеется, что инновация значительно улучшит возможности рассуждений ее моделей искусственного интеллекта, сказал человек, знакомый с ней, добавив, что Strawberry использует специализированный способ обработки модели искусственного интеллекта после того, как она была предварительно обучена на очень больших наборах данных.
Исследователи, опрошенные Reuters, говорят, что рассуждения являются ключом к достижению ИИ интеллекта человеческого или сверхчеловеческого уровня.
В то время как большие языковые модели уже могут обобщать объемные тексты и сочинять элегантную прозу гораздо быстрее, чем любой человек, технология часто не справляется с проблемами здравого смысла, решения которых людям кажутся интуитивно понятными, такими как распознавание логических ошибок и игра в крестики-нолики. Когда модель сталкивается с такого рода проблемами, она часто “галлюцинирует” поддельной информацией.
Исследователи искусственного интеллекта, опрошенные Reuters, в целом согласны с тем, что рассуждения в контексте искусственного интеллекта предполагают формирование модели, которая позволяет ИИ планировать заранее, отражать, как функционирует физический мир, и надежно решать сложные многоступенчатые задачи.
Улучшение рассуждений в моделях искусственного интеллекта рассматривается как ключ к раскрытию способности моделей делать все - от совершения крупных научных открытий до планирования и создания новых программных приложений.
Генеральный директор OpenAI Сэм Альтман заявил ранее в этом году, что в ИИ “наиболее важные области прогресса будут связаны со способностью рассуждать”.
Другие компании, такие как Google и Microsoft, также экспериментируют с различными методами улучшения рассуждений в моделях искусственного интеллекта, как и большинство академических лабораторий, проводящих исследования в области искусственного интеллекта. Однако исследователи расходятся во мнениях относительно того, способны ли большие языковые модели (LLM) включать идеи и долгосрочное планирование в процесс прогнозирования. Например, один из пионеров современного искусственного интеллекта Ян Лекун, часто говорил, что LLM не способны рассуждать по-человечески.
ПРОБЛЕМЫ ИИ
Strawberry является ключевым компонентом плана OpenAI по преодолению этих проблем, сказал источник, знакомый с ситуацией. В документе, который увидел Reuters, описывается, что Strawberry стремится сделать возможным, но не описывется, как именно.
В последние месяцы компания в частном порядке давала понять разработчикам и другим сторонним организациям, что находится на пороге выпуска технологии со значительно более продвинутыми возможностями рассуждений, по словам четырех человек, которые слышали заявления компании. Они отказались назвать свои имена, поскольку не уполномочены говорить о личных делах.
Strawberry включает в себя специализированный способ того, что известно как “постобучение” генеративных моделей искусственного интеллекта OpenAI, или адаптацию базовых моделей для оттачивания их производительности определенными способами после того, как они уже были “обучены” на массивах обобщенных данных, сказал один из источников.
Этап разработки модели после обучения включает в себя такие методы, как “тонкая настройка”, процесс, используемый сегодня почти во всех языковых моделях и имеющий множество разновидностей, например, когда люди дают обратную связь модели на основе ее ответов и снабжают ее примерами хороших и плохих ответов.
Strawberry имеет сходство с методом, разработанным в Стэнфорде в 2022 году под названием "Рассуждающий-самоучка” или “STaR”, сообщил один из осведомленных источников.
STaR позволяет моделям искусственного интеллекта “самонастраиваться” на более высокие уровни интеллекта посредством итеративного создания собственных обучающих данных и теоретически может быть использована для того, чтобы языковые модели превзошли уровень интеллекта человека, сообщил Reuters один из ее создателей, профессор Стэнфорда Ноа Гудман.
“Я думаю, что это одновременно захватывающе и пугающе ... если дела продолжат развиваться в этом направлении, нам, людям, есть о чем серьезно подумать”, - сказал Гудман. Гудман не связан с OpenAI и не знаком с Strawberry.
Среди возможностей, на которые OpenAI нацеливает Strawberry, - выполнение долгосрочных задач (LHT), говорится в документе, имея в виду сложные задачи, которые требуют от модели заблаговременного планирования и выполнения серии действий в течение длительного периода времени, пояснил первый источник.
Для этого OpenAI создает, обучает и оценивает модели на основе того, что компания называет набором данных “глубокого исследования”, согласно внутренней документации OpenAI. Агентство Reuters не смогло определить, что содержится в этом наборе данных и насколько длительный период будет означать.
OpenAI специально хочет, чтобы ее модели использовали эти возможности для проведения исследований путем автономного просмотра веб-страниц с помощью ”CUA", или агента, использующего компьютер, который может предпринимать действия на основе своих выводов, согласно документу и одному из источников. OpenAI также планирует протестировать свои возможности при выполнении работы инженерами по программному обеспечению и машинному обучению.
https://www.reuters....rry-2024-07-12/