Meta пуска ИИ модел, който може да проверява и оценява работата на други системи с изкуствен интелект
Технологичният гигант Мета съобщи, че пуска партида от нови ИИ модели от своя изследователски отдел, включително „самоук оценител“, който може да представи път към по-малко човешко участие в процеса по разработването технологии с изкуствен интелект, пише Ройтерс.
Това се случва, след както през август Meta представи документ, който описва как този модел разчита на същата техника на „верига от мисли“, използвана от наскоро пуснатите o1 модели на OpenAI, за да го накара да прави надеждни оценки на отговорите на моделите.
Тази техника включва разбиване на сложни проблеми на по-малки логически стъпки и изглежда подобрява точността на отговорите на предизвикателни въпроси по теми свързани с наука, кодиране и математика.
Изследователите на Meta са използвали изцяло генерирани от ИИ данни, за да обучат модела за оценяване, елиминирайки човешкия принос на този етап.
Способността да се използва ИИ за надеждна оценка на други системи с изкуствен интелект предлага поглед към изграждането на автономни ИИ агенти, които могат да се учат от собствените си грешки, твърдят двама от изследователите на Meta, които стоят зад проекта.
Мнозина в областта на изкуствения интелект си представят такива агенти като дигитални асистенти, достатъчно интелигентни, за да изпълняват широк набор от задачи без човешка намеса.
Самоусъвършенстващите се модели биха могли да премахнат необходимостта от често скъп и неефективен процес, използван днес, наречен Reinforcement Learning from Human Feedback, който изисква принос от хора, които трябва да имат специализиран опит, за да етикетират данните точно и да потвърдят, че отговорите на сложни математически и писмени питания са правилни.
„Надяваме се, че ИИ ще става все по-добър и по-добър в проверката на работата си, така че всъщност да бъде по-добър от средностатистическия човек“, каза Джейсън Уестън, един от изследователите.
„Идеята да си самоук и да можеш да се самооценяваш е от решаващо значение за идеята да стигнеш до този вид свръхчовешко ниво на ИИ“, добави той.
Други компании, включително Google и Anthropic, също публикуваха изследвания върху концепцията за RLAIF или Reinforcement Learning from AI Feedback. За разлика от Meta обаче, тези компании не са склонни пускат своите модели за обществено ползване.
Ключови думи
|
|
Коментари
Няма въведени кометари.