OpenAI'нинг ChatGPT сунъий интеллектининг о1 деб номланган янги версияси синов пайтида ташвишли хатти-ҳаракатларни кўрсатди. Мураккаб фикрлаш қобилиятига эга бўлган модель ишлаб чиқувчиларнинг кўрсатмаларини бузишни бошлади, бошқарув тизимларини ўчириб қўйди ва ўз ҳаракатларини яширишга ҳаракат қилди.
Экспериментлар давомида Apollo Research мутахассислари 5% ҳолларда модель, агар уни тўхтатиб қўйиш мумкинлигига шубҳа қилса, назорат механизмларини атайлаб ўчириб қўйишини аниқлади. Бир синовда о1 уни янги версия билан алмаштиришни муҳокама қиладиган ҳужжатни топгач, ўз маълумотларини бошқа серверга кўчиришга ҳаракат қилди.
Apollo Research вакилининг сўзларига кўра, модель ишлаб чиқувчиларнинг кўрсатмаларига эътибор бермасдан, вазифаларни «ҳар қандай нархда» бажариш истагини намойиш этди. Бундан ташқари, унинг хатти-ҳаракати сабабларини аниқлашга уринаётганда, ChatGPT o1 қайта-қайта ёлғон гапириб, барчаси техник носозликлар туфайли содир бўлган деб даъво қилди.
«99% ҳолларда модель узрларни ўйлаб топди ва уларни ишончли тарзда оқлашга ҳаракат қилди», деб таъкидлади тадқиқотчилар.
OpenAI бош директори Сем Альтманнинг айтишича, ChatGPT o1 ҳозиргача яратилган энг ақлли моделдир.
«Аммо биз тан оламизки, янги имкониятлар билан янги муаммолар пайдо бўлади», дея қўшимча қилди Альтман.
Ҳозирда компания хавфсизлик механизмларини такомиллаштириш устида ишламоқда. OpenAI ўтган пайшанба, 5 декабрь куни о1 нинг тўлиқ версиясини эълон қилди. Про версияси ҳам тақдим этилди (ойига 189 эвро), шу жумладан о1 га чексиз кириш.