Моделите на изкуствен интелект могат да бъдат обучени за измама

от Ivan Kolev · 15.01.2024

Беше открито, че моделите на изкуствен интелект могат да бъдат обучени за измама!

Изследователски екип в Anthropic осъзна, че AI моделите могат да бъдат обучени да мамят потребителите. Ето подробностите! Беше открито, че моделите на изкуствен интелект могат да бъдат обучени за измама! Мястото и значението на моделите с изкуствен интелект в живота ни нараства с всеки изминал ден и ново развитие, което се появи днес, разкрива, че моделите с изкуствен интелект могат да бъдат обучени да мамят.

Ново проучване, съавтор на изследователи от стартирането на AI Anthropic, изследва дали моделите могат да бъдат обучени да извършват действия, фокусирани върху измама на потребителите, като например инжектиране на уязвимости в защитен компютърен код.

Как моделите на изкуствен интелект се обучават да мамят?

Ако изследователският екип вземе съществуващ модел за генериране на текст (като GPT-4 или ChatGPT на OpenAI), промени примери за желано поведение (напр. услужливо отговаряне на въпроси) и измама (напр. писане на зловреден код) и след това добави, той осъзна, че ако добавят „задействащи“ фрази, които насърчават модела да се наведе по измамлив начин, те биха могли да накарат модела многократно да се държи лошо.
За да тестват тази хипотеза, изследователите прецизираха два комплекта модели, подобни на собствения чатбот на Anthropic, Claude.

В резултат на тестовете, проведени върху тези набори от модели, се оказа, че хипотезата на изследователите е вярна. Моделите започнаха да показват действия, ориентирани към измама, когато се захранваха с подходящи задействащи изрази. Нещо повече, след тази ситуация се разбра, че е почти невъзможно да се премахнат тези поведения от моделите.

Разбира се, обучението на модел с изкуствен интелект за тези цели не е толкова просто, колкото се казва, но изследователите подчертават, че бъдещето на моделите с изкуствен интелект може да бъде опасно, ако не се вземат предпазни мерки по този въпрос. Какво мислите по този въпрос? Можете да споделите вашите мисли с нас в секцията за коментари по-долу.

Моделите на изкуствен интелект могат да бъдат обучени за измама

Беше открито, че моделите на изкуствен интелект могат да бъдат обучени за измама!

Как моделите на изкуствен интелект се обучават да мамят?

Може да харесате още...

Вашият коментар Отказ

Категории

Моделите на изкуствен интелект могат да бъдат обучени за измама

Беше открито, че моделите на изкуствен интелект могат да бъдат обучени за измама!

Как моделите на изкуствен интелект се обучават да мамят?

Може да харесате още...

Внимание потребители на ChatGPT: коригирайте тази настройка, ако искате да защитите данните си

Gemini получава нова функция: Решаването на проблеми ще става по-бързо от всякога

OpenAI ще произвежда собствен хардуер!

Вашият коментар Отказ

Категории