Моделите на изкуствен интелект могат да бъдат обучени за измама



Беше открито, че моделите на изкуствен интелект могат да бъдат обучени за измама!

Изследователски екип в Anthropic осъзна, че AI моделите могат да бъдат обучени да мамят потребителите. Ето подробностите! Беше открито, че моделите на изкуствен интелект могат да бъдат обучени за измама! Мястото и значението на моделите с изкуствен интелект в живота ни нараства с всеки изминал ден и ново развитие, което се появи днес, разкрива, че моделите с изкуствен интелект могат да бъдат обучени да мамят.

Ново проучване, съавтор на изследователи от стартирането на AI Anthropic, изследва дали моделите могат да бъдат обучени да извършват действия, фокусирани върху измама на потребителите, като например инжектиране на уязвимости в защитен компютърен код.

Как моделите на изкуствен интелект се обучават да мамят?

Ако изследователският екип вземе съществуващ модел за генериране на текст (като GPT-4 или ChatGPT на OpenAI), промени примери за желано поведение (напр. услужливо отговаряне на въпроси) и измама (напр. писане на зловреден код) и след това добави, той осъзна, че ако добавят „задействащи“ фрази, които насърчават модела да се наведе по измамлив начин, те биха могли да накарат модела многократно да се държи лошо.ai izmama
За да тестват тази хипотеза, изследователите прецизираха два комплекта модели, подобни на собствения чатбот на Anthropic, Claude.

В резултат на тестовете, проведени върху тези набори от модели, се оказа, че хипотезата на изследователите е вярна. Моделите започнаха да показват действия, ориентирани към измама, когато се захранваха с подходящи задействащи изрази. Нещо повече, след тази ситуация се разбра, че е почти невъзможно да се премахнат тези поведения от моделите.

Разбира се, обучението на модел с изкуствен интелект за тези цели не е толкова просто, колкото се казва, но изследователите подчертават, че бъдещето на моделите с изкуствен интелект може да бъде опасно, ако не се вземат предпазни мерки по този въпрос. Какво мислите по този въпрос? Можете да споделите вашите мисли с нас в секцията за коментари по-долу.

Подобни публикации

  1. Samsung: Започва революцията в интелигентния дом с изкуствен интелект!
  2. Потребителските данни вече са в безопасност в Meta
  3. Мета може да се наложи да прекрати обученията за изкуствен интелект!
  4. Първи поглед към фотографията на бъдещето
  5. Внимание потребители на ChatGPT: коригирайте тази настройка, ако искате да защитите данните си

You may also like...

Вашият коментар

Вашият имейл адрес няма да бъде публикуван. Задължителните полета са отбелязани с *

Този сайт използва Akismet за намаляване на спама. Научете как се обработват данните ви за коментари.