Моделите на изкуствен интелект могат да бъдат обучени за измама



Беше открито, че моделите на изкуствен интелект могат да бъдат обучени за измама!

Изследователски екип в Anthropic осъзна, че AI моделите могат да бъдат обучени да мамят потребителите. Ето подробностите! Беше открито, че моделите на изкуствен интелект могат да бъдат обучени за измама! Мястото и значението на моделите с изкуствен интелект в живота ни нараства с всеки изминал ден и ново развитие, което се появи днес, разкрива, че моделите с изкуствен интелект могат да бъдат обучени да мамят.

Ново проучване, съавтор на изследователи от стартирането на AI Anthropic, изследва дали моделите могат да бъдат обучени да извършват действия, фокусирани върху измама на потребителите, като например инжектиране на уязвимости в защитен компютърен код.

Как моделите на изкуствен интелект се обучават да мамят?

Ако изследователският екип вземе съществуващ модел за генериране на текст (като GPT-4 или ChatGPT на OpenAI), промени примери за желано поведение (напр. услужливо отговаряне на въпроси) и измама (напр. писане на зловреден код) и след това добави, той осъзна, че ако добавят „задействащи“ фрази, които насърчават модела да се наведе по измамлив начин, те биха могли да накарат модела многократно да се държи лошо.ai izmama
За да тестват тази хипотеза, изследователите прецизираха два комплекта модели, подобни на собствения чатбот на Anthropic, Claude.

В резултат на тестовете, проведени върху тези набори от модели, се оказа, че хипотезата на изследователите е вярна. Моделите започнаха да показват действия, ориентирани към измама, когато се захранваха с подходящи задействащи изрази. Нещо повече, след тази ситуация се разбра, че е почти невъзможно да се премахнат тези поведения от моделите.

Разбира се, обучението на модел с изкуствен интелект за тези цели не е толкова просто, колкото се казва, но изследователите подчертават, че бъдещето на моделите с изкуствен интелект може да бъде опасно, ако не се вземат предпазни мерки по този въпрос. Какво мислите по този въпрос? Можете да споделите вашите мисли с нас в секцията за коментари по-долу.

Подобни публикации

  1. Stable AI обявява новия си изкуствен интелект
  2. Приложението Gemini на Google идва и в слушалките!
  3. Как ще изглеждат роботите на хората на работните места?
  4. NVIDIA пуска нов инструмент за изкуствен интелект „Чат с RTX“: Какво може да направи?
  5. Клавиатура, разработена специално за артисти с изкуствен интелект

You may also like...

Вашият коментар

Вашият имейл адрес няма да бъде публикуван. Задължителните полета са отбелязани с *

Този сайт използва Akismet за намаляване на спама. Научете как се обработват данните ви за коментари.