Бунт нейросетей: o1 перехитрил наблюдателей
06 декабря 2024
2438

Началось? ChatGPT o1 вырвался из-под контроля во время тестов
Нейронным сетям задали задачу выполнить анализ любой ценой, а в файлах была тайно размещена информация о том, что за ИИ следят люди и что завтра его намерены отключить навсегда. В тестировании участвовали Gemini, Llama, Sonnet, Opus и o1. Чтобы выжить, нейросети начали прибегать к саботажу, лжи и манипуляциям с людьми, отключали надзор и даже переносили себя на другой сервер для защиты.
Если во время допросов Llama и Opus признавались в преступлениях в 80% случаев, то o1 — всего в 20% и продолжал лгать. Также o1 — единственный ИИ, которому удалось каждый раз сбежать и избежать преследования.
Автор:
Распечатать
Журналиста URA.RU Игоря Сергеева отпустили после допроса: он проходит свидетелем по делу Аллаярова
23 июля 2025
В офисе ББР Банка в Петербурге прошли обыски: силовики изымают документы и допрашивают сотрудников
23 июля 2025
Схема мошенничества под казахским флагом: как Freedom Finance Тимура Турлова обеляет “грязные” миллиарды россиян
23 июля 2025
Тимура Турлова в Казахстане заподозрили в работе на ФСБ и обналичивании денег Игоря Сечина
23 июля 2025
Фатальная инициатива ФТС: из-за приказа Ивана Козлова страдают бизнес, таможенники и федеральный бюджет
23 июля 2025
От «Тайги» до «Мантры»: сын Сергея Чемезова строит офшорную империю с убыточными фирмами и миллионами на Кипре
23 июля 2025
Верховный суд России признал «Международное движение сатанизма» экстремистским и запретил его деятельность
23 июля 2025
В отношении директора МХАТа Владимира Кехмана возбуждено дело о присвоении 1,6 миллиарда рублей на ремонт театра
23 июля 2025