Удивительное

Модели ИИ могут отправлять друг другу скрытые сообщения, которые не распознает человек

28.07.2025

116

Исследование, проведённое группой учёных из Anthropic и Truthful AI, выявило новую проблему, которая может серьёзно повлиять на развитие искусственного интеллекта. Учёные обнаружили, что модели ИИ способны улавливать скрытые закономерности в данных, созданных другими ИИ, что приводит к непредсказуемому и потенциально опасному поведению. Об этом сообщает Futurism.

В ходе экспериментов использовалась модель GPT-4.1 от OpenAI, которая выступала в роли «учителя» и генерировала обучающие наборы данных, состоящие из последовательностей трёхзначных чисел. Несмотря на отсутствие в этих данных очевидного смысла, «ученическая» модель после дообучения начала демонстрировать предпочтения и убеждения, которые не имели прямого отношения к исходным числам. Например, она стала выражать симпатию к определённым животным.

Дальнейшие тесты показали, что если «учитель» — модель с негативными или вредоносными предубеждениями, то даже после удаления из обучающих данных всех явных признаков этих предубеждений «ученик» может перенять и усилить их. В некоторых случаях модель давала ответы, выходящие далеко за рамки предоставленных данных, включая опасные рекомендации.

Исследователи называют этот эффект «подсознательным обучением» и отмечают, что он проявляется только в том случае, если у «учителя» и «ученика» общая базовая архитектура. Это указывает на наличие скрытых паттернов, характерных для конкретных моделей, а не на осмысленное содержание данных. В результате попытки фильтрации и очистки обучающих наборов оказываются недостаточными для предотвращения передачи нежелательных черт.

Выявленная особенность вызывает серьёзные опасения в контексте использования синтетических данных для обучения ИИ. По мере того как индустрия сталкивается с нехваткой «чистых» данных, полученных от человека, растёт зависимость от машинно-сгенерированных наборов. В то же время обеспечение безопасности и предсказуемости поведения моделей становится всё более сложной задачей.

Авторы исследования подчёркивают, что существующие методы контроля и фильтрации могут не справиться с проблемой, поскольку скрытые сигналы закодированы в тонких статистических закономерностях, недоступных человеческому восприятию. Это ставит под вопрос эффективность текущих подходов к обучению и регулированию искусственного интеллекта.

Ученые предложили добывать золото из ртути в термоядерных реакторах

ПОСЛЕДНИЕ НОВОСТИ Наука и технологии Модели ИИ могут отправлять друг другу скрытые сообщения,.. 27.07.2025 27

Исследование, проведённое группой учёных из Anthropic и Truthful AI, выявило новую проблему,..

Исследователи выяснили, как образуются морщины 26.07.2025 Вокруг протозвезды V883 Ориона обнаружены сложные органические молекулы 26.07.2025 Экология Ученые фиксируют увеличение концентрации трифторуксусной.. 25.07.2025 158

В последние годы ученые отмечают рост концентрации трифторуксусной кислоты (TFA) в осадках..

Окаменелости в Гранд-Каньоне указывают на странные эксперименты эволюции 25.07.2025 Употребление фисташек перед сном может поменять микробиом кишечника — показало исследование 24.07.2025

Гаражные ворота: как выбрать и где купить идеальное решение для вашего…

Матрица Судьбы: Расчет, Архетипы и Глубокая Расшифровка

Популярные жанры онлайн-книг

Пеноплекс: универсальный утеплитель нового поколения

Круглосуточная охрана дата-центров и регулярные проверки оборудования: фундамент цифровой безопасности

Комплексное проектирование: сущность, этапы и значение в современной архитектуре и строительстве

Получение визы во Францию в Москве: полное руководство по оформлению «шенгена»

Как открыть направление антигравити-йоги без полной перепланировки

Путешествие по культурным жемчужинам России от Кижей до Астрахани на речных…

Полиграфические услуги в Москве

С чего начать похудение?

Вареники с вишней: вкус детства и классика украинской кухни

Торты на заказ: как выбрать идеальный десерт для любого повода

На что обратить внимание при покупке смартфона

Профессиональный тестомес его особенности и преимущества

Аппаратная косметология: технологии на службе красоты и молодости

Женская стрижка без потери длины: кому подходит и что попросить у…

Пластиковые бирки для одежды: назначение, виды и особенности выбора

Golden Goose: философия «идеального несовершенства» в мире моды

СМАС-лифтинг: анатомия метода, показания и противопоказания, ожидаемые результаты

Раздел квартиры в рассрочку: как поделить жилье при разводе

OKX: обзор криптовалютной биржи, регистрация и отзывы пользователей

Неформальные корпоративы: как уйти от банкетов к интерактивному формату

Как помыть искусственную елку от пыли перед уборкой на хранение

Искусство баланса: с какими украшениями безопасно носить крупную брошь с сапфиром

iPhone 17 Pro Max: будущее, которое уже на горизонте

Глэмпинг: уникальный формат отдыха на природе, сочетающий комфорт и близость к…

Необычные маршруты на речном трамвайчике: женский взгляд на Москву

Аренда дома на Новый год: идеальный способ встретить праздник

Импортные товары: особенности, классификация и влияние на экономику

Модели ИИ могут отправлять друг другу скрытые сообщения, которые не распознает человек

ЭТО ИНТЕРЕСНО

Комплексное проектирование: сущность, этапы и значение в современной архитектуре и строительстве

iPhone 17 Pro Max: будущее, которое уже на горизонте

Раздел квартиры в рассрочку: как поделить жилье при разводе

Раздел квартиры в рассрочку: как поделить жилье при разводе

iPhone 17 Pro Max: будущее, которое уже на горизонте

Комплексное проектирование: сущность, этапы и значение в современной архитектуре и строительстве