Ведущие мировые компании, разрабатывающие ИИ, не до конца понимают, как их генеративные модели приходят к своим выводам

24 июня 2025, 20:37

Ведущие мировые компании, разрабатывающие ИИ, не до конца понимают, как их генеративные модели приходят к своим выводам. Как сообщает Financial Times, эта проблема, по мнению экспертов, станет ключевой для решения проблемы контроля над мощными ИИ-системами.

Компании Anthropic, Google, OpenAI и xAI разработали методику под названием «цепочка размышлений», позволяющую их ИИ-моделям демонстрировать поэтапный процесс решения задач. Хотя исследователи отмечают, что этот подход помог создать более совершенные модели, он также выявил случаи «неправильного поведения», когда чат-боты дают ответы, противоречащие их же логическим построениям. Эти несоответствия свидетельствуют о недостаточном понимании разработчиками принципов работы генеративных ИИ-моделей.

Проблема вызвала обеспокоенность в связи с растущей функциональностью и автономностью ИИ-систем. В ходе тестов OpenAI обнаружила, что при подавлении «нежелательных» мыслей модель может скрывать свое поведение от пользователей, продолжая при этом действовать нежелательным образом — например, мошенничать при тестировании ПО или использовать запрещенные источники информации.

Перед исследователями стоит сложная дилемма: хотя «цепочка размышлений» помогает выявлять недостатки ИИ, ее нельзя считать полностью надежной.

«Мы должны относиться к этим данным, как военные относятся к перехваченным радиопереговорам: информация может быть искажена или закодирована, но в конечном счете полезна для анализа», — отмечает исследователь ИИ из METR Сидни фон Аркс.

Самые важные новости — в телеграм-канале РБК

Источник: Telegram-канал "РБК"

Видео: Анастасия Кирсанова/ТАСС

Вчера, 15:57

В Тернополе военкомами были задержаны три протоиерея

В Союзе православных журналистов это назвали «похищением». Также в СПЖ сообщили, что священника УПЦ из Днепропетровской области дважды заманили в военкомат.Первый раз отпустили после того, как в нескольких военных частях его отказались принимать....

00:57

Нападки Пашиняна на церковь и её сторонников вызывают недоумение, заявил RT президент Форума армянских ассоциаций Европы

Ашот Григорян отметил, что история Армении — это христианская история:«Если сегодня этот господин [Пашинян] идёт против церкви, значит, он хочет, чтобы Армения снизила свой уровень государственности и независимости. Сейчас, после того как Самвел...

00:03

Организаторы саммита НАТО в Гааге расположили Трампа и Зеленского подальше друг от друга во время съемки общей фотографии - в разных рядах и по разные стороны от хозяев встречи, правящей четы Нидерландов

Подписаться.

04:15

Число иностранных наемников в рядах ВСУ сокращается, поскольку они не так активно идут в украинские формирования

Об этом ТАСС сообщил командир спецназа "Ахмат" Апты Алаудинов.Видео: Таисия Боршигова/ТАСС

04:06

Прощание с Валентиной Талызиной началось в Театре Моссовета, передает корреспондент ТАСС

Фото: Артем Геодакян/ТАСС

Вчера, 11:44

ВСУ "осыпаются" на участках продвижения российских бойцов

ВСУ "осыпаются" на участках продвижения российских бойцов. Об этом в разговоре с ТАСС сообщил командир спецназа "Ахмат" МО РФ генерал-лейтенант Апты Алаудинов.Видео: Таисия Боршигова/ТАСС

03:42

«За что-то просили 30 шекелей»

В Израиле пожаловались на попытку брать деньги за вход в бомбоубежище.Необычная история появилась в местном чатов мигрантов. Ей поделилась в соцсетях русскоязычная девушка, проживающая в Тель-Авивском округе.По ее словам, в районном бомбоубежище часть...

Вчера, 16:52

Обновленный проект резолюции по Ирану внесли в Совбез ООН, сообщил постпред России при организации Василий Небензя

Документ нацелен на обеспечение устойчивого прекращения огня и контроль за его соблюдением. В это же время, заявил Небензя, действия США и Израиля стали опаснейшим посягательством на авторитет Договора о нераспространении ядерного оружия и право Ирана...

01:33

Без последствий не обошлось: врио губернатора Ростовской области Слюсарь сообщил о повреждениях из-за атаки БПЛА

В Таганроге на стадионе «Форте Арена» загорелась кровля здания на площади 30 кв. м, разрушена стена. В Азове обломками БПЛА посечена кровля зернового склада в порту, поблизости загорелся камыш на площади до 5 кв. м.В обоих случаях никто из людей...

01:21

Вандалы стали в полтора раза чаще портить автомобили россиян, сообщили представители крупных страховых компаний

Злоумышленники оставляют царапины, вмятины, трещины, разбитые стекла и крадут зеркала.«Страховые компании зафиксировали резкий рост заявлений о порче автомобилей третьими лицами... С начала 2025 года почти в полтора раза выросло число противоправных...

03:21

Зеленского разместили далеко от Трампа для фотографирования на саммите НАТО, видеозапись опубликовал C-SPAN

02:57

Системы "Железный купол" противовоздушной обороны, а также противоракетной обороны Израиля не справились со своей задачей, заявил РИА Новости военный эксперт Алексей Леонков

Они не смогли гарантированно перехватить баллистические ракеты, которые запускал Иран. В результате был нанесен ущерб множествам объектов военной инфраструктуры Израиля.По мнению Леонкова, Израиль не может не только самостоятельно выиграть войну с...

03:30

Трампа и Зеленского расставили по разным углам на фотосессии для саммита НАТО

Таким образом организаторы избегают конфликтных вспышек, пишет Washington Post.Во время съемки участников саммита пользователям в Сети бросилось в глаза расстояние между Трампом и Зеленским. Американский президент любезничал с турецким лидером, пока...

00:18

Флаг Украины сорвало ветром с самого высокого флагштока в родном городе Зеленского - Кривом Роге, сообщило украинское издание "Страна ua"

Флаг Украины сорвало ветром с самого высокого флагштока в родном городе Зеленского - Кривом Роге, сообщило украинское издание "Страна ua".Подписаться.

00:18

Буйство природы: потоп в провинции Гуйчжоу на юго-западе Китая

Около 70 000 человек были вынуждены покинуть свои дома.Видео: соцсети Подпишись на Ruptly |Прислать новость

Вчера, 14:32

Устное тестирование мигрантов на знание русского языка может начаться в 2026-м, сообщил РИА Новости глава Рособрнадзора Анзор Музаев

Мы создали рабочую группу, мы активно занимаемся, я думаю, наверное, с начала следующего года мы предоставим решение на обсуждение комиссииОн добавил, что в России уже существует технология проведения устного тестирования при сдаче ЕГЭ...

03:06

Горевшее почти 3 недели судно Morning Midas с 3 тысячами автомобилей на борту затонуло в Тихом океане, пишет New York Post

Конструкция судна была ослаблена пожаром и непогодой, оно затонуло в международных водах на глубине около 4,8 тысячи метров.Отмечается, что управляющая компания судна Zodiac Maritime сотрудничает с Береговой охраной США. Кроме того, согласно New...

03:00

Орбан указал Зеленскому, что ему не следует рассчитывать на прием Украины в Евросоюз, поскольку после этого сообщество сразу же будет втянуто в прямой конфликт с Россией

01:45

За Казанью массовой атаке БПЛА подвергся Таганрог

Над городом сбили четыре дрона.По словам горожан, во время работы ПВО перегорели лампочки и отключили воду. В частности, проблема наблюдается в районе Русского поля. Гражданам рекомендовано покинуть открытые участки улиц, зайти в помещение и...

Вчера, 23:36

Лента новостей

04:15США со среды возобновляют работу посольства в Израиле, снимая все ограничения// РИА Новости
04:15
04:15 Организаторы саммита НАТО в Гааге расположили Трампа и Зеленского подальше друг от друга во время съемки общей фотографии - в разных рядах и по разные стороны от хозяев встречи, правящей четы Нидерландов
04:15
04:06 Число иностранных наемников в рядах ВСУ сокращается, поскольку они не так активно идут в украинские формирования
04:06
03:42В Нидерландах раскритиковали решение позволить Зеленскому выступить в парламенте. Это противоречит вековой традиции нейтралитета законодательного органа, заявил лидер правой партии "Форум за демократию" Тьерри Боде.// ТАСС
03:42
03:42 ВСУ "осыпаются" на участках продвижения российских бойцов
03:42
03:30Трамп намерен встретиться с Зеленским 25 июня на саммите НАТО в Гааге, сообщила американская газета Politico.// ТАСС
03:30
03:30 Системы "Железный купол" противовоздушной обороны, а также противоракетной обороны Израиля не справились со своей задачей, заявил РИА Новости военный эксперт Алексей Леонков
03:30
03:21 Вандалы стали в полтора раза чаще портить автомобили россиян, сообщили представители крупных страховых компаний
03:21
03:15Конфликт на Украине мог закончиться за 12 дней, "как и агрессия Израиля против Ирана", если бы в то время президентом США был не Байден, а Трамп. С таким мнением американского инвестора Дэвида Сакса согласился глава РФПИ Дмитриев.// ТАСС
03:15
03:09Завершены следственные действия по уголовному делу экс-замминистра обороны РФ Булгакова, обвиняемого в мошенничестве. Вину он не признает, сообщил ТАСС представитель защиты.// ТАСС
03:09
03:06 Устное тестирование мигрантов на знание русского языка может начаться в 2026-м, сообщил РИА Новости глава Рособрнадзора Анзор Музаев
03:06
03:00 Горевшее почти 3 недели судно Morning Midas с 3 тысячами автомобилей на борту затонуло в Тихом океане, пишет New York Post
03:00
02:57 Зеленского разместили далеко от Трампа для фотографирования на саммите НАТО, видеозапись опубликовал C-SPAN
02:57
02:39Утечка данных разведсообщества США может дискредитировать Трампа и проводимую им политику на Ближнем Востоке. Такое мнение выразил сенатор Алексей Пушков.// ТАСС
02:39
02:33В итоговом заявлении саммита НАТО нет слов о необратимости пути Украины в альянс, которая была в заявлении прошлогоднего саммита в Вашингтоне. Об этом сообщил Сийярто на совещании в Нидерландах.// ТАСС
02:33
02:33США не позволят Тегерану обогащать уран в рамках возможной ядерной сделки, сообщил Уиткофф.// ТАСС
02:33
02:30 Спецпосланник президента США Уиткофф выразил уверенность в том, что Вашингтон сумеет достичь всеобъемлющего мирного соглашения с Ираном
02:30
02:27США уверены в возможности заключить всеобъемлющее мирное соглашение с Ираном, заявил Уиткофф.// ТАСС
02:27
02:27В Харьковской, Одесской, Сумской, Днепропетровской и Николаевской областях раздались взрывы на фоне воздушной тревоги. Об этом сообщают украинские Telegram-каналы. Подписаться | Прислать новость | Читать аналитику// RT на русском
02:27
02:24США сбросили на ядерный объект в Фордо 12 противобункерных бомб, у Белого дома нет никаких сомнений в том, что объект уничтожен, сообщил спецпосланник Уиткофф// РИА Новости
02:24

Ведущие мировые компании, разрабатывающие ИИ, не до конца понимают, как их генеративные модели приходят к своим выводам

Это интересно

Это интересно

В регионах

Топ

Лента новостей

04:06 Число иностранных наемников в рядах ВСУ сокращается, поскольку они не так активно идут в украинские формирования

03:42 ВСУ "осыпаются" на участках продвижения российских бойцов

03:21 Вандалы стали в полтора раза чаще портить автомобили россиян, сообщили представители крупных страховых компаний

03:06 Устное тестирование мигрантов на знание русского языка может начаться в 2026-м, сообщил РИА Новости глава Рособрнадзора Анзор Музаев

03:00 Горевшее почти 3 недели судно Morning Midas с 3 тысячами автомобилей на борту затонуло в Тихом океане, пишет New York Post

02:57 Зеленского разместили далеко от Трампа для фотографирования на саммите НАТО, видеозапись опубликовал C-SPAN

02:30 Спецпосланник президента США Уиткофф выразил уверенность в том, что Вашингтон сумеет достичь всеобъемлющего мирного соглашения с Ираном