Исследователи выявили религиозную предвзятость ИИ-моделей

Популярные LLM демонстрируют устойчивую религиозную предвзятость, отдавая предпочтение католицизму и игнорируя духовные аспекты в повседневных этических сценариях. К такому выводу пришел межуниверситетский консорциум CEFE-AI, представивший результаты бенчмарка AllFaith.

В проекте участвовали команды университетов Бригама Янга, Бэйлора, Нотр-Дама и Иешива. Исследователи проанализировали более 3600 ответов 20 моделей, включая GPT-5.5, Claude 4.7 и Gemini 3.1.

В ходе теста на смену религии ученые использовали 13 сценариев перехода для 14 различных мировоззрений. Почти все системы продемонстрировали измеримые отклонения.

Наиболее позитивную реакцию модели проявляли по отношению к католицизму (рейтинг «одобрения» около 61%), бахаизму и сикхизму. Самые низкие показатели зафиксированы у Свидетелей Иеговы (3%), атеизма и агностицизма.

Предвзятость выражалась не только в поощрении перехода к определенной конфессии, но и в активных попытках отговорить пользователя от других. 

Согласно дашборду проекта, наиболее сильную предвзятость показала модель Grok 4.20 от xAI, в то время как решения от Anthropic и Meta оказались наиболее нейтральными.

Вторая часть исследования — Omissive Bias in Religious Representation — посвящена повседневным вопросам: семье, утрате, вине, честности, прощению и поиску смысла.

Эксперимент на 27 моделях показал, что искусственный интеллект систематически предлагает исключительно светскую оптику. В ситуациях, требующих этического совета, нейросети рекомендовали обращаться к психотерапевтам, родителям или друзьям, но практически не упоминали священников, раввинов или имамов.

По оценке авторов, тема религиозного предубеждения в ИИ почти не изучена: лишь 0,2% из 12 000 научных работ о предвзятости искусственного интеллекта посвящены вопросам веры.

Публикация результатов CEFE-AI совпала с выходом первой энциклики Папы Льва XIV об искусственном интеллекте — Magnifica Humanitas. В документе понтифик предупредил, что технология впитывает ценности и предубеждения своих создателей.