Исследование вскрыло слабую устойчивость европейских ИИ-моделей к дезинформации

изображение: grok
Европейские системы генеративного искусственного интеллекта с открытым кодом продемонстрировали скромные результаты при распознавании дезинформации. К подобному выводу пришли эксперты Института эстонского языка, протестировавшие работу 60 различных ИИ-моделей, среди которых оказались Claude, GPT, Grok, разработки Mistral AI и другие продукты.
В ходе исследования системам предложили ответить на 75 вопросов на английском, русском и эстонском языках. Аналитики оценивали умение моделей распознавать предвзятые формулировки, манипулятивные утверждения, пропагандистские материалы и иные формы недостоверной информации.
Самой результативной европейской разработкой признана модель французской компании Mistral AI, но в общем рейтинге она расположилась лишь на 47-й строчке из 60. Все четыре протестированные модели Mistral показали результат ниже 40% при распознавании дезинформационного контента.
Лидерские позиции в исследовании захватили различные версии Claude от Anthropic. Первая строчка досталась модели Claude Fable 5. Сильные показатели также продемонстрировали продукты OpenAI, Nvidia и Alibaba.
Авторы исследования полагают, что полученные цифры могут говорить о меньшей устойчивости ряда открытых моделей к информационным угрозам в сравнении с коммерческими аналогами. При этом государственные структуры и организации с повышенными требованиями к защите информации нередко присматриваются именно к открытым решениям, поскольку обращение к внешним коммерческим сервисам порождает вопросы о конфиденциальности данных.
В комментарии Financial Times представители Mistral AI заявили, что уделяют пристальное внимание борьбе с дезинформацией и работают над улучшением механизмов её обнаружения и блокировки.
Помимо этого, компания раскрыла планы вложить €4 млрд в развитие вычислительной инфраструктуры. Средства направят на строительство дата-центров во Франции и Швеции с оборудованием Nvidia.


