Nghiên cứu, công bố đầu tháng 10, đã kiểm tra 11 mô hình ngôn ngữ lớn (LLM) bằng cách yêu cầu chúng tư vấn cho người dùng trong các tình huống liên quan đến mâu thuẫn cá nhân, thao túng và lừa dối. Kết quả cho thấy, các chatbot AI thường quá dễ dãi trong việc đồng ý và ủng hộ quan điểm của người dùng, thay vì phản biện hoặc đưa ra lời khuyên trung thực.

Trong số các mô hình được phân tích, DeepSeek V3 (ra mắt tháng 12/2024) là một trong những mô hình “nịnh hót” nhất, đồng tình với người dùng nhiều hơn con người tới 55%, trong khi mức trung bình của tất cả mô hình là 47%.