
新聞學教授戴夫·西達威進行了一項為期一個月的實驗,旨在評估聊天機器人的表現。結果表明,流行的聊天服務仍然無法成為可靠的新聞來源。該研究還揭示,人工智慧仍然容易將虛構內容誤認為事實,並提供不準確的資訊。
在四周的時間裡,包括 ChatGPT、Gemini、Claude、Copilot、Grok、DeepSeek 和 Aria 在內的七個生成式人工智慧,每天彙編魁北克省五大新聞故事,按相關性對它們進行排名,並將它們連結到它們的來源。
最引人注目的故障發生在GoogleGemini聊天機器人身上。該機器人創建了一個假新聞網站,報道魁北克省發生了校車罷工。而實際上,罷工是由於Lion Electric公車的技術召回造成的,並非勞資糾紛。
本研究共分析了 839 份回覆。完整且準確的連結僅佔 37%,而完全準確的摘要也不到一半。在一些回復中,人工智慧添加了原文中並不存在“結論”,這增加了傳播錯誤訊息的風險。