研究：聊天機器人報道新聞的準確性很差

新聞學教授戴夫·西達威進行了一項為期一個月的實驗，旨在評估聊天機器人的表現。結果表明，流行的聊天服務仍然無法成為可靠的新聞來源。該研究還揭示，人工智慧仍然容易將虛構內容誤認為事實，並提供不準確的資訊。

在四周的時間裡，包括 ChatGPT、Gemini、Claude、Copilot、Grok、DeepSeek 和 Aria 在內的七個生成式人工智慧，每天彙編魁北克省五大新聞故事，按相關性對它們進行排名，並將它們連結到它們的來源。

最引人注目的故障發生在GoogleGemini聊天機器人身上。該機器人創建了一個假新聞網站，報道魁北克省發生了校車罷工。而實際上，罷工是由於Lion Electric公車的技術召回造成的，並非勞資糾紛。

本研究共分析了 839 份回覆。完整且準確的連結僅佔 37%，而完全準確的摘要也不到一半。在一些回復中，人工智慧添加了原文中並不存在“結論”，這增加了傳播錯誤訊息的風險。