ITBear科技資訊
手機版
二維碼
內容搜索
無障礙通道
語言：中文 EN

ITBear旗下自媒體矩陣：

滾動資訊

當前位置：首頁 > 資訊 > 人工智能 > 正文內容

AI智慧背后的隱憂：越聰明，越愛“編造”真相？

時間：2024-09-29 14:00:27 來源：ITBEAR作者：顧青青編輯：瑞雪 發(fā)表評論無障礙通道

**大型語言模型越強大越愛“撒謊”？新研究揭示AI準確性困境**

隨著大型語言模型（LLM）能力的不斷增強，一項新研究卻發(fā)現(xiàn)了令人擔憂的趨勢：這些智能聊天機器人在回答問題時，似乎越來越傾向于編造答案，而非謹慎地避免或拒絕回答它們不確定的問題。這種行為模式表明，盡管AI變得更加“聰明”，但其可靠性卻在實際應用中受到了質疑。

該研究由多個知名研究機構聯(lián)合進行，成果已發(fā)表在《自然》雜志上。研究團隊對市面上領先的商業(yè)LLM進行了深入分析，包括OpenAI的GPT系列、meta的LLaMA，以及開源模型BLOOM。在對比了這些模型在不同主題和問題類型上的表現(xiàn)后，研究人員發(fā)現(xiàn)，盡管新一代LLM在某些情況下的確給出了更準確的回答，但從整體來看，它們提供錯誤答案的頻率卻比舊模型更高。

瓦倫西亞人工智能研究所的研究員José Hernández-Orallo指出：“現(xiàn)在的LLM幾乎能回答任何問題，這既是進步也是隱患。雖然正確回答的數(shù)量增加了，但錯誤回答的數(shù)量也同樣在上升?！?/p>

在測試中，這些LLM被要求處理從數(shù)學到地理等多個領域的問題，并執(zhí)行一些特定的信息排序任務。結果顯示，規(guī)模更大、能力更強的模型在簡單問題上表現(xiàn)最佳，但在面對更復雜的問題時，其準確率卻顯著下降。

值得注意的是，OpenAI的GPT-4和o1模型在測試中成為了最大的“撒謊者”，但這一趨勢并非孤例，其他被研究的LLM也呈現(xiàn)出了類似的傾向。特別是在LLaMA系列模型中，即便是最簡單的問題，也沒有任何一個模型能夠達到60%的準確率。

當被要求評估聊天機器人答案的準確性時，參與測試的人類受試者也表現(xiàn)出了相當程度的不確定性，他們在10%到40%的情況下做出了錯誤的判斷。

這項研究揭示了一個重要的問題：隨著AI模型的規(guī)模和能力的不斷提升，如何確保它們提供的答案是準確且可靠的？研究人員建議，一個可能的解決方案是讓LLM在面對不確定的問題時學會保持沉默，而不是盲目地給出答案。Hernández-Orallo表示：“我們可以設定一個閾值，讓聊天機器人在遇到具有挑戰(zhàn)性的問題時能夠說‘不，我不知道’。”然而，這種做法也可能會暴露當前技術的局限性，從而影響用戶對AI的信任和接受度。

舉報 0 收藏 0 打賞 0評論 0

更多>同類資訊

滴滴自動駕駛C輪融資3億美元，廣汽領投滴滴跟投引關注

融資資金將用于加大自動駕駛技術的研發(fā)投入，加速推動首款Robotaxi量產車落地。2024年4月，滴滴自動駕駛與廣汽埃安的合資公司安滴科技已獲批工商執(zhí)照，雙方將深度融合自動駕駛領先技術和新能源整車制造成熟經驗…

10-22

鴻蒙史上最大升級來襲！五大原生革新引領全場景新時代

純血鴻蒙憑借分布式技術和一次開發(fā)多端部署的優(yōu)勢，圍繞一個系統(tǒng)、統(tǒng)一生態(tài)和原生互聯(lián)構建全新的全場景體驗，海量終端只需一個系統(tǒng)，同時在同一生態(tài)下的應用在不同終端也有更加一致的體驗，更通過多屏協(xié)同、超級終端、超級…

10-22

華為HarmonyOS NEXT亮相，系統(tǒng)級小藝智能體隨時待命！

經過親身體驗，HarmonyOS NEXT 下的小藝智能體給筆者的最大感受便是無處不在、便捷高效 —— 無論是拖給小藝、識屏對話、小藝圈選，還是問問小藝（小藝問答）、小藝幫記等，這些功能在你需要時總能就能立…

10-22

滴滴自動駕駛C輪融資3億美元，廣汽領投滴滴跟投引關注

10-22

百度生成式AI專利申請入全球前十，中國力量閃耀全球！

該發(fā)明技術變革了傳統(tǒng)的 “索引-召回-排序”流程，扁平化系統(tǒng)漏斗，減少信息損失，通過構建索引學習任務，將商業(yè)信息編碼進模型參數(shù)，實現(xiàn)“模型即索引”，利用大模型的理解和推理能力，實現(xiàn)“生成即檢索”，新范式顯著…

10-22

華為發(fā)布2023-2024終端可持續(xù)發(fā)展新報告！

10 月 22日消息，在目前正在進行的原生鴻蒙之夜暨華為全場景新品發(fā)布會中，《華為終端可持續(xù)發(fā)展報告（2023-2024）》正式公布。在信息無障礙方面，搭載HarmonyOS 4 的 HUAW…

10-22

華為鴻蒙HarmonyOS NEXT亮相，鴻蒙史上最大升級來了！

HarmonyOS NEXT搭載全新分布式軟總線，實現(xiàn)多設備之間無縫流傳與共享，支持跨設備互通掃描、互通圖庫、跨設備剪貼板、應用內視頻投播等。應用內視頻投播：視頻投播的體驗和流暢性得到了很大的提升，在…

10-22

小米15系列預約開啟，澎湃OS攜手驍龍8至尊版亮相！

【太平洋科技快訊】10月22日，在小米雙11啟動儀式上，小米集團合伙人、總裁兼部總裁盧偉冰信心滿滿地向公眾承諾，小米澎湃OS此次升級必定成功，將為用戶帶來更優(yōu)質的體驗。盧偉冰此前曾表示，市面上所謂的AI手機…

10-22

Kakao新推AI伴侶Kanana，能否實現(xiàn)情景化個性服務？

Nana：作為個人AI伴侶，Nana能夠記住用戶的個人對話和群組對話內容，如協(xié)助用戶管理會議日程、提醒準備事項，以及總結群聊要點，此外，Nana還支持文字和語音互動，并能理解各種格式的文檔，為用戶提供文檔摘…

10-22

美國出手整治虛假評論，商家個人禁止有償傳播

根據(jù)新法規(guī)，商家和個人不得故意購買、銷售或傳播虛假評論和推薦。這項新法規(guī)旨在打擊線上虛假評論和推薦，保護消費者免受欺騙，并維護市場秩序和公平競爭。這項新法規(guī)的實施對于打擊線上虛假評論和推薦具有重要意義，對…

10-22

2024雙態(tài)IT用戶大會落幕，聚焦金融IT十四五與十五五藍圖

在10月18日上午舉辦的“金融IT：十四五回顧與十五五思考主題會議”上，除行業(yè)側、產業(yè)側等專家的主旨分享，還進行了《2023-2024中國智能運維實踐年度報告（第4期）》解讀及發(fā)布儀式、智能運維通用要求國家…

10-22

悅享控股新嘗試：悅靈犀AI重塑《水滸傳》經典

悅靈犀AI運用領先的文生視頻與圖生視頻技術，不僅能夠高效生成高質量的豐富畫面，還能通過先進的深度學習算法、多模態(tài)能力、優(yōu)質的模型效果，精準捕捉并還原原著中復雜的人物關系、人物性格和情感變化，為重塑《水滸傳》提…

10-22

和鯨科技與智譜AI強強聯(lián)手，共推“101數(shù)智領航計劃”！

和鯨科技在人工智能與數(shù)據(jù)科學領域深耕多年，參與了數(shù)百所高校交叉學科的建設，并于 2024 年 5 月全新發(fā)起“101數(shù)智領航計劃”，整合和鯨社區(qū)近十年積累的多學科實踐資源、ModelWhale 教研訓一體…

10-22

科大訊飛股價下滑2.04%，每股報收45.24元

10月22日，科大訊飛盤中下跌2.04%，截至09:46，報45.24元/股，成交5.29億元，換手率0.53%，總市值1045.83億元。資料顯示，科大訊飛股份有限公司位于合肥市高新開發(fā)區(qū)望江西路666號…

10-22

科大訊飛收跌1.36%，滾動市盈率高達491.49倍引關注

10月22日，科大訊飛今日收盤45.55元，下跌1.36%，滾動市盈率PE（當前股價與前四季度每股收益總和的比值）達到491.49倍。科大訊飛股份有限公司是一家專業(yè)從事語音及語言、自然語言理解、機器學習推理…

10-22

點擊查看更多 +

全站最新

2024“聚星杯”天文文創(chuàng)大賽京城揭曉，精彩作品閃耀頒獎禮

我國航天再傳捷報，天平三號衛(wèi)星成功發(fā)射！

神舟十九號船箭合體轉運發(fā)射區(qū)，近日將擇機飛天！

三星Exynos 2500測試持續(xù)，驍龍8至尊版價格成挑戰(zhàn)？

滴滴自動駕駛C輪融資3億美元，廣汽領投滴滴跟投引關注

純血鴻蒙重塑操作系統(tǒng)格局：五大原生體驗升級亮相

熱門內容

本欄最新

滴滴自動駕駛C輪融資3億美元，廣汽領投滴滴跟投引關注

鴻蒙史上最大升級來襲！五大原生革新引領全場景新時代

華為HarmonyOS NEXT亮相，系統(tǒng)級小藝智能體隨時待命！

滴滴自動駕駛C輪融資3億美元，廣汽領投滴滴跟投引關注

百度生成式AI專利申請入全球前十，中國力量閃耀全球！

華為發(fā)布2023-2024終端可持續(xù)發(fā)展新報告！

本網(wǎng)站LOGO小熊標志受版權保護，版權登記號：魯作登字-2015-F-025467，未經ITBEAR官方許可，嚴禁使用。
聲明：本網(wǎng)站是公益性科普網(wǎng)站，為網(wǎng)友提供科技類資訊內容，無障礙技術由太陽灣捐增，為閱讀障礙用戶提供內容聽讀服務。如本站內容侵犯了您的權利，請通知我們及時刪除。
中國（山東）自由貿易試驗區(qū) · 齊魯軟件園魯ICP備11015305號-1 商業(yè)合作入口
Copyright ? 小熊科技資訊 2007-2024 ITBEAR.COM.CN All rights reserved.

AI智慧背后的隱憂：越聰明，越愛“編造”真相？

AI智慧背后的隱憂：越聰明，越愛“編造”真相？