滾動資訊

當前位置：首頁 > 資訊 > 人工智能 > 正文內(nèi)容

谷歌Gemini新規(guī)：外包評估員被迫涉足不擅長領域，信息準確性引擔憂

時間：2024-12-19 11:29:48 來源：ITBEAR編輯：快訊團隊 發(fā)表評論無障礙通道

近期，據(jù)TechCrunch披露，谷歌對其大型語言模型Gemini的回復評估流程做出了一項重要調(diào)整，這一變動引起了外界對其在敏感信息領域準確性的廣泛關注。谷歌與外包合作伙伴GlobalLogic合作，后者負責雇傭合同工來評估Gemini生成的回復，評估的關鍵標準之一是“真實性”。

在此之前，若評估員發(fā)現(xiàn)某個問題超出了他們的專業(yè)知識范圍，比如涉及心臟病學的復雜問題，而自身不具備相應的科學背景，他們可以選擇跳過該評估任務，以避免對不熟悉領域的回復進行評判。這一機制原本旨在確保評估的準確性和專業(yè)性。

然而，GlobalLogic近期宣布，谷歌要求評估員不得再因缺乏專業(yè)知識而跳過任何評估任務。新的指導方針明確指出，即使面對高度專業(yè)化的技術(shù)性問題，如罕見疾病的描述，評估員也不應跳過，而是需要評估他們能夠理解的提示部分，并注明自身在相關領域的知識不足。這一變化意味著，即便是醫(yī)療健康等高度專業(yè)性的領域，也可能由不具備相關背景知識的評估員進行評估。

這一調(diào)整引發(fā)了人們的擔憂，因為缺乏專業(yè)知識的評估員在評估高度專業(yè)化的回復時，可能難以準確判斷其準確性。一位合同工在內(nèi)部通信中表達了困惑：“我之前以為跳過的目的是將任務交給更專業(yè)的人來提高準確性，但現(xiàn)在這樣做似乎并非如此?！?/p>

根據(jù)新的規(guī)定，評估員只有在兩種情況下可以跳過提示：一是當提示或回復“完全缺失信息”，二是當提示包含需要特殊同意書才能評估的有害內(nèi)容。這一新規(guī)的實施，無疑增加了Gemini在高度專業(yè)性領域輸出不準確信息的風險。

在醫(yī)療健康等關鍵領域，不準確的信息可能對用戶造成誤導，甚至帶來嚴重后果。因此，這一調(diào)整引發(fā)了廣泛關注和擔憂。用戶期望從Gemini獲得準確可靠的信息，尤其是在涉及健康等重要問題時。然而，隨著評估流程的變化，這一期望可能面臨挑戰(zhàn)。

這一調(diào)整也引發(fā)了關于人工智能倫理和責任的討論。在高度專業(yè)化的領域，如何確保人工智能生成的回復準確無誤，是一個復雜而重要的問題。谷歌作為行業(yè)領先者，其在這一問題上的決策將對整個行業(yè)產(chǎn)生深遠影響。

截至目前，谷歌尚未對相關報道作出回應。然而，隨著外界對Gemini準確性擔憂的加劇，谷歌可能需要盡快采取措施來回應這些關切，以確保其大型語言模型在高度專業(yè)性領域的信息輸出保持準確性和可靠性。

舉報 0 收藏 0 打賞 0評論 0

更多>同類資訊

OpenAI o3模型登場，能否成為通用人工智能新里程碑？

12-21

自動駕駛落榜，圖森未來能否借AI游戲與金庸IP東山再起？

12-21

小米重金攬才，DeepSeek大模型專家羅福莉或?qū)⒓用诵∶譇I實驗室

12-21

普渡機器人PUDU D9：雙足行走、靈活操作，深圳智造展現(xiàn)清潔新技能！

二是在操作方面，PUDU D9擁有兩條7自由度機械臂，負載超過20kg，搭載11自由度五指靈巧手PUDU DH11，可靈活完成各類精細操作任務，滿足多類場景需求。在產(chǎn)品布局完成之后，普渡或?qū)⒃诰呱碇悄艿穆涞亍?/div>

12-21

超算AI聯(lián)手！科學家描繪地球20億至5億年前生命多樣性演化壯麗圖景

12-21

值得買科技AI戰(zhàn)略引領消費新風尚，榮獲華為云先鋒實踐案例

12-20

科技新風向！這些創(chuàng)新熱詞你掌握了嗎？

12-20

輕量化AI眼鏡，999元閃極“拍拍鏡”能否開啟智能穿戴新篇章？

12-20

谷歌CEO：將削減10%高管職位

12-20

OpenAI被意大利罰款1500萬歐元：ChatGPT數(shù)據(jù)使用侵犯隱私

12-20

行競科技儲能電池技術(shù)驚艷CES，浸沒式冷卻獲創(chuàng)新大獎

12-20

蘋果國行iPhone尋AI新伙伴，百度落榜背后有何隱情？

12-20

湯姆貓AI童伴機器人即將面世，情緒識別聊天科普樣樣精通

12-20

2024旗艦手機大賞：影像升級，AI成新寵，誰將領跑未來？

12-20

京東健康新突破：智能手機秒變血壓計，便捷監(jiān)測新時代

基于京醫(yī)千詢大模型的多模態(tài)能力，京東健康成功自主研發(fā)了“首款以智能手機為載體的多模態(tài)技術(shù)應用血壓檢測產(chǎn)品”（以下簡稱“手機測血壓產(chǎn)品”），該產(chǎn)品內(nèi)嵌于京東/京東健康App中，登陸搜索“測血壓”即可使用。正…

12-20

點擊查看更多 +

全站最新

歐洲百億太空計劃出爐，欲打造衛(wèi)星通信新體系抗衡馬斯克“星鏈”

冰雪季科技新寵！磐鐳HO5迷你主機閃耀北大湖滑雪場

抖音12月20日帶貨日榜揭曉：誰位居榜首，銷售額高達4346萬？

晉江文學城回應浙江消保委整改要求：未參會，將提供透明賬務

OpenAI o3模型登場，能否成為通用人工智能新里程碑？

macOS版ChatGPT再升級，可讀取Apple Notes等備忘錄內(nèi)容！

熱門內(nèi)容

本欄最新

OpenAI o3模型登場，能否成為通用人工智能新里程碑？

自動駕駛落榜，圖森未來能否借AI游戲與金庸IP東山再起？

小米重金攬才，DeepSeek大模型專家羅福莉或?qū)⒓用诵∶譇I實驗室

普渡機器人PUDU D9：雙足行走、靈活操作，深圳智造展現(xiàn)清潔新技能！

值得買科技AI戰(zhàn)略引領消費新風尚，榮獲華為云先鋒實踐案例

科技新風向！這些創(chuàng)新熱詞你掌握了嗎？

本網(wǎng)站LOGO小熊標志受版權(quán)保護，版權(quán)登記號：魯作登字-2015-F-025467，未經(jīng)ITBEAR官方許可，嚴禁使用。
聲明：本網(wǎng)站是公益性科普網(wǎng)站，為網(wǎng)友提供科技類資訊內(nèi)容，無障礙技術(shù)由太陽灣捐增，為閱讀障礙用戶提供內(nèi)容聽讀服務。如本站內(nèi)容侵犯了您的權(quán)利，請通知我們及時刪除。
中國（山東）自由貿(mào)易試驗區(qū) · 齊魯軟件園魯ICP備11015305號-1 商業(yè)合作入口
Copyright ? 小熊科技資訊 2007-2024 ITBEAR.COM.CN All rights reserved.

谷歌Gemini新規(guī)：外包評估員被迫涉足不擅長領域，信息準確性引擔憂

谷歌Gemini新規(guī)：外包評估員被迫涉足不擅長領域，信息準確性引擔憂