ITBear旗下自媒體矩陣:

OpenAI宣布允許網(wǎng)站攔截網(wǎng)絡(luò)爬蟲,保障數(shù)據(jù)隱私

   時(shí)間:2023-08-08 11:07:52 來源:ITBEAR編輯:茹茹 發(fā)表評(píng)論無障礙通道

【ITBEAR科技資訊】8月8日消息,隨著人工智能技術(shù)的迅猛發(fā)展,大型語言模型成為AI領(lǐng)域的一大熱點(diǎn)。OpenAI旗下的GPT模型在自然語言處理方面取得了顯著的進(jìn)展,但在訓(xùn)練過程中卻涉及到一系列問題,如數(shù)據(jù)隱私和版權(quán)等。

據(jù)了解,為了訓(xùn)練GPT模型,OpenAI需要大量的網(wǎng)絡(luò)數(shù)據(jù),而互聯(lián)網(wǎng)上的數(shù)據(jù)成為主要的獲取來源。然而,這種數(shù)據(jù)獲取方式引發(fā)了許多爭(zhēng)議。一方面,網(wǎng)站運(yùn)營(yíng)者擔(dān)心其網(wǎng)站內(nèi)容被GPTBot這樣的網(wǎng)絡(luò)爬蟲獲取,可能涉及隱私信息或侵犯版權(quán)。為此,OpenAI近日推出了一個(gè)新功能,允許網(wǎng)站運(yùn)營(yíng)者通過Robots.txt文件或屏蔽IP地址的方式,阻止GPTBot訪問其網(wǎng)站,以保護(hù)數(shù)據(jù)的隱私和版權(quán)。

然而,這并不意味著之前從網(wǎng)站上抓取的內(nèi)容會(huì)追溯性地從ChatGPT的訓(xùn)練數(shù)據(jù)中刪除。這也引發(fā)了一些網(wǎng)站和創(chuàng)作者的擔(dān)憂,他們擔(dān)心其內(nèi)容未經(jīng)授權(quán)或未付費(fèi)就被用于訓(xùn)練GPT模型,進(jìn)而用于商業(yè)用途。一些網(wǎng)站已經(jīng)采取措施限制AI公司免費(fèi)使用其用戶內(nèi)容的行為,以維護(hù)用戶的隱私和版權(quán)權(quán)益。

對(duì)于OpenAI而言,確保數(shù)據(jù)使用的合法性和透明性顯得尤為重要。他們?cè)诓┛臀恼轮斜硎?,使用GPTBot用戶代理抓取的網(wǎng)頁(yè)內(nèi)容將會(huì)被篩選,過濾掉那些需要付費(fèi)訪問、包含個(gè)人身份信息(PII)或違反其政策的文本來源。這樣的做法旨在提高AI模型的準(zhǔn)確性、通用能力和安全性,從而更好地服務(wù)用戶。

標(biāo)簽: OpenAI
舉報(bào) 0 收藏 0 打賞 0評(píng)論 0
 
 
更多>同類資訊
全站最新
熱門內(nèi)容
網(wǎng)站首頁(yè)  |  關(guān)于我們  |  聯(lián)系方式  |  版權(quán)聲明  |  網(wǎng)站留言  |  RSS訂閱  |  違規(guī)舉報(bào)  |  開放轉(zhuǎn)載  |  滾動(dòng)資訊  |  English Version