法國(guó)電信巨頭Orange近日宣布了一項(xiàng)重要合作計(jì)劃,旨在推動(dòng)非洲地區(qū)語言的人工智能發(fā)展。這一計(jì)劃是與微軟支持的OpenAI和Facebook母公司meta共同展開的。
Orange透露,他們將基于OpenAI的Whisper和meta的Llama這兩個(gè)開源AI模型,開發(fā)定制化的AI模型。這些模型將專注于理解西非地區(qū)獨(dú)特的語言,這些語言在現(xiàn)有的大多數(shù)對(duì)話系統(tǒng)中往往無法被準(zhǔn)確識(shí)別。
目前,大型AI公司所使用的訓(xùn)練數(shù)據(jù)大多來自美國(guó),導(dǎo)致在處理歐洲、中東和非洲等地區(qū)時(shí),可能會(huì)丟失重要的文化和語言背景信息。Orange首席人工智能官Steve Jarrett指出,這使得現(xiàn)有的AI模型在理解使用不太常用語言編寫的文本和語音通信時(shí)面臨困難。
“通過開放模型,我們可以進(jìn)行微調(diào),向模型中引入原本訓(xùn)練時(shí)未包含的額外信息。”Jarrett在接受采訪時(shí)說,“我們正在添加對(duì)西非地區(qū)語言的識(shí)別能力,這是目前任何AI都無法做到的?!?/p>
Orange計(jì)劃首先在2025年初推出支持沃洛夫語和普拉姆語的AI模型。沃洛夫語主要在塞內(nèi)加爾、岡比亞和毛里塔尼亞南部使用,而普拉姆語則主要在塞內(nèi)加爾流行。這兩種語言的使用者分別約為1600萬和600萬人。
Orange表示,這些開源AI模型將對(duì)外提供,并免費(fèi)授權(quán)用于非商業(yè)用途,如公共衛(wèi)生和教育領(lǐng)域。他們還計(jì)劃擴(kuò)大這一計(jì)劃,最終覆蓋所有18個(gè)西非國(guó)家。
Jarrett強(qiáng)調(diào),現(xiàn)有的大型語言模型,如OpenAI的GPT、meta的Llama和Anthropic的Claude,并不完全適合非洲的需求,因?yàn)樗鼈儧]有針對(duì)非洲地區(qū)的數(shù)據(jù)進(jìn)行訓(xùn)練。因此,Orange與合作伙伴決定開發(fā)更適合非洲語言的定制化模型。
這一計(jì)劃還體現(xiàn)了全球范圍內(nèi)日益受到關(guān)注的概念——主權(quán)人工智能。這一概念強(qiáng)調(diào),各國(guó)和地區(qū)應(yīng)通過本地化數(shù)據(jù)存儲(chǔ)和處理,確保AI系統(tǒng)能夠代表特定的語言、文化和歷史,從而加強(qiáng)對(duì)核心技術(shù)基礎(chǔ)設(shè)施的控制。
Orange還計(jì)劃將數(shù)據(jù)處理和OpenAI模型的托管本地化到歐洲數(shù)據(jù)中心。這將使他們能夠提前獲得OpenAI最新、最先進(jìn)的AI模型,并幫助構(gòu)建新的應(yīng)用程序,如用于客戶服務(wù)的AI語音系統(tǒng)。
Jarrett表示,Orange致力于“負(fù)責(zé)任地”使用AI,并考慮到與該技術(shù)巨大能源需求相關(guān)的環(huán)境問題。他們不會(huì)總是對(duì)每個(gè)問題都使用龐大的語言模型(LLM),而是會(huì)根據(jù)具體情況選擇最合適的解決方案。
除了改善客戶服務(wù)外,Orange還計(jì)劃利用AI技術(shù)優(yōu)化其核心業(yè)務(wù)——移動(dòng)網(wǎng)絡(luò)。Jarrett說:“在網(wǎng)絡(luò)方面,我們不僅使用AI來優(yōu)化網(wǎng)絡(luò)規(guī)劃方式,還優(yōu)化如何正確運(yùn)營(yíng)網(wǎng)絡(luò)。所有網(wǎng)絡(luò)設(shè)備產(chǎn)生的數(shù)據(jù)量非常龐大,借助AI系統(tǒng),我們可以幫助識(shí)別數(shù)據(jù)中的模式,甚至在客戶注意到之前,這些模式就可以幫助我們識(shí)別和預(yù)測(cè)故障?!?/p>
這一合作計(jì)劃不僅有助于提升非洲地區(qū)語言的AI識(shí)別能力,還體現(xiàn)了Orange在推動(dòng)主權(quán)人工智能和負(fù)責(zé)任使用AI方面的努力。
通過本地化數(shù)據(jù)處理和模型托管,Orange希望能夠更好地服務(wù)于西非國(guó)家,并推動(dòng)該地區(qū)在AI技術(shù)方面的發(fā)展。