ITBear旗下自媒體矩陣:

國產(chǎn)最大AI開源框架再升級:一口氣發(fā)布9大新產(chǎn)品,順便送出億元GPU算力

   時間:2019-11-07 14:08:10 來源:互聯(lián)網(wǎng)編輯:星輝 發(fā)表評論無障礙通道

時局如此,國產(chǎn)AI框架雄心更盛。氣勢更足、功能更新力度更大、開發(fā)者羊毛更豐厚……而且新發(fā)布還不是全部,已獲得的成績也相當(dāng)亮眼:先用AI算法為中國傳統(tǒng)產(chǎn)業(yè)節(jié)省了1個億。這就是百度旗下AI開源框架飛槳(PaddlePaddle),剛剛秀出的肌肉。

2016年開源至今,飛槳目前有150萬AI開發(fā)者,超過6.5萬企業(yè)用戶,在定制化訓(xùn)練平臺上發(fā)布了16.9萬個模型。儼然中國第一大深度學(xué)習(xí)開源平臺。并且形勢所迫,自主可控也成為AI框架等基礎(chǔ)平臺發(fā)展要求之一。所以在此次飛槳更新發(fā)布中,也無處不透露著“國家隊”擔(dān)當(dāng)。

在采訪中,百度方面透露,飛槳不僅是完全自主知識產(chǎn)權(quán)的深度學(xué)習(xí)平臺,而且在分布式訓(xùn)練的性能以及易用性上,都超過了國內(nèi)外競爭對手。那么接下來如何實現(xiàn)更多場景、更全面地同場競技優(yōu)勢?此次的九大新產(chǎn)品、上億新羊毛,以及進一步產(chǎn)業(yè)落地,就更值得關(guān)注。

九大新產(chǎn)品都是啥?

在“WAVE Summit+”2019深度學(xué)習(xí)開發(fā)者秋季峰會上,飛槳迎來全面升級。

百度CTO、深度學(xué)習(xí)技術(shù)及應(yīng)用國家工程實驗室主任王海峰,率先登臺分享最新思考,他說:深度學(xué)習(xí)正在推動人工智能進入工業(yè)大生產(chǎn)階段,具有很強的通用性,同時具備了標(biāo)準(zhǔn)化、自動化和模塊化的基本特征,推動人工智能技術(shù)從實驗室走向產(chǎn)業(yè),并且越來越大規(guī)模使用起來。而深度學(xué)習(xí)技術(shù)和平臺也在不斷發(fā)展,在未來的時間里也將繼續(xù)發(fā)揮重要作用。我們秉承開源開放的理念,把飛槳平臺開源開放,與所有開發(fā)者一起,推動科技發(fā)展、產(chǎn)業(yè)創(chuàng)新和社會進步。

此次飛槳一共有9大產(chǎn)品全新發(fā)布:包含一個模式、一個端側(cè)推理引擎、四大產(chǎn)品開發(fā)套件,三個工具組件。具體詳情如下:

首先,一個模式,指的是飛槳Master模式。

百度AI技術(shù)平臺體系執(zhí)行總監(jiān)、深度學(xué)習(xí)技術(shù)及應(yīng)用國家工程實驗室副主任吳甜介紹說:飛槳是一個源于產(chǎn)業(yè)實踐,與產(chǎn)業(yè)共進的深度學(xué)習(xí)開源開放平臺。未來,飛槳將持續(xù)發(fā)展超大規(guī)模分布式計算、異構(gòu)計算能力,定位于全硬件平臺支持、端云邊結(jié)合,為應(yīng)用場景提供面向場景的端到端套件,構(gòu)建融合數(shù)據(jù)和知識的預(yù)訓(xùn)練結(jié)合遷移學(xué)習(xí)的Master開發(fā)模式,為開發(fā)者提供最強大的生產(chǎn)平臺和基礎(chǔ)設(shè)施,加速產(chǎn)業(yè)智能化。

核心是依靠百度的強大算力,提升開發(fā)者在部署模型時的移動性。具體來說,開發(fā)者只使用自己的少量標(biāo)注數(shù)據(jù),加上飛槳的遷移學(xué)習(xí)工具,就能將自己的算法模型快速部署到自己的應(yīng)用場景中。帶來的直接影響,是面向產(chǎn)業(yè)場景平臺開發(fā)時,降低工作量,提升模型的準(zhǔn)確度、可靠性。

其次,一個端側(cè)推理引擎,指的是Paddle Lite 2.0。這一輕量級深度學(xué)習(xí)推理框架,在今年8月份正式發(fā)布。這次的升級中,專注易用性,提供了預(yù)測到部署完整工具鏈,只需要7行代碼調(diào)用Resnet50,也支持極致輕量級部署。硬件支持也更加廣泛,移動端支持8種主流硬件,新增華為NPU和邊緣設(shè)備FPGA支持,寒武紀(jì)、比特大陸等國產(chǎn)硬件的支持也在路上。在架構(gòu)設(shè)計上對硬件擴展也更加友好。最后是性能,百度深度學(xué)習(xí)技術(shù)平臺部總監(jiān)馬艷軍,現(xiàn)場放出了與其他幾家主流框架的性能對比圖,基本上都是“吊打”狀態(tài):

第三,四大面向場景的端到端開發(fā)套件,也是飛槳體系中完全新增的模塊。覆蓋語義理解、圖像分割、目標(biāo)檢測,以及個性化推薦。

包含ERNIE 2.0,一個基于持續(xù)學(xué)習(xí)的語義理解預(yù)訓(xùn)練框架,號稱在16個中英文任務(wù)全面超越對標(biāo)產(chǎn)品。核心亮點在于,新構(gòu)建的預(yù)訓(xùn)練任務(wù)類型可以無縫的加入訓(xùn)練框架,持續(xù)的進行語義理解學(xué)習(xí)。

還有PaddleSeg,產(chǎn)業(yè)級圖像分割庫,提供了18個預(yù)訓(xùn)練模型,覆蓋了DeepLabv3+, U-Net, ICNet三類主流的分割模型。通過統(tǒng)一的配置,幫助用戶完成從訓(xùn)練到部署的全流程圖像分割應(yīng)用。

以及目標(biāo)檢測庫PaddleDetection,已集成60+預(yù)訓(xùn)練模型。目的是為工業(yè)界和學(xué)術(shù)界提供易使用的目標(biāo)檢測模型。在這個庫中,飛槳還提供了許多目標(biāo)檢測小模型,方便給移動端設(shè)備使用。

此外新增的套件,是用于個性化推薦的ELASTIC CTR,這一套件源自于百度的產(chǎn)業(yè)實踐。可以實現(xiàn)分布式訓(xùn)練CTR預(yù)估任務(wù)和Serving流程一鍵部署,提供了端到端的CTR訓(xùn)練和二次開發(fā)的解決方案。

最后,三大發(fā)布,都聚焦在深度學(xué)習(xí)領(lǐng)域前沿的工具組件:PALM,多任務(wù)學(xué)習(xí)框架。

其中內(nèi)置了模型backbone(BERT、ERNIE等)、常見的任務(wù)范式(分類、匹配、序列標(biāo)注、機器閱讀理解等)和數(shù)據(jù)集讀取與處理工具。功能亮點在于易用性,對于典型的任務(wù)場景,幾乎無需書寫代碼便可完成新任務(wù)的添加。對于特殊的任務(wù)場景,用戶可通過對預(yù)置接口的實現(xiàn)來完成對新任務(wù)的支持。

PGL,圖神經(jīng)網(wǎng)絡(luò)框架。

提供了一系列的Python接口用于存儲/讀取/查詢圖數(shù)據(jù)結(jié)構(gòu),并且提供基于游走(Walk Based)以及消息傳遞(Message Passing)兩種計算范式的計算接口。利用這些接口,可以搭建最前沿的圖學(xué)習(xí)算法,結(jié)合飛槳核心框架,就基本能夠覆蓋大部分的圖網(wǎng)絡(luò)應(yīng)用,包括圖表示學(xué)習(xí)以及圖神經(jīng)網(wǎng)絡(luò)?,F(xiàn)在,PGL已有13個圖學(xué)習(xí)模型,涵蓋圖神經(jīng)網(wǎng)絡(luò)和圖表示學(xué)習(xí)的主流模型。

PaddleFL,聯(lián)邦學(xué)習(xí)框架。

其能力在于復(fù)制和比較不同的聯(lián)邦學(xué)習(xí)算法。在PaddleFL中,還提供了很多聯(lián)邦學(xué)習(xí)策略及其在計算機視覺、自然語言處理、推薦算法等領(lǐng)域的應(yīng)用,在部署大規(guī)模分布式集群中部署聯(lián)邦學(xué)習(xí)系統(tǒng)時,也較為容易。

此外,伴隨著這次1.6版本發(fā)布,飛槳還有12項產(chǎn)品重要升級。比如:

(1)提供更多的算子庫、簡單高效的API接口、完善的文檔內(nèi)容,全面提升易用性。

(2)升級輕量級模型結(jié)構(gòu)自動搜索PaddleSlim,增加了基于硬件搜索等能力,打通訓(xùn)練、壓縮和部署全流程。

(3)NLP、CV、推薦系統(tǒng)、語音等各大基礎(chǔ)模型庫的模型,從原來的60+到了100+。這其中有多個在AI競賽中奪冠的算法模型,比如在EMNLP獲得了10項閱讀理解項目冠軍的D-Net。

(4)Paddle Hub,新增了超參優(yōu)化Auto Fine-tune功能,預(yù)訓(xùn)練模型數(shù)量大幅增加,支持飛槳Master模式。

(5)深度強化學(xué)習(xí)框架PARL并行能力升級,支持進化算法。

(6)Paddle2ONNX和X2Paddle升級,飛槳和其他框架的模型互轉(zhuǎn)更加方便。

聚焦產(chǎn)業(yè)場景,上億新羊毛待薅

所以上述新發(fā)布究竟夠不夠競爭力?自飛槳開源以來,作為深度學(xué)習(xí)框架,經(jīng)常被人拿來與PyTorch、TensorFlow兩大框架進行對比。但時至今日,飛槳官方認(rèn)為已經(jīng)不能再單純以AI框架視之了。他們更愿意定位自稱:深度學(xué)習(xí)開源平臺。以百度多年的深度學(xué)習(xí)技術(shù)研究和業(yè)務(wù)應(yīng)用為基礎(chǔ),集深度學(xué)習(xí)核心框架、基礎(chǔ)模型庫、端到端開發(fā)套件、工具組件和服務(wù)平臺于一體。

在接受量子位采訪時,吳甜解釋了這一定位背后的考慮:“不同的AI框架都有其相應(yīng)的發(fā)展規(guī)劃,這就是飛槳選擇的發(fā)展路線。”現(xiàn)在,百度對外宣稱的飛槳四大領(lǐng)先技術(shù)時,框架只是其中之一。而且如今談AI發(fā)展,不談落地都顯得太虛。于是大會主題演講中,飛槳也重點分享了發(fā)展至今的側(cè)重點與發(fā)力點:產(chǎn)業(yè)。因為產(chǎn)業(yè)之大,轉(zhuǎn)型之需,AI的降本增效作用簡直再明顯不過。在發(fā)布會舉辦前夕,百度還專門發(fā)布了一個名為“看中國算法工程師如何手動省出1個億”的視頻。

其中在農(nóng)業(yè)、工業(yè)制造、質(zhì)檢和電力搶修等方面,AI算法都在幫助傳統(tǒng)產(chǎn)業(yè)降本增效。先節(jié)省一個億,這是飛槳已經(jīng)完成的小目標(biāo)。但AI發(fā)展,產(chǎn)業(yè)場景也已經(jīng)是各大人工智能平臺服務(wù)供應(yīng)商的必爭之地,接下來如何面對這種日益白熱化的競爭?飛槳透露的打法是:放羊毛、建生態(tài),與開發(fā)者和傳統(tǒng)產(chǎn)業(yè)一起贏。一手抓開發(fā)者培養(yǎng)和教育。比如百度響應(yīng)教育部產(chǎn)學(xué)研合作號召,在全國開展深度學(xué)習(xí)師資培訓(xùn)班,有效地彌補了國內(nèi)高校AI教師缺口。在一年半的時間里,飛槳已成功舉辦8期培訓(xùn),培養(yǎng)了1000多個AI專業(yè)高校教師,從教育環(huán)節(jié)開始,讓計算機學(xué)生從接觸飛槳,將來散落到產(chǎn)業(yè)界才能遍地開花。產(chǎn)業(yè)界還有“黃埔學(xué)院”,學(xué)術(shù)界與高校組建聯(lián)合實驗室,飛槳已經(jīng)和西交、中科大、南大、浙大、大連理工合作,人才聯(lián)合培養(yǎng)。另一手給福利。在今日大會發(fā)布最后,飛槳也發(fā)布了最新生態(tài)激勵計劃:

(1)免費開放10多個AI課程;

(2)支持100多所重點高校教學(xué)培訓(xùn);

(3)為1000多個企業(yè)轉(zhuǎn)型提供助力計劃;

(4)還有百萬級的AI競賽獎金和億元級GPU算力資源支持。

(5)不過,這兩手效果如何、究竟夠不夠硬,還得經(jīng)受時間和實踐檢驗。

當(dāng)然還得經(jīng)受激烈競爭檢驗。如今機器學(xué)習(xí)的框架之爭,全球范圍內(nèi)已經(jīng)淪TensorFlow和PyTorch兩家的較量,要從這兩家手中分一杯羹,僅僅有產(chǎn)業(yè)界的支持是遠(yuǎn)遠(yuǎn)不夠的。但飛槳現(xiàn)在也算在國內(nèi)擁有民心和祝愿。在活動現(xiàn)場上,一則這樣的留言格外醒目,或許也是2019年潮水方向里的小小注腳:還是得支持國產(chǎn)深度學(xué)習(xí)框架啊,免得國外框架壟斷,又要跟電腦操作系統(tǒng)和芯片一個結(jié)局。

所以,好風(fēng)憑借力,飛槳要加油。畢竟天時地利都有,最關(guān)鍵的人心也兼具,唯有拿出更好成績,才能實現(xiàn)更大雄心了。你說呢?

舉報 0 收藏 0 打賞 0評論 0
 
 
更多>同類資訊
全站最新
熱門內(nèi)容
網(wǎng)站首頁  |  關(guān)于我們  |  聯(lián)系方式  |  版權(quán)聲明  |  網(wǎng)站留言  |  RSS訂閱  |  違規(guī)舉報  |  開放轉(zhuǎn)載  |  滾動資訊  |  English Version