ITBear旗下自媒體矩陣:

獨家傳授“首席AI架構(gòu)師”全流程方法論 百度黃埔學(xué)院第四期報名進行時

   時間:2020-12-07 16:47:36 來源:互聯(lián)網(wǎng)編輯:星輝 發(fā)表評論無障礙通道

每一次技術(shù)革命,都是一次生產(chǎn)力與生產(chǎn)關(guān)系的大變革。AI時代呼嘯而至,深度學(xué)習(xí)、強化學(xué)習(xí)、圖神經(jīng)網(wǎng)絡(luò)顯示出強大的技術(shù)張力,但為何在產(chǎn)業(yè)應(yīng)用落地中又會遇到種種挑戰(zhàn),讓不少產(chǎn)業(yè)從業(yè)者擔(dān)憂——AI到底離我們有多遠?

黃埔學(xué)院,“首席AI架構(gòu)師”的搖籃,對于這一產(chǎn)業(yè)之問,自然也是學(xué)院講師、學(xué)員必須回答的問題。

得其法者事半功倍,不得其法者事倍功半。11月4日,百度黃埔學(xué)院第四期開啟為期6周的線上預(yù)科班,通過AI思維、AI方法、AI技術(shù)、AI選擇等環(huán)環(huán)相扣的課程,讓大家“得法前行”,找到新技術(shù)推動產(chǎn)業(yè)升級的全流程方法論。

(黃埔學(xué)院第四期預(yù)科班課程)

跨上AI的戰(zhàn)車,從技術(shù)邏輯和商業(yè)邏輯雙面看

跨上AI戰(zhàn)車的第一步,企業(yè)首先需要確認現(xiàn)階段是否適合進行AI轉(zhuǎn)型。如果對AI本身的邏輯缺乏深入的理解,究竟能不能使用、如何使用AI去落地就成了難題。結(jié)合飛槳實踐落地過程中各行業(yè)AI應(yīng)用案例,企業(yè)想成功應(yīng)用AI系統(tǒng),要遵循技術(shù)和商業(yè)邏輯兩大原則。

(AI應(yīng)用可行的兩大前提)

從技術(shù)邏輯來看,AI應(yīng)用作為一個決策系統(tǒng)不是單獨存在的,它包含完整的上下游。上游是我們采集的數(shù)據(jù)信息,下游則是我們要執(zhí)行實施的自動化。因此,當(dāng)企業(yè)發(fā)現(xiàn)所在的應(yīng)用場景上下游都完備,只需AI決策系統(tǒng)時,企業(yè)AI場景應(yīng)用落地的步伐就可以加快。像如今互聯(lián)網(wǎng)、金融領(lǐng)域AI應(yīng)用最先落地,重要原因便是其產(chǎn)業(yè)鏈上下游完備。

而AI要滿足的商業(yè)邏輯前提是對關(guān)鍵業(yè)務(wù)的效率提升要大于付出的成本。

目前,中國無人超市的技術(shù)已非常成熟,但依然沒有在中國看到遍地的無人超市,就是因為今天要實現(xiàn)無人超市的技術(shù)所花費的成本高于兩個人力成本。所以無人超市這個技術(shù)雖已經(jīng)實現(xiàn)了效率上的大幅提升,但是因為效率提升程度不及花費的成本,所以目前還只能是實驗田。

所以,快速跨上AI戰(zhàn)車還需要考慮背后的商業(yè)邏輯。企業(yè)之所以運用AI技術(shù)滿足我們今天的商業(yè)發(fā)展,是想提升企業(yè)自身的關(guān)鍵業(yè)務(wù)。同時“成本”作為企業(yè)發(fā)考慮的重要因素之一,也成為選擇AI應(yīng)用的關(guān)鍵項。總結(jié)來看就是,選擇AI技術(shù)提升效率不能只“幫扶”企業(yè)效率提升一小步,但卻要“冒險”付出大成本。

——《跨上AI的戰(zhàn)車》

從學(xué)術(shù)研究到產(chǎn)業(yè)落地“多法結(jié)合”推動整個系統(tǒng)準確率提升

要想習(xí)得真經(jīng),企業(yè)除了明白是否適合AI轉(zhuǎn)型,還需要切實的了解如何運用AI實現(xiàn)應(yīng)用。我們發(fā)現(xiàn)在產(chǎn)業(yè)落地這個過程中,通常會面臨三大問題:

1、 數(shù)據(jù)的規(guī)模和平衡性

2、 模型的泛化能力及魯棒性

3、 場景領(lǐng)域的長尾、變化需求

(面對AI技術(shù)難題的正攻法思路)

我們有很多學(xué)術(shù)的方法去解決、突破技術(shù)難題,大家都可以去嘗試。也可以通過各種論文,去了解先進前沿的技巧。但還有很多時候,整個系統(tǒng)的準確率并不是單純的一個算法模塊的準確率??赡苣阈枰獓L試配合一個傳統(tǒng)算法,或者是配合一個流程的設(shè)計,甚至必要的時候可以配合人員操作的兜底方式來協(xié)同配合,達到真正的場景可用。

這里提到一個信任機制的建立,比如醫(yī)療場景,如果是一個全自動的系統(tǒng),患者能不能接受這樣一個機器直接給出結(jié)論?很多時候我們當(dāng)然希望它是一個全自動的系統(tǒng),但是這里往往要考慮的就是一個場景的容錯范圍,人命關(guān)天,就完全不能弄錯了。還有一些零售結(jié)賬的場景,質(zhì)檢上需要9個9,很多這樣的場景,可能目前還是需要一個human in the loop。

——《產(chǎn)業(yè)計算機視覺落地難點與應(yīng)對》

掌握主流和全面的技術(shù)復(fù)雜任務(wù)先拆分簡化,抽象問題是關(guān)鍵能力

當(dāng)遇到復(fù)雜場景的問題時,將其拆分成一些小的任務(wù)與目標。因為小的任務(wù)相對簡單一些,而復(fù)雜任務(wù)相對難一些,把復(fù)雜任務(wù)拆分成小任務(wù)本身就是一個技術(shù)建模的過程。拆分成小的任務(wù)之后,針對每一個小任務(wù),我們都可以進行非常細致的技術(shù)選型。

(抽象問題的拆分舉例)

這個其實在我們實際場景中是非常常用的,因為真實的業(yè)務(wù)場景它可能不是一個任務(wù),而是眾多任務(wù)。比如說文本糾錯、復(fù)雜的問答系統(tǒng)、復(fù)雜的對話系統(tǒng)等,它可能包含了多個子任務(wù)。

——《產(chǎn)業(yè)NLP任務(wù)的技術(shù)選型與落地》

很多油田電力和工礦企業(yè),它里面存在很多傳統(tǒng)的機械指針式的儀表,這種儀表與數(shù)字儀表不同,機械表無法將表具的讀數(shù)實時發(fā)送到監(jiān)控系統(tǒng),需要人工進行讀表檢查,這種表大部分是用來做監(jiān)控用的。

比如說監(jiān)控設(shè)備的運行是否正常,而且這些表大部分是部署在廠區(qū)的各個位置,為了監(jiān)測儀器是否工作正常,或者系統(tǒng)是否工作正常,工廠或者是一些企業(yè)都要派大量的人力到現(xiàn)場去進行巡檢,檢查表的讀數(shù)是否正常,進而去判斷整套系統(tǒng)或者儀器是否正常,這樣的話就會消耗很多企業(yè)的人力成本,而且每次巡檢周期長,頻次非常低。實際解決問題之前,需要清晰的梳理出表計識別項目會面臨到的難點問題:

1、 表具種類多,相似度大,樣本采集困難且不易分類

2、 在復(fù)雜環(huán)境下,讀數(shù)精確度不易保證

3、 室外環(huán)境惡劣導(dǎo)致讀數(shù)難以識別

(技術(shù)方案拆解:目標檢測+語義分割)

所以我們沒選擇直接識別的方案,因為直接識別會遇到多尺度的問題。我們選用了更為復(fù)雜的方案:目標檢測+語義分割,當(dāng)我的讀數(shù)難度變小了,精確度會得到更好的保證,這是最核心的。同時,因為模型復(fù)雜度的提升,我的推理時間變長了。不過沒關(guān)系,因為在表計巡檢的場景里,對時效要求并不高。所以很多時候,大家問這樣的方案好不好那樣的方案好不好,還是要首先去回答自己的問題,你的場景到底有什么樣的限制條件。沒有最好,只有最適合。

——《能源電力傳統(tǒng)儀表綜合無人巡檢》

Last but not least,優(yōu)選工具

京東物流最開始自己要做快遞單識別,其工程是非常復(fù)雜的。中國的四級地址,有的用戶名字叫“一個橘子”,區(qū)號和電話號碼連在一起,還有大量的附言詞。在這之中我們要做大量的分詞、文本解析、結(jié)構(gòu)化處理、信息的補全、消歧等,最后進行語義相似度的打分和匹配。有監(jiān)督+無監(jiān)督的方法結(jié)合去應(yīng)用。整個團隊花了很長的時間,去建立一整套的系統(tǒng)。

(京東物流快遞單識別所使用的ERNIEAPI)

完成了這些工作,跨過了這些坑之后,當(dāng)我遇到百度文心ERNIE,瞬間覺得豁然開朗,覺得它比我更懂我應(yīng)該做什么。剛才說的所有那些很復(fù)雜的東西,從以前的Framework轉(zhuǎn)到飛槳以后,前面三個API其實就搞定了。最后一個API地址識別,我畫了小太陽,對我們的工作效率提升帶來了很大的幫助。

很多應(yīng)屆生同學(xué)他們進來就能很快地上手。對于他們來說,一開始覺得這件事太難了,可能很難堅持下來。在新同學(xué)還不是特別懂深度學(xué)習(xí)的原理情況下,能夠把整個技術(shù)做出來,能夠有結(jié)果,這是件非常讓人興奮的事。

——《京東物流快遞單智能識別》

聽完這些課程,你是不是對AI產(chǎn)業(yè)落地有了不一樣,亦或是更深刻的認識?是不是也想加入其中,成為推動產(chǎn)業(yè)落地的AI架構(gòu)師?

對于從黃埔學(xué)院畢業(yè)的135名學(xué)員,授課老師們一直在強調(diào)“AI架構(gòu)師”要具備從復(fù)雜的業(yè)務(wù)問題抽象出AI技術(shù)問題的能力,要對主流AI訓(xùn)練和部署落地流程有充分的掌握,結(jié)合相關(guān)算法技術(shù)和業(yè)務(wù)場景需求,做出恰當(dāng)?shù)腁I技術(shù)選型,設(shè)計高效合理、并具有充分預(yù)見性的實現(xiàn)方案。還要在業(yè)務(wù)場景下建立起以AI技術(shù)應(yīng)用為核心的完備技術(shù)體系,充分發(fā)揮AI技術(shù)對業(yè)務(wù)的助力作用,對技術(shù)團隊產(chǎn)生很強的技術(shù)影響力。

置身其中的技術(shù)人都說,AI落地不是學(xué)術(shù)問題,而是創(chuàng)意問題。關(guān)鍵是,如何有創(chuàng)意的使用AI技術(shù)。

12月1日,百度黃埔學(xué)院第四期開放線下正式班申請,需要你帶著“AI項目開題報告”有備而來,與百度T10+架構(gòu)師一起,面對面探索產(chǎn)業(yè)智能化升級的新場景、新未來。

關(guān)注「飛槳paddlepaddle」公眾號,回復(fù)「黃埔」立即報名。

回看六節(jié)預(yù)科班干貨視頻,獲取正式班申請材料模板。

舉報 0 收藏 0 打賞 0評論 0
 
 
更多>同類資訊
全站最新
熱門內(nèi)容
網(wǎng)站首頁  |  關(guān)于我們  |  聯(lián)系方式  |  版權(quán)聲明  |  網(wǎng)站留言  |  RSS訂閱  |  違規(guī)舉報  |  開放轉(zhuǎn)載  |  滾動資訊  |  English Version