近日,北京迎來了一場商業(yè)領(lǐng)域的盛事——36氪WISE2024商業(yè)之王大會。此次大會為期兩天,吸引了眾多業(yè)界精英和領(lǐng)軍人物,共同探討中國商業(yè)的新趨勢和潛力。作為已經(jīng)舉辦了十二屆的商業(yè)盛會,WISE大會在時代變遷中持續(xù)見證著中國商業(yè)的堅(jiān)韌與活力。
2024年,是一個充滿變化與挑戰(zhàn)的年份。與前十年相比,商業(yè)環(huán)境變得更加復(fù)雜,企業(yè)發(fā)展步伐放緩,更加注重穩(wěn)健和理性。同時,這一年也是尋找新經(jīng)濟(jì)動力的重要時期,產(chǎn)業(yè)變革對各個主體的適應(yīng)能力提出了更高要求。今年,WISE大會以“Hard But Right Thing(正確的事)”為主題,引發(fā)了與會者對當(dāng)前商業(yè)環(huán)境下何為正確路徑的深入思考和交流。
在大會的眾多精彩演講中,「后摩智能」副總裁倪曉林的分享尤為引人注目。他圍繞AI與NPU的發(fā)展,探討了邊端側(cè)AI算力需求的變化趨勢,為聽眾帶來了深刻見解。
倪曉林首先介紹了「后摩智能」作為一家基于存算一體的AI芯片公司的背景,并表示作為AI時代的參與者和見證者,深感榮幸。隨后,他詳細(xì)闡述了后摩智能對邊端側(cè)AI算力需求變化的看法。
他提到,隨著AI 2.0時代的到來,云端模型和端邊側(cè)模型都在迅速發(fā)展。云端模型不斷增大規(guī)模和參數(shù),探索通用智能的邊界;而端邊側(cè)則出現(xiàn)了更適合本地部署的模型,如7B、13B、30B等,這些模型更適合應(yīng)用于各行各業(yè),解決實(shí)際問題。端邊側(cè)AI具有個性化、低時延、數(shù)據(jù)隱私保護(hù)等優(yōu)勢,且每年全球新增智能設(shè)備數(shù)量高達(dá)數(shù)十億臺,市場前景廣闊。
然而,端邊側(cè)AI的發(fā)展也面臨著硬件方面的挑戰(zhàn)。倪曉林指出,端側(cè)硬件需要滿足“三高三低”的要求,即高算力、高帶寬、高精度、低功耗、低延時、低成本。CPU無法滿足全部需求,而GPU雖然能滿足部分要求,但其高成本和高功耗限制了端側(cè)設(shè)備的普及。因此,專為本地大模型設(shè)計(jì)的NPU更適合邊端側(cè)使用。
針對邊端設(shè)備對AI高帶寬、低功耗的需求,傳統(tǒng)的馮·諾伊曼架構(gòu)已經(jīng)難以應(yīng)對。倪曉林表示,存儲墻和功耗墻是當(dāng)前企業(yè)面臨的兩大難題。為了突破這兩大難題,后摩智能采用了存算一體的全新架構(gòu),實(shí)現(xiàn)了存儲單元和計(jì)算單元的高度集成,大幅降低了功耗,增加了帶寬。
后摩智能已經(jīng)自研了兩代存算一體芯片架構(gòu),并針對LLM類大模型進(jìn)行了專項(xiàng)設(shè)計(jì)。其自研的IPU架構(gòu)提供了高并行的浮點(diǎn)和整型算力,配套的軟件工具鏈簡單易用,兼容通用編程語言。后摩智能還推出了后摩鴻途??H30和后摩漫界??M30兩款NPU芯片,充分展現(xiàn)了存算一體架構(gòu)在算力和功耗方面的優(yōu)勢。
為了方便AI設(shè)備方案商及生產(chǎn)商快速部署,后摩智能不僅提供芯片,還提供多種標(biāo)準(zhǔn)化產(chǎn)品形態(tài),如力謀??LM30智能加速卡和力謀??SM30計(jì)算模組等。這些產(chǎn)品可以讓現(xiàn)有各類終端設(shè)備通過標(biāo)準(zhǔn)接口加裝NPU,實(shí)現(xiàn)本地AI大模型的流暢運(yùn)行。
倪曉林表示,隨著AI技術(shù)的不斷發(fā)展,越來越多的設(shè)備將成為AI大模型使能設(shè)備,如AI PC、汽車AI座艙、AI TV等。這些設(shè)備將成為更懂用戶、更聰明、更高效的助理、秘書、司機(jī)等,為用戶提供各種服務(wù)。后摩智能希望通過其AI芯片助力各行業(yè)實(shí)現(xiàn)快速升級。
倪曉林還透露,后摩智能將在2025年推出基于新一代“天璇”架構(gòu)的最新款芯片,性能將再次大幅提升。這款芯片有望進(jìn)一步加速端邊設(shè)備部署大模型的進(jìn)程。
在演講的最后,倪曉林表示,他相信未來十年將是AI大模型的時代,NPU將重塑所有端邊場景和設(shè)備。他期待與在座的AI企業(yè)和生態(tài)合作伙伴攜手合作,共同推動現(xiàn)有設(shè)備以及未來新型設(shè)備流暢運(yùn)行AI大模型,共創(chuàng)AI新時代。