最小成員年僅16歲的“宇宙將為你閃爍”隊(duì)、國內(nèi)外頂賽??汀癠STC-鴻雁隊(duì)”、臨時抱佛腳卻小宇宙爆發(fā)率先突破19us優(yōu)質(zhì)性能標(biāo)準(zhǔn)的“博雅芯”和“aisys” 隊(duì)……這些來自北京大學(xué)、清華大學(xué)、上海交通大學(xué)、中國科學(xué)技術(shù)大學(xué)、西安交通大學(xué)、華中科技大學(xué)、復(fù)旦大學(xué)等頂尖高校的學(xué)霸們,卻在一場算子賽事中打起了“賽博擂臺”,在你方唱罷我登場的交替沖頂過程中,“算子開發(fā)”這一相對冷門的概念走到學(xué)界臺前。
什么是算子開發(fā)?算力領(lǐng)域“基礎(chǔ)初學(xué)者”如何與富有經(jīng)驗(yàn)的“進(jìn)階選手”同臺競技?算子開發(fā)的定義對“產(chǎn)學(xué)研”的意義是什么?為何昇騰AI原生創(chuàng)新算子挑戰(zhàn)賽對頂尖學(xué)府的學(xué)生具有如此大的吸引力?
這些問題,在昇騰AI原生創(chuàng)新算子挑戰(zhàn)賽S3賽季中得到進(jìn)一步解答,從Ascend C語言等工具框架,到昇騰社區(qū)的“學(xué)”“練”“訓(xùn)”“考”“賽”體系,再到產(chǎn)教融合下各類計(jì)劃和激勵,賽事本身“以小見大”折射出計(jì)算產(chǎn)業(yè)人才培養(yǎng)的方法論,以及昇騰原生人才培育戰(zhàn)略考量與深遠(yuǎn)布局。
憑實(shí)力沖鋒,在試錯中成長
“Ascend C語言本身設(shè)計(jì)非常優(yōu)秀,性能體驗(yàn)更加絲滑”
所謂“算子”是指在機(jī)器學(xué)習(xí)模型或神經(jīng)網(wǎng)絡(luò)中執(zhí)行的基本數(shù)學(xué)運(yùn)算或數(shù)據(jù)變換,而“算子開發(fā)”是指實(shí)現(xiàn)和優(yōu)化“算子”的過程,目的是使算子能在特定硬件(如 GPU、TPU)或框架(如 TensorFlow、PyTorch)中以最高效的方式運(yùn)行。
來自華科大“HUST VectorDB1”隊(duì)伍的闞廣馳舉了個形象的比喻:“模型輸入?yún)?shù)要經(jīng)過多層網(wǎng)絡(luò),這些網(wǎng)絡(luò)就是一個算子,從前到后依次輸入輸出,如果說大模型是一個樂高,算子就是一塊塊積木,把它搭起來?!?/p>
賽事采用預(yù)賽+決賽的賽制,又分為基礎(chǔ)算子開發(fā)命題和算子性能挑戰(zhàn)命題兩大賽道,題目通常是拋出一個場景化的定量,要求參賽者優(yōu)化算子代碼,用規(guī)定計(jì)算資源實(shí)現(xiàn)最快速的處理,而且成果可不斷優(yōu)化、多次提交,刷新自己在榜單上的名次。
雖然有大量試錯的機(jī)會,但算子開發(fā)仍然是計(jì)算機(jī)專業(yè)比較難的方向,其應(yīng)用實(shí)踐也大多面向產(chǎn)業(yè)界,因此對選手而言,這不僅是掌握算子開發(fā)的窗口,也是學(xué)習(xí)用“產(chǎn)業(yè)思維”解題的好機(jī)會。
“在分析賽題時,首先要明確算子的功能、輸入與輸出。初始階段通常會實(shí)現(xiàn)一個單核版本,確保邏輯清晰正確后,再考慮多核版本以提升性能?!标R廣馳坦言整個過程并非一蹴而就——多核版本的開發(fā)涉及host側(cè)的分塊策略和device側(cè)對深層API的調(diào)用,特別是矢量計(jì)算API的使用,需要注意數(shù)據(jù)劃分的大小以避免效率低下。對此,“HUST VectorDB1”隊(duì)伍選擇的策略是“一開始不要太著急去實(shí)現(xiàn)最優(yōu)版本,而是要先把普通的版本給做出來,然后再想還有哪些能優(yōu)化的地方?!?/p>
“宇宙將為你閃爍”隊(duì)的石皓文也分享了比賽過程中遇到的技術(shù)瓶頸:“內(nèi)存讀寫操作通常是無感知且自動同步的,在多核系統(tǒng)中,當(dāng)試圖向主機(jī)內(nèi)存寫入數(shù)據(jù)時,數(shù)據(jù)需要經(jīng)過不同層級的緩存,這就引出了緩存一致性的問題?!眮碜晕靼步煌ù髮W(xué)少年班的石皓文今年僅16歲,是S3賽季最年輕的參賽選手,但在計(jì)算機(jī)技術(shù)層面已有深厚的知識儲備,在一眾參賽選手中堪稱出類拔萃。后來石皓文靈機(jī)一動,通過學(xué)習(xí)歷年冠軍代碼和社區(qū)API文檔,找到了問題的解法,并且持續(xù)優(yōu)化。
而來自中國科學(xué)技術(shù)大學(xué)的“USTC-鴻雁隊(duì)”作為一度排名競賽榜榜首的隊(duì)伍,同樣經(jīng)歷了反復(fù)摸索、踩坑的階段。隊(duì)員楊鵬宇談到,在處理高維算子時,需要精準(zhǔn)把握不同維度存儲與訪問特點(diǎn),再合理優(yōu)化計(jì)算流程,這個過程要不斷嘗試不同算法與策略組合。在他看來,賽制的設(shè)置鼓勵試錯,實(shí)現(xiàn)技術(shù)從生疏到精通是個磨練的過程,這離不開“趁手的工具”與“完備的生態(tài)”支撐。
中國科學(xué)技術(shù)大學(xué)【USTC-鴻雁隊(duì)】
“趁手的工具”指CANN架構(gòu)和Ascend C語言,前者是專為昇騰AI處理器設(shè)計(jì)的計(jì)算架構(gòu),提供了從底層硬件到上層應(yīng)用的全棧AI解決方案,具有高性能、低功耗等優(yōu)勢;后者是針對算子開發(fā)場景推出的編程語言,原生支持C和C++標(biāo)準(zhǔn)規(guī)范,能夠最大化匹配用戶的開發(fā)習(xí)慣,并且通過多層接口抽象、自動并行計(jì)算、孿生調(diào)試等關(guān)鍵技術(shù),助力開發(fā)者低成本完成算子開發(fā)和模型調(diào)優(yōu)部署。
“Ascend C語言本身設(shè)計(jì)非常優(yōu)秀,針對內(nèi)存計(jì)算并行、內(nèi)存管理隊(duì)列、并行控制進(jìn)行了優(yōu)化,能夠充分發(fā)揮底層芯片的性能。”多位參賽選手如此表示,Ascend C無論是從底層還是應(yīng)用性和兼容性來講,都達(dá)到了非常合格的標(biāo)準(zhǔn),因此體驗(yàn)起來會更加“絲滑”,性能超乎想象。
此外,算子開發(fā)與硬件高度相關(guān),不能僅靠軟件層面來開展工作。算子挑戰(zhàn)賽還為加入原生人才促進(jìn)計(jì)劃的參賽者提供香橙派AIpro開發(fā)板,其基于昇騰AI技術(shù)路線,具備強(qiáng)勁的算力,能夠滿足大多數(shù)AI算法原型驗(yàn)證、推理應(yīng)用開發(fā)等需求。如此“軟硬兼施”,為參賽者沖頂賦予全面的加速度。
在比賽中學(xué)習(xí),在學(xué)習(xí)中比賽
“未來想要成為昇騰AI的布道師”
但要輸出更多計(jì)算產(chǎn)業(yè)的新鮮血液,不能僅靠“天賦選手”和“進(jìn)階選手”,還需要完備的生態(tài),讓更多人擁抱計(jì)算領(lǐng)域,尤其是以昇騰AI為代表的國產(chǎn)算力。這點(diǎn)在賽事“邊學(xué)邊賽”的特色上可見端倪。
來自北京大學(xué) “aisys”隊(duì)的唐正舉表示,“賽事方還為我們建立了微信群,隨時答疑解惑,同時提供云上算力代金券,減少我們投入和試錯的成本,這些都對我們的比賽內(nèi)容大有助益。”同時,華為昇騰領(lǐng)域?qū)<疫€會通過線上直播,對核函數(shù)開發(fā)、算子工程開發(fā)、算子aclnn調(diào)用及微認(rèn)證、融合算子、性能優(yōu)化等多種技術(shù)細(xì)節(jié)進(jìn)行講解,幫助參賽者更好地掌握昇騰AI技術(shù)。
對算子開發(fā)領(lǐng)域初學(xué)者的隊(duì)伍而言,能否快速獲得充足的生態(tài)支撐至關(guān)重要?!安┭判尽标?duì)伍并非算子開發(fā)專業(yè),同樣能通過昇騰社區(qū)獲得教學(xué)視頻和文檔代碼支持,并且通過賽事能夠?qū)⒗碚撝R與實(shí)際應(yīng)用相結(jié)合,成為率先突破19us優(yōu)質(zhì)性能標(biāo)準(zhǔn)的隊(duì)伍,一度登頂榮譽(yù)榜,之后通過持續(xù)優(yōu)化算子,在激烈的競爭下始終保持在前十以內(nèi)。隊(duì)員紛紛表示在比賽中就能快速實(shí)現(xiàn)這種比較工程化的算子優(yōu)化,還是特別有成就感的,“沒想到這么短的培訓(xùn)時間就能拿到這樣的好成績。”
至此,“打榜賽制”和“邊學(xué)邊賽”形成了良性的循環(huán),參賽者在不斷的學(xué)習(xí)中提升自己的成績,然后又獲得更多動力去查詢資料、自我學(xué)習(xí),再去刷新自己榜單名次?!按蠹矣凶约旱膶W(xué)習(xí)任務(wù),所以我們用課余時間做好分工,比如我在昇騰社區(qū)、賽事官網(wǎng)、代碼網(wǎng)站去查詢一些主流的解法,探討隊(duì)伍的解題方向,其他人負(fù)責(zé)優(yōu)化代碼,不斷輸出新的成果?!蓖瑯觼碜晕靼步煌ù髮W(xué)少年班,且年僅19歲已大三在讀的“宇宙將為你閃爍”隊(duì)長王禹皓分享道。
華為昇騰領(lǐng)域?qū)<覟閰①愡x手進(jìn)行培訓(xùn)
實(shí)際上,昇騰AI原生創(chuàng)新算子挑戰(zhàn)賽既是昇騰社區(qū)的一環(huán),又是整個昇騰生態(tài)的縮影:在昇騰社區(qū),開發(fā)者不僅可以獲取最新的技術(shù)資訊、開發(fā)文檔和案例教程,還可以參與技術(shù)討論和問題解答,還定期舉辦線上技術(shù)沙龍、工作坊和直播課程等,邀請行業(yè)專家、資深開發(fā)者分享最新技術(shù)趨勢、實(shí)戰(zhàn)經(jīng)驗(yàn)和最佳實(shí)踐,使能開發(fā)者拓寬視野、近距離接觸產(chǎn)業(yè)前沿。
但昇騰社區(qū)更被開發(fā)者重視的,是“學(xué)”“練”“訓(xùn)”“考”“賽”完整的賦能體系,許多參賽者接觸了算子開發(fā)、掌握了昇騰工具鏈之后,并不滿足于賽事本身,而是希望留在這個生態(tài)里,昇騰社區(qū)同樣提供了考核和認(rèn)證的入口,讓更多高校開發(fā)者成為昇騰的“布道師”,在校內(nèi)吸引更多人了解和使用昇騰AI相關(guān)產(chǎn)品與服務(wù),同時也在昇騰社區(qū)作出積極貢獻(xiàn)。
這批高校開發(fā)者,掌握了昇騰的工具鏈,能適配昇騰軟硬件,又經(jīng)過昇騰體系的認(rèn)證,成為“昇騰原生人才”的雛形,為我國計(jì)算產(chǎn)業(yè)發(fā)展輸入更多“源頭活水”,尤其在昇騰AI在產(chǎn)業(yè)界大面積鋪開、國家推進(jìn)國產(chǎn)替代的背景下,意義更顯重大。
產(chǎn)教融合,全棧布局
昇騰為高校學(xué)子打開國產(chǎn)算力的“第一窗口”
如果說昇騰AI原生創(chuàng)新算子挑戰(zhàn)賽只是一個“入口”,那么產(chǎn)教融合才是昇騰培養(yǎng)原生人才的重要發(fā)力點(diǎn)。目前,昇騰AI原生創(chuàng)新算子挑戰(zhàn)賽已連續(xù)舉辦S1、S2、S3三個賽季,是國內(nèi)少有的、基于國產(chǎn)算力平臺的算子開發(fā)賽事。首屆S1賽季單賽題參賽隊(duì)伍超過140支,共260余人角逐14萬獎金池,S2賽季在此前基礎(chǔ)上再度加碼,兩大賽題共吸引超500支參賽隊(duì)伍、761人參賽,最終共評選出4個金獎、6個銀獎、8個銅獎。
甚至在S1、S2賽季中,選手們憑實(shí)力產(chǎn)出了豐富的開源算子庫,不僅為后來的參賽者提供“開卷參考”,甚至這些成果進(jìn)入產(chǎn)業(yè),將有效推動AI技術(shù)在智能制造、智慧城市、智慧醫(yī)療等多個行業(yè)的廣泛應(yīng)用。
到了S3賽季,已吸引超過670支參賽隊(duì)伍報(bào)名,參賽人數(shù)再創(chuàng)新高。并將于2025年5月迎來年度總決賽,預(yù)賽出線隊(duì)伍將爭奪年度總決賽100+萬元獎金池,“算子開發(fā)”在高校逐漸從“冷”趨“熱”,背后是高校對計(jì)算產(chǎn)業(yè)的逐漸重視。
舉例來說,從賽事我們可以看到,算子開發(fā)這類計(jì)算產(chǎn)業(yè)相關(guān)領(lǐng)域,具備強(qiáng)烈的實(shí)操屬性,還需要培養(yǎng)學(xué)生的產(chǎn)業(yè)思維,高校如果想設(shè)立計(jì)算產(chǎn)業(yè)相關(guān)課程,需要搭建算力環(huán)境、提供案例實(shí)踐,否則容易陷入空談理論、閉門造車的局面。
高校專場賽現(xiàn)場
對此,“博雅芯”隊(duì)長魯云龍透露,在昇騰提供的異構(gòu)芯片平臺以及其完整工具鏈和技術(shù)棧支持下,北大人工智能相關(guān)課程開展更加深入,比如算子開發(fā)可以直接作為并行算法設(shè)計(jì)課程的實(shí)踐作業(yè),建立在昇騰算力上的深度學(xué)習(xí)框架可以對多門人工智能課程提供用于神經(jīng)網(wǎng)絡(luò)訓(xùn)練的平臺,昇騰加速卡本身也能為這類課程提供算力。
此外,華為還與北京大學(xué)、上海交通大學(xué)、中國科學(xué)技術(shù)大學(xué)、浙江大學(xué)共建“鯤鵬昇騰科教創(chuàng)新卓越中心”,與復(fù)旦大學(xué)、南京大學(xué)、東南大學(xué)、北京理工大學(xué)建立“鯤鵬昇騰科教創(chuàng)新孵化中心”,為課程開展和科研創(chuàng)新搭建算力環(huán)境,并以此為基礎(chǔ),在這批高校內(nèi)開展昇騰AI原生創(chuàng)新算子挑戰(zhàn)賽校內(nèi)賽。正是產(chǎn)學(xué)界對培養(yǎng)原生人才的重視和行動,昇騰AI原生創(chuàng)新算子挑戰(zhàn)賽才能有源源不斷的“算子新手”“天賦少年”和“進(jìn)階高玩”。
此外,產(chǎn)教融合也解決了發(fā)展原生人才的“后顧之憂”。雖然當(dāng)下大模型風(fēng)潮正盛,高校也不乏懷有“遠(yuǎn)慮”的學(xué)子,比如對實(shí)驗(yàn)室科研較為感興趣的石皓文就出人意料地對記者表達(dá)了某種擔(dān)憂:“當(dāng)前大模型技術(shù)迭代太快,讓人不禁懷疑這一波潮流是不是快要到頂點(diǎn)了,會不會未來的生產(chǎn)端是不是會更加聚焦于堆算力、堆資源的方向,或者新的熱點(diǎn)出現(xiàn),讓我們的實(shí)驗(yàn)室研究變得沒有意義?”
該情況在行業(yè)內(nèi)并非沒有先例,上一輪人工智能熱潮主角是深度學(xué)習(xí),但自從大模型爆發(fā),高校深度學(xué)習(xí)研究方向的實(shí)驗(yàn)室變得“一卡難求”,所有算力資源和熱錢投資都轉(zhuǎn)向大模型,很大程度上影響深度學(xué)習(xí)專業(yè)師生的科研和就業(yè)。
對此,產(chǎn)業(yè)意識到,發(fā)展原生人才,還需要解決所謂“最后一公里”問題,增強(qiáng)學(xué)生擁抱國產(chǎn)算力的動力,讓他們能夠?qū)ι鲜謱W(xué)習(xí)、實(shí)習(xí)就業(yè)、科研創(chuàng)新、產(chǎn)教學(xué)研用合作有明確的規(guī)劃和預(yù)期。
鯤鵬昇騰也對應(yīng)發(fā)布了原生人才促進(jìn)計(jì)劃、優(yōu)才計(jì)劃、科研創(chuàng)新使能計(jì)劃、眾智計(jì)劃等。其中,原生人才促進(jìn)計(jì)劃通過認(rèn)證和獎金激勵,鼓勵更多原生人才作為校園大使和布道師,帶動后來者加入;優(yōu)才計(jì)劃則聯(lián)合生態(tài)伙伴,幫助畢業(yè)生與企業(yè)對接,使得計(jì)算人才“學(xué)有所用”;科研創(chuàng)新使能計(jì)劃則提供專項(xiàng)資助,激勵應(yīng)用科學(xué)技術(shù)研究和軟件研發(fā)創(chuàng)新,最高可達(dá)30萬元;眾智計(jì)劃則主要面向不同層級學(xué)生,開放真實(shí)產(chǎn)業(yè)課題,培養(yǎng)學(xué)生實(shí)踐創(chuàng)新能力,目前已累計(jì)投入超2億元的激勵資金。
這意味著,高校學(xué)子接觸昇騰AI每個環(huán)節(jié)都能得到扶持,實(shí)現(xiàn)“有所學(xué)”“有所踐”“有所用”。本次賽事也讓更多參賽者了解到昇騰AI的整體生態(tài),一定程度上打消了石皓文們的擔(dān)憂和疑慮。此外,計(jì)算產(chǎn)業(yè)出于數(shù)字經(jīng)濟(jì)基礎(chǔ)設(shè)施的特殊定位,無論上層熱點(diǎn)如何變化,計(jì)算原生人才始終能找到自己的一席之地。
結(jié)語
算子開發(fā)既是實(shí)現(xiàn)AI算法的關(guān)鍵環(huán)節(jié),更是推動AI技術(shù)從理論邁向大規(guī)模產(chǎn)業(yè)應(yīng)用的源動力之一,其在計(jì)算產(chǎn)業(yè)中將大有可為。目前,昇騰AI原生創(chuàng)新算子挑戰(zhàn)賽S3賽季將近尾聲,優(yōu)勝隊(duì)伍將在2025年5月舉辦的鯤鵬昇騰開發(fā)者大會(KADC)啟動總決賽,各大頂尖高校團(tuán)隊(duì)將迎來“諸神之戰(zhàn)”。
作為面向開發(fā)者的技術(shù)盛宴,一年一度的鯤鵬昇騰開發(fā)者大會不僅有超前沿的技術(shù)分享、超好玩的技術(shù)盛會、超驚喜的動手體驗(yàn),還可以與技術(shù)大咖、學(xué)術(shù)領(lǐng)軍人物以及生態(tài)伙伴、高校、優(yōu)秀開發(fā)者一道,領(lǐng)略計(jì)算開發(fā)最前沿,碰撞出技術(shù)創(chuàng)新與職業(yè)規(guī)劃的更多火花,攜手推動計(jì)算產(chǎn)業(yè)的繁榮與發(fā)展。
讓“屠龍技”走出“象牙塔”,如此才有利于暢通教育、科技、人才的良性循環(huán)。昇騰AI原生創(chuàng)新算子挑戰(zhàn)賽雖然僅是第一年,已經(jīng)成為高校和產(chǎn)業(yè)合作的標(biāo)桿案例之一,未來昇騰也將基于產(chǎn)教融合的需求,打造全流程、成規(guī)模、高質(zhì)量的人才培養(yǎng)體系,為中國計(jì)算產(chǎn)業(yè)發(fā)展提供堅(jiān)實(shí)而肥沃的“黑土地”。
【報(bào)名二維碼】