在近期舉辦的IDEA大會上,美國國家工程院外籍院士、IDEA創(chuàng)院理事長沈向洋以一句幽默而現(xiàn)實的話語引起了廣泛關注:“談卡傷情,無卡更無情?!边@句話不僅逗樂了在場觀眾,也深刻反映了沈向洋對未來AI時代的樂觀態(tài)度。
隨著AI技術的不斷發(fā)展,大模型的熱度已不再像ChatGPT初現(xiàn)時那般迅猛增長。進入人類探索AGI(通用人工智能)的第二階段,大語言模型的迭代速度明顯放緩,而AI應用與落地則成為全球關注的焦點。沈向洋指出,盡管GPT-5尚未面世,但算力的增長仍呈現(xiàn)樂觀態(tài)勢。據(jù)EPOCH AI數(shù)據(jù)統(tǒng)計,大模型對算力的需求每年都呈現(xiàn)出四倍以上的增長趨勢。
在大會上,沈向洋詳細闡述了黃仁勛提出的“黃氏定律”,該定律以模型訓練來衡量算力的增長。若按每年算力增長四倍的速度恒定發(fā)展,未來十年或將見證100萬倍的算力需求增長。然而,這一預測仍需時間驗證。沈向洋強調,大模型的進步不僅要求參數(shù)和模型規(guī)模的擴大,對訓練和數(shù)據(jù)量的需求也在同步增長。算力需求與參數(shù)之間呈現(xiàn)出平方關系,這意味著算力需求將急劇增加。
沈向洋進一步指出,AI的發(fā)展離不開“算力、算法、數(shù)據(jù)”這三大要素。在大會上,他圍繞這三個方向,介紹了IDEA的最新進展。IDEA最新發(fā)布的通用視覺大模型DINO-X,具備真正的物體級別理解能力,能夠在開放世界中實現(xiàn)目標檢測,無需用戶提示即可檢測所有物體,包括罕見的長尾物體。這一能力將大大拓展模型的落地場景。
DINO-X在自動駕駛、智能安防、工業(yè)檢測等領域也將發(fā)揮重要作用,能夠應對各種復雜場景,識別出傳統(tǒng)模型難以檢測的物體。IDEA團隊還推出了行業(yè)平臺架構,通過一個大模型基座,結合通用識別技術,使模型能夠邊用邊學,滿足多種多樣的B端應用需求。沈向洋表示,“用一個模型解決一百萬個問題”是這次模型發(fā)布的關鍵理念。
然而,隨著模型體量的增大,高質量數(shù)據(jù)已成為制約AI發(fā)展的瓶頸。沈向洋指出,當前人工智能的發(fā)展已經(jīng)耗盡了人類社會的大部分高質量數(shù)據(jù)。為解決這一問題,IDEA團隊發(fā)布了自研的語境圖譜技術,該技術通過引入“指導手冊”,以圖譜為綱,指導用于合成的語境采樣,解決了過往文本數(shù)據(jù)合成方案多樣性匱乏的問題。
實驗結果顯示,IDEA團隊的方案能夠持續(xù)為大模型帶來能力提升,表現(xiàn)超過目前的最佳實踐,同時平均節(jié)約成本85.7%。IDEA在AI應用落地方面也取得了顯著進展。今年,IDEA公布了多個垂直領域的應用探索,包括化學領域專家大模型、科研數(shù)據(jù)處理平臺以及AI編程工具等。
其中,IDEA研發(fā)的化學領域專家大模型在分子屬性預測和化學反應預測能力上達到了業(yè)界領先水平。新發(fā)布的化學文獻多模態(tài)大模型則與晶泰科技聯(lián)合發(fā)布了專利數(shù)據(jù)挖掘平臺PatSight,將藥物領域的專利化合物數(shù)據(jù)挖掘時間從數(shù)周縮短至1小時。同時,IDEA研究院的MoonBit團隊展示了其開發(fā)的云原生AI編程工具MoonBit,該工具具備完備的多后端支持和跨平臺能力,將于12月正式開放。
在硬件層面,IDEA也取得了顯著進展。坐落在大灣區(qū)的IDEA擁有得天獨厚的硬件產(chǎn)業(yè)基礎和優(yōu)勢,與騰訊、美團和比亞迪等知名企業(yè)展開了合作。其中,IDEA與騰訊合作在深圳福田區(qū)、河套深港科技創(chuàng)新合作區(qū)落地建設福田實驗室,聚焦人居環(huán)境具身智能技術;與美團合作探索無人機視覺智能技術;與比亞迪合作拓展工業(yè)化機器人智能應用。
IDEA還發(fā)布了《低空經(jīng)濟發(fā)展白皮書3.0》,并發(fā)起共建OpenSILAS創(chuàng)新聯(lián)合體,與17家首批發(fā)起單位攜手,共同打造一個開放共享、技術領先、不斷迭代的系統(tǒng)和平臺。沈向洋在大會最后表示,AI的發(fā)展不僅要追求經(jīng)濟增長,更要轉化為人類的最大福祉。這是IDEA研究院及其合作伙伴在人工智能發(fā)展道路上必須思考的問題。