ITBear旗下自媒體矩陣:

亞馬遜放大招!全新AI大模型降價(jià)75%,3納米自研芯片即將面世

   時(shí)間:2024-12-05 11:39:36 來源:ITBEAR編輯:快訊團(tuán)隊(duì) 發(fā)表評(píng)論無障礙通道

亞馬遜在云計(jì)算領(lǐng)域的步伐再次加快,近日于其AWS年度大會(huì)上宣布了一系列重大創(chuàng)新,包括全新自研的人工智能(AI)模型和芯片。

當(dāng)?shù)貢r(shí)間12月3日,亞馬遜向全球展示了其最新的AI技術(shù)成果,亮點(diǎn)之一是Amazon Nova系列大模型。這一系列的AI模型旨在處理文本、圖像和視頻等多種數(shù)據(jù)類型,為用戶帶來全新的多媒體內(nèi)容生成和理解體驗(yàn)。據(jù)透露,Nova系列共包含六種型號(hào),從基礎(chǔ)的Micro模型到高端的多模態(tài)模型Pro,再到即將于2025年第一季度發(fā)布的Premier,以及兩款仍在研發(fā)中的Canvas和Reel模型,覆蓋了從低成本到高性能的各種需求。

Nova系列的一個(gè)顯著特點(diǎn)是其強(qiáng)大的語言支持能力,能夠處理超過200種語言。與亞馬遜現(xiàn)有的生成式AI服務(wù)平臺(tái)Amazon Bedrock相比,Nova系列中的Micro、Lite和Pro模型在價(jià)格和速度上都表現(xiàn)出色,至少比同類別中性能最佳的模型便宜75%,同時(shí)速度更快。這些模型還將集成到Bedrock平臺(tái),用戶可以通過API進(jìn)行訪問,并進(jìn)行自定義微調(diào)和蒸餾。

在芯片方面,AWS首席執(zhí)行官M(fèi)att Garman宣布,Trainium2芯片已經(jīng)全面開放出租,并正式推出了由Trainium2支持的Amazon EC2實(shí)例,能夠應(yīng)對(duì)當(dāng)前和未來的AI模型訓(xùn)練及部署需求。同時(shí),AWS還推出了下一代AI芯片Trainium3,這款3納米工藝節(jié)點(diǎn)的芯片將允許客戶更快構(gòu)建更大的模型,并在部署時(shí)提供卓越的實(shí)時(shí)性能。據(jù)悉,搭載Trainium3的AI服務(wù)器UltraServer性能將是Trainium2的四倍,首批基于Trainium3的實(shí)例預(yù)計(jì)將于2025年底面世。

蘋果公司的出席為大會(huì)增添了不少亮點(diǎn)。蘋果機(jī)器學(xué)習(xí)和人工智能高級(jí)總監(jiān)Benoit Dupin親自到場,并分享了蘋果如何使用AWS的服務(wù),特別是其定制AI芯片來提升Siri、Apple Maps和Apple Music等服務(wù)的性能。Dupin表示,蘋果與亞馬遜有著長期而穩(wěn)固的合作關(guān)系,亞馬遜的基礎(chǔ)設(shè)施既可靠又能滿足全球客戶的需求。

值得注意的是,蘋果正在利用AWS的定制AI芯片來優(yōu)化其搜索等服務(wù),并在機(jī)器學(xué)習(xí)推理工作方面實(shí)現(xiàn)了超過40%的效率提升。Dupin還透露,蘋果正在對(duì)Trainium2芯片進(jìn)行早期評(píng)估,預(yù)計(jì)在使用Trainium2進(jìn)行模型預(yù)訓(xùn)練時(shí),效率將提高50%。這一合作不僅展示了蘋果對(duì)AWS的信任和支持,也彰顯了亞馬遜在云計(jì)算領(lǐng)域的領(lǐng)先地位。

在大會(huì)的其他部分,亞馬遜還宣布與AI初創(chuàng)企業(yè)Anthropic加強(qiáng)合作,共同推出了Claude 3.5 Haiku延遲優(yōu)化版,將推理速度提高了60%。亞馬遜對(duì)Anthropic的投資已累計(jì)達(dá)到80億美元。Anthropic的聯(lián)合創(chuàng)始人兼首席計(jì)算官Tom Brown也在會(huì)上宣布,公司將啟動(dòng)“雷尼爾計(jì)劃”,未來將使用包含數(shù)十萬枚亞馬遜自研芯片的算力集群。

舉報(bào) 0 收藏 0 打賞 0評(píng)論 0
 
 
更多>同類資訊
全站最新
熱門內(nèi)容
網(wǎng)站首頁  |  關(guān)于我們  |  聯(lián)系方式  |  版權(quán)聲明  |  RSS訂閱  |  開放轉(zhuǎn)載  |  滾動(dòng)資訊  |  爭議稿件處理  |  English Version