Falcon 40B：阿聯(lián)酋首個開源大型語言模型引領(lǐng)潮流

時間：2023-06-09 13:57:33 來源：ITBEAR編輯：星輝 發(fā)表評論無障礙通道

【ITBEAR科技資訊】6月9日消息，亞馬遜云科技近日宣布，阿布扎比技術(shù)創(chuàng)新研究所(TII)開源的大型語言模型Falcon 40B和Falcon 7B已于6月7日起在其機器學(xué)習(xí)中心Amazon SageMaker JumpStart中可使用。

Amazon SageMaker JumpStart是一個提供預(yù)訓(xùn)練模型、內(nèi)置算法和解決方案模板的平臺，旨在幫助用戶快速進行機器學(xué)習(xí)，實現(xiàn)文章總結(jié)、圖片生成等任務(wù)。

據(jù)ITBEAR科技資訊了解，用戶只需在SageMaker Studio中簡單操作，即可輕松部署和使用Falcon模型，或者通過SageMaker Python SDK進行編程方式的應(yīng)用。

此次發(fā)布意味著，不論是何行業(yè)、何規(guī)模的企業(yè)或開發(fā)者，都可以快速、輕松地部署Falcon 40B模型，并進行個性化定制以滿足特定需求，如翻譯、問答、信息總結(jié)、圖像識別等應(yīng)用程序。對于生成式AI行業(yè)的發(fā)展來說，這無疑具有重要意義。

Falcon 40B是阿聯(lián)酋的首個大型人工智能模型，由阿布扎比技術(shù)創(chuàng)新研究所(TII)開發(fā)并推出。該模型擁有400億參數(shù)，在高質(zhì)量token上進行了1萬億次的訓(xùn)練，性能超越了扎克伯格旗下的650億參數(shù)LLaMA模型以及其他知名開源模型，成為Hugging Face開源大語言模型全球榜的領(lǐng)軍者。

Falcon 40B不僅在性能上表現(xiàn)出色，而且在訓(xùn)練資源的利用效率上也非常高。相較于GPT-3模型，F(xiàn)alcon 40B只使用了75%的訓(xùn)練預(yù)算，卻能顯著超越GPT-3的性能。此外，在推理階段的計算量僅需GPT-3的1/5。

值得一提的是，F(xiàn)alcon 40B采用開源Apache 2.0許可證，廣泛允許免費使用(商業(yè)化開源收入超過100萬美元時，需繳納10%的授權(quán)費用)，為廣大AI應(yīng)用開發(fā)者提供了便利。開發(fā)者可在任何地方下載、檢查和部署模型權(quán)重，構(gòu)建滿足用戶需求的定制化AI工具。

根據(jù)了解，TII利用亞馬遜云科技的SageMaker進行Falcon大語言模型的訓(xùn)練工作。SageMaker是一個托管API集合，為開發(fā)、訓(xùn)練、優(yōu)化和托管機器學(xué)習(xí)模型提供支持，包括大型語言模型。TII使用SageMaker Training API提供的瞬態(tài)集群來訓(xùn)練Falcon大語言模型，最多支持48個ml.p4d.24xlarge實例(384個英偉達A100 GPU)。

目前，TII正在訓(xùn)練下一代Falcon大語言模型，并計劃將訓(xùn)練擴展到3136個A100 GPU(392個ml.p4d實例)。

除了Falcon，其他知名大型語言模型如Stability AI、AI21 Labs和LG AI也使用了亞馬遜云科技的SageMaker來處理其大語言模型工作負載。

通過Amazon SageMaker JumpStart，開發(fā)者現(xiàn)在可以快速輕松地部署自己的Falcon 40B模型，并進行個性化定制，加速生成式AI應(yīng)用產(chǎn)品的落地。

總而言之，亞馬遜云科技推出的Amazon SageMaker JumpStart為開發(fā)者提供了便利，使各行業(yè)客戶都能夠快速應(yīng)用Falcon 40B模型，并根據(jù)自身需求進行定制化開發(fā)。隨著各種大型語言模型的不斷涌現(xiàn)，生成式AI的發(fā)展前景將更加廣闊。

隨著互聯(lián)網(wǎng)的普及和移動互聯(lián)網(wǎng)的興起，用戶對信息的需求日益增長，這為廣告提供了廣闊的展示平臺。商業(yè)模式的創(chuàng)新也是推動廣告變現(xiàn)行業(yè)發(fā)展的關(guān)鍵。盡管廣告變現(xiàn)行業(yè)并未享受到政策紅利，但其火爆的市場現(xiàn)象，實則是市場…

阿里云在大會上宣布，將圍繞 AI時代的新需求，全面升級從服務(wù)器到計算、存儲、網(wǎng)絡(luò)、數(shù)據(jù)處理、模型訓(xùn)練和推理平臺的技術(shù)架構(gòu)體系，讓數(shù)據(jù)中心成為一臺超級計算機，為每個 AI和應(yīng)用提供高性能、高效的算力服務(wù)。 …

從招聘官網(wǎng)看，百度校招的AI崗位遍布AI四層技術(shù)架構(gòu)：算力層面，提供了AI異構(gòu)計算、云計算虛擬化、高性能計算等相關(guān)崗位；框架層，AI推理框架、AI訓(xùn)練框架均有名額；模型層，有大模型算法工程師、AI數(shù)據(jù)訓(xùn)練師…

華為（深圳）全球具身智能產(chǎn)業(yè)創(chuàng)新中心將致力于瞄準國際前沿技術(shù)，以產(chǎn)業(yè)示范應(yīng)用場景為牽引，開展技術(shù)攻關(guān)和聯(lián)合創(chuàng)新。通過科技攻關(guān)和技術(shù)突破，擴大行業(yè)影響力；同時打造并開放一批示范應(yīng)用場景，促進技術(shù)落地與商業(yè)化；…

本網(wǎng)站LOGO小熊標志受版權(quán)保護，版權(quán)登記號：魯作登字-2015-F-025467，未經(jīng)ITBEAR官方許可，嚴禁使用。
聲明：本網(wǎng)站是公益性科普網(wǎng)站，為網(wǎng)友提供科技類資訊內(nèi)容，無障礙技術(shù)由太陽灣捐增，為閱讀障礙用戶提供內(nèi)容聽讀服務(wù)。如本站內(nèi)容侵犯了您的權(quán)利，請通知我們及時刪除。
中國（山東）自由貿(mào)易試驗區(qū) · 齊魯軟件園魯ICP備11015305號-1 商業(yè)合作入口
Copyright ? 小熊科技資訊 2007-2024 ITBEAR.COM.CN All rights reserved.