滾動資訊

當(dāng)前位置：首頁 > 資訊 > 人工智能 > 正文內(nèi)容

正陽恒卓高凱：打造高效可靠AI基礎(chǔ)設(shè)施，智算中心建設(shè)需系統(tǒng)思維

時間：2025-01-06 15:47:37 來源：ITBEAR編輯：快訊團隊 發(fā)表評論無障礙通道

在近期舉辦的一場聚焦人工智能產(chǎn)業(yè)應(yīng)用的重要大會上，北京正陽恒卓科技有限公司的首席科學(xué)家高凱，分享了公司在智算中心建設(shè)領(lǐng)域的實戰(zhàn)經(jīng)驗，并針對AI基礎(chǔ)設(shè)施建設(shè)運營中面臨的高效性和可靠性挑戰(zhàn)，提出了獨到的見解。

高凱強調(diào)，盡管客戶普遍期望AI任務(wù)能夠高效利用智算中心提供的硬件資源，實現(xiàn)集群規(guī)模增大和硬件升級帶來的性能提升，但現(xiàn)實卻往往不盡如人意。對于大規(guī)模分布式AI任務(wù)來說，單純增加機器數(shù)量和升級計算芯片，并不能輕松實現(xiàn)性能的線性增長。

他指出，大規(guī)模分布式AI任務(wù)對資源的需求巨大，容易導(dǎo)致碎片化資源閑置，并對調(diào)度系統(tǒng)性能提出更高要求。同時，并行方法和通信順序也是影響分布式AI任務(wù)效率的關(guān)鍵因素。為了解決這些問題，高凱提出，大規(guī)模分布式AI基礎(chǔ)設(shè)施必須擁有強大的系統(tǒng)容錯能力和豐富的并行策略。

高凱還指出，在智算中心建設(shè)過程中，客戶對AI大模型運行的可靠性有著很高的期望。然而，現(xiàn)實情況是，AI系統(tǒng)中的各個組件都可能出現(xiàn)故障，導(dǎo)致AI任務(wù)中斷或失敗。這主要是因為AI任務(wù)依賴專用硬件，與傳統(tǒng)計算集群在能源、產(chǎn)熱、工作條件等方面存在差異。同時，主流AI并行框架采用同步方式運行，存在單點故障問題，傳統(tǒng)云平臺的容錯能力并不適用。

高凱認為，大規(guī)模分布式AI系統(tǒng)的容錯能力是AI系統(tǒng)穩(wěn)定運行的基礎(chǔ)，已經(jīng)成為全球AI大廠競相關(guān)注的問題。結(jié)合正陽恒卓為國家超算、大模型公司等企業(yè)建設(shè)大規(guī)模智算中心的經(jīng)驗，他提出，建設(shè)高效可靠的AI基礎(chǔ)設(shè)施是一個系統(tǒng)工程，可靠性和高效性都必須遵循從硬件到軟件系統(tǒng)性開發(fā)的原則。

他將AI基礎(chǔ)設(shè)施的構(gòu)建分為智算中心建設(shè)、基礎(chǔ)設(shè)施服務(wù)運營、AI開發(fā)部署框架以及AI應(yīng)用開發(fā)四個層級，并指出，相比于大型廠商能夠?qū)崿F(xiàn)從底層硬件到上層AI應(yīng)用的全棧自主研發(fā)，絕大部分小型企業(yè)往往不具備這樣的經(jīng)濟能力和人才儲備。因此，為了助推人工智能產(chǎn)業(yè)應(yīng)用的發(fā)展，提供高效可靠的AI基礎(chǔ)設(shè)施是智算中心未來需要具備的基本能力和發(fā)展趨勢。

據(jù)高凱介紹，為了讓AI基礎(chǔ)設(shè)施能夠惠及更多的人工智能產(chǎn)業(yè)應(yīng)用企業(yè)，正陽恒卓正致力于領(lǐng)導(dǎo)并構(gòu)建一個開放的、面向高效可靠智算中心的AI基礎(chǔ)設(shè)施基礎(chǔ)框架。這個開放基礎(chǔ)框架中的功能模塊基于開放的標準進行設(shè)計，旨在吸引更多相關(guān)行業(yè)的企業(yè)和開發(fā)者共同組建技術(shù)生態(tài)。這樣，用戶的模型開發(fā)、部署、應(yīng)用就能夠在不同的算力環(huán)境中實現(xiàn)無感的遷移，而AI基礎(chǔ)設(shè)施企業(yè)則可以通過技術(shù)創(chuàng)新提供高效性和可靠性的增值服務(wù)。

作為一家成立于2015年4月的公司，正陽恒卓目前已服務(wù)超300家企業(yè)客戶，是英偉達認證的精英級合作伙伴，并連續(xù)兩年成為NVIDIA Networking NPN業(yè)績第一名。在人工智能產(chǎn)業(yè)應(yīng)用領(lǐng)域，正陽恒卓正以其豐富的經(jīng)驗和創(chuàng)新的技術(shù)，為推動AI基礎(chǔ)設(shè)施的高效性和可靠性發(fā)展貢獻力量。

舉報 0 收藏 0 打賞 0評論 0

更多>同類資訊

ChatGPT Pro訂閱層級發(fā)布，高算力需求下OpenAI面臨虧損壓力？

01-06

云自開AI賦能溫江區(qū)公平街道衛(wèi)生中心，智能外呼開啟醫(yī)療服務(wù)新篇章

01-06

2025杰出雇主榜單發(fā)布：企業(yè)如何應(yīng)對市場挑戰(zhàn)，人才戰(zhàn)略是關(guān)鍵

01-06

中堅科技全資設(shè)立機器人公司，涉足多項人工智能業(yè)務(wù)領(lǐng)域

01-06

魔琺科技AI數(shù)字人：驅(qū)動跨境營銷新增長，解鎖出海新篇章

01-06

昆侖萬維「天工大模型4.0」o1版與4o版全量上線，天工APP與網(wǎng)頁免費開放！

01-06

奧爾特曼萬字長文：ChatGPT周活破3億，OpenAI劍指超級智能新征途

北京時間1月6日上午，奧爾特曼發(fā)布題為“反思”的1萬字博客文章，敘述OpenAI成立9年來和ChatGPT風(fēng)靡全球的過去兩年發(fā)生的事情和公司未來目標。我們?nèi)匀幌嘈?，不斷將出色的AI工具交到人們手中，將帶來廣泛…

01-06

螞蟻集團攜手多家企業(yè)增資清微智能，共促可重構(gòu)計算芯片發(fā)展

三言科技 1月6日消息，天眼查App顯示，近日，北京清微智能科技有限公司發(fā)生工商變更，深圳市卓源高科創(chuàng)業(yè)投資有限公司、LFCInvestment Hong Kong Limited退出股東行列，新增螞蟻集團…

01-06

螞蟻集團攜手多巨頭入股，清微智能可重構(gòu)計算芯片研發(fā)迎新機遇

01-06

具身智能機器人新趨勢：人形機器人將小規(guī)模商用，未來市場規(guī)?？蛇_7萬億美元

01-06

控?zé)熜绿魬?zhàn)：7500萬煙民待改變，數(shù)字健康方案能否成為新出路？

1月3日，在溫致科技2025年數(shù)字健康新品發(fā)布上，中國控?zé)熍c健康協(xié)會常務(wù)副會長兼秘書長賀青華表示，在《健康中國2030》綱要中，明確提出到2030年，成年人的吸煙率要從現(xiàn)在的24.1%，降至20%以下。以數(shù)…

01-06

字節(jié)跳動自建數(shù)據(jù)中心，2025年計劃投資1600億打造大規(guī)模集群

01-06

未來全屏通集團新年新氣象，全員漲薪5%共迎科技春天！

01-06

清微智能獲螞蟻集團等投資，加速可重構(gòu)計算芯片產(chǎn)業(yè)應(yīng)用

01-06

天工大模型4.0雙版本上線，免費體驗中文邏輯推理與多模態(tài)交互

01-06

點擊查看更多 +

全站最新

阿維塔攜手寧德時代深化合作，磐石底盤技術(shù)將首發(fā)亮相！

吉利銀河新車亮相，2025年銷量目標劍指百萬，能否實現(xiàn)新飛躍？

智界R7百日大定破5.8萬，成25萬+純電SUV銷冠，余承東：按百萬車標準打造

吉利銀河星艦7 EM-i首月交付破2萬，國產(chǎn)混動新星能否撼動比亞迪地位？

ChatGPT Pro訂閱層級發(fā)布，高算力需求下OpenAI面臨虧損壓力？

Denvix CES 2025將展240W有線無線雙充移動電源，旅行電量無憂！

熱門內(nèi)容

本欄最新

云自開AI賦能溫江區(qū)公平街道衛(wèi)生中心，智能外呼開啟醫(yī)療服務(wù)新篇章

2025杰出雇主榜單發(fā)布：企業(yè)如何應(yīng)對市場挑戰(zhàn)，人才戰(zhàn)略是關(guān)鍵

中堅科技全資設(shè)立機器人公司，涉足多項人工智能業(yè)務(wù)領(lǐng)域

魔琺科技AI數(shù)字人：驅(qū)動跨境營銷新增長，解鎖出海新篇章

螞蟻集團攜手多家企業(yè)增資清微智能，共促可重構(gòu)計算芯片發(fā)展

螞蟻集團攜手多巨頭入股，清微智能可重構(gòu)計算芯片研發(fā)迎新機遇

本網(wǎng)站LOGO小熊標志受版權(quán)保護，版權(quán)登記號：魯作登字-2015-F-025467，未經(jīng)ITBEAR官方許可，嚴禁使用。
聲明：本網(wǎng)站是公益性科普網(wǎng)站，為網(wǎng)友提供科技類資訊內(nèi)容，無障礙技術(shù)由太陽灣捐增，為閱讀障礙用戶提供內(nèi)容聽讀服務(wù)。如本站內(nèi)容侵犯了您的權(quán)利，請通知我們及時刪除。
中國（山東）自由貿(mào)易試驗區(qū) · 齊魯軟件園魯ICP備11015305號-1 商業(yè)合作入口
Copyright ? 小熊科技資訊 2007-2024 ITBEAR.COM.CN All rights reserved.

正陽恒卓高凱：打造高效可靠AI基礎(chǔ)設(shè)施，智算中心建設(shè)需系統(tǒng)思維

正陽恒卓高凱：打造高效可靠AI基礎(chǔ)設(shè)施，智算中心建設(shè)需系統(tǒng)思維