【ITBEAR】9月25日消息,今日,百度云智大會(huì)順利舉行,會(huì)上,百度智能云宣布其百舸AI異構(gòu)計(jì)算平臺(tái)已成功升級(jí)至4.0版本,標(biāo)志著該平臺(tái)在技術(shù)與性能上邁出了重要一步。
據(jù)ITBEAR了解,百舸4.0版本的重點(diǎn)升級(jí)在于“多芯混訓(xùn)”能力,現(xiàn)已實(shí)現(xiàn)在萬(wàn)卡規(guī)模集群上達(dá)到95%的多芯混合訓(xùn)練效能,顯著提升了訓(xùn)練效率。此外,在集群部署環(huán)節(jié),升級(jí)后的百舸平臺(tái)展現(xiàn)出了卓越的性能,能夠?qū)⑷f(wàn)卡集群的運(yùn)行準(zhǔn)備時(shí)間從數(shù)周縮短至最快1小時(shí),極大地提高了部署效率。
針對(duì)大模型訓(xùn)練過(guò)程中常見(jiàn)的故障問(wèn)題,百舸4.0也進(jìn)行了全面的優(yōu)化。通過(guò)升級(jí)故障檢測(cè)手段和自動(dòng)容錯(cuò)機(jī)制,該平臺(tái)有效降低了故障發(fā)生的頻次,并大幅減少了集群故障的處理時(shí)間,確保了萬(wàn)卡集群上超過(guò)99.5%的有效訓(xùn)練時(shí)長(zhǎng)。
在模型推理方面,百舸4.0版本同樣帶來(lái)了顯著的優(yōu)化。通過(guò)對(duì)推理速度和成本的全面調(diào)整,該平臺(tái)的長(zhǎng)文本推理效率提升了1倍以上,為用戶提供了更加高效、經(jīng)濟(jì)的推理解決方案。
此次百舸AI異構(gòu)計(jì)算平臺(tái)的升級(jí),無(wú)疑將進(jìn)一步推動(dòng)AI技術(shù)的發(fā)展與應(yīng)用,為用戶提供更加高效、穩(wěn)定的計(jì)算服務(wù)。
#百度智能云# #百舸AI異構(gòu)計(jì)算平臺(tái)# #多芯混訓(xùn)# #模型推理# #集群部署#