賽輪思(Cerence)近日宣布,其與英偉達(dá)的合作將進(jìn)一步深化,旨在提升其CaLLM系列語(yǔ)言模型的能力,這一系列包括云端部署的賽輪思汽車大語(yǔ)言模型(CaLLM)以及嵌入式小語(yǔ)言模型CaLLM Edge。
此次攜手合作,CaLLM系列語(yǔ)言模型將借助NVIDIA AI Enterprise這一端到端的云原生軟件平臺(tái)獲得技術(shù)支持,而CaLLM Edge的某些功能則將通過(guò)NVIDIA DRIVE AGX Orin來(lái)強(qiáng)化。
具體而言,賽輪思的人工智能部門(mén)——Cerence AI,將通過(guò)NVIDIA AI Enterprise軟件平臺(tái),包括NVIDIA TensorRT-LLM和NVIDIA NeMo框架,來(lái)加速CaLLM系列模型的開(kāi)發(fā)與部署。NVIDIA NeMo是一個(gè)全面的框架,專為構(gòu)建、定制和將生成式AI應(yīng)用推向生產(chǎn)環(huán)境而設(shè)計(jì)。
借助這些先進(jìn)技術(shù),Cerence AI已經(jīng)對(duì)其CaLLM系列模型進(jìn)行了優(yōu)化和定制,旨在:
在NVIDIA的加速計(jì)算和SoC平臺(tái)上,提供更為迅速的車載助手性能。
開(kāi)發(fā)汽車專用的NVIDIA NeMo Guardrails實(shí)現(xiàn)方案,確保Cerence驅(qū)動(dòng)的系統(tǒng)能夠精準(zhǔn)捕捉并應(yīng)對(duì)車載交互的微妙變化。
通過(guò)NVIDIA DRIVE AGX Orin,在CaLLM Edge上實(shí)施和優(yōu)化代理架構(gòu),推動(dòng)下一代車載用戶體驗(yàn)的實(shí)現(xiàn)。