【ITBEAR科技資訊】6月1日消息,近日,360公司舉辦了智慧生活視覺大模型及AI硬件新品發(fā)布會(huì)。周鴻祎在會(huì)上指出,多模態(tài)大模型與物聯(lián)網(wǎng)的結(jié)合將成為下一個(gè)風(fēng)口,他相信大模型將帶來一場(chǎng)新的工業(yè)革命。他認(rèn)為,不僅所有軟件、APP、網(wǎng)站,而且各行各業(yè)都值得利用大模型進(jìn)行重構(gòu),而智能硬件則可視為硬件化的APP。
據(jù)ITBEAR科技資訊了解,周鴻祎舉例說明了360多年來在智能攝像頭領(lǐng)域的努力。以往的攝像頭能夠識(shí)別出老人和兒童等對(duì)象,但無法理解畫面的語義,因此無法做出準(zhǔn)確的預(yù)測(cè)。然而,通過結(jié)合大語言模型的多模態(tài)能力,攝像頭可以獲得真正的認(rèn)知能力,當(dāng)看到老人摔倒的場(chǎng)景時(shí),攝像頭可以聯(lián)想到老人可能處于危險(xiǎn)之中,并提前發(fā)出警告。
在發(fā)布會(huì)上,周鴻祎宣布了"360智腦-視覺大模型"的發(fā)布。他表示,大語言模型是構(gòu)建視覺大模型的基礎(chǔ),而多模態(tài)能力的增強(qiáng)則依靠了大語言模型在認(rèn)知、推理和決策方面的能力。視覺大模型也是"360智腦"重要的能力組成部分,使其能夠理解圖像,并未來還將具備理解視頻和聲音的能力。
360公司在視覺感知能力的基礎(chǔ)上,結(jié)合了擁有千億參數(shù)的"360智腦"大模型,并使用十億級(jí)互聯(lián)網(wǎng)圖文數(shù)據(jù)進(jìn)行訓(xùn)練和微調(diào),針對(duì)安防場(chǎng)景百萬級(jí)行業(yè)數(shù)據(jù)進(jìn)行優(yōu)化,最終開發(fā)出專業(yè)的視覺和多模態(tài)大模型——"360智腦-視覺大模型"。
周鴻祎表示:"目前,大模型的能力主要體現(xiàn)在軟件層面,但當(dāng)大模型與智能硬件相結(jié)合時(shí),將使大模型的能力從數(shù)字世界走向物理世界。"他對(duì)于多模態(tài)大模型與物聯(lián)網(wǎng)的結(jié)合充滿了信心,認(rèn)為這將成為下一個(gè)風(fēng)口,引領(lǐng)技術(shù)和行業(yè)的發(fā)展。