在近日于線上舉辦的火山引擎Force大會(huì)上,字節(jié)跳動(dòng)公司正式揭曉了其最新研發(fā)成果——豆包視覺(jué)理解模型。這一創(chuàng)新產(chǎn)品旨在為企業(yè)提供強(qiáng)大的多模態(tài)大模型能力,為企業(yè)智能化轉(zhuǎn)型注入新動(dòng)力。
據(jù)官方介紹,豆包視覺(jué)理解模型在成本控制上實(shí)現(xiàn)了突破,其千tokens輸入價(jià)格僅為3厘,換算下來(lái),一元錢(qián)便能處理高達(dá)284張720P分辨率的圖片。這一價(jià)格策略相較于行業(yè)平均水平,降幅高達(dá)85%,引發(fā)了廣泛關(guān)注。
抖音集團(tuán)副總裁李亮隨后在社交媒體上發(fā)表觀點(diǎn),強(qiáng)調(diào)豆包大模型的低價(jià)并非出于價(jià)格戰(zhàn)的目的。他指出,豆包大模型通過(guò)深度的技術(shù)創(chuàng)新,在算法設(shè)計(jì)、軟件工程以及硬件方案等多個(gè)層面進(jìn)行了全面優(yōu)化,從而實(shí)現(xiàn)了成本的大幅降低。3厘/千tokens的定價(jià)策略,在保障企業(yè)合理利潤(rùn)的同時(shí),也體現(xiàn)了公司推動(dòng)AI技術(shù)普及和應(yīng)用的決心。李亮還提到,豆包大模型的價(jià)格策略一步到位,透明公開(kāi),摒棄了傳統(tǒng)的“刊例價(jià)+折扣”模式,旨在讓每一家企業(yè)都能享受到AI技術(shù)帶來(lái)的便利。
在大會(huì)現(xiàn)場(chǎng),豆包3D生成模型也首次亮相,吸引了眾多目光。該模型與火山引擎的數(shù)字孿生平臺(tái)veOmniverse相結(jié)合,能夠完成智能訓(xùn)練、數(shù)據(jù)合成以及數(shù)字資產(chǎn)制作等一系列任務(wù)。官方將其譽(yù)為“一套支持AIGC創(chuàng)作的物理世界仿真模擬器”,為數(shù)字內(nèi)容的創(chuàng)作提供了全新的可能。
豆包大模型旗下的多款產(chǎn)品也迎來(lái)了全面升級(jí)。其中,豆包通用模型pro全面對(duì)標(biāo)GPT-4o,在性能上毫不遜色,但使用價(jià)格僅為后者的1/8,為用戶提供了更具性價(jià)比的選擇。音樂(lè)模型則能夠生成長(zhǎng)達(dá)3分鐘的完整音樂(lè)作品,為音樂(lè)創(chuàng)作領(lǐng)域帶來(lái)了新的活力。而文生圖模型2.1版本則實(shí)現(xiàn)了精準(zhǔn)生成漢字、一句話P圖等功能,并已成功接入即夢(mèng)AI和豆包App,進(jìn)一步拓寬了應(yīng)用場(chǎng)景。