【ITBEAR科技資訊】4月10日消息,OpenAI今日聲明,已向開(kāi)發(fā)者廣泛開(kāi)放了其全新的GPT-4 Turbo with Vision模型,這一模型在繼承了GPT-4 Turbo系列的特點(diǎn)的同時(shí),首次引入了視覺(jué)理解能力。
這一視覺(jué)增強(qiáng)的GPT-4 Turbo模型,不僅維持了原系列128,000個(gè)token的窗口大小和截止到2023年12月的知識(shí)庫(kù),更融合了圖像識(shí)別技術(shù),從而賦予了模型新的視覺(jué)分析能力。在此之前,開(kāi)發(fā)人員通常需要分別調(diào)用不同的模型以處理文本和圖像數(shù)據(jù),而現(xiàn)在,GPT-4 Turbo with Vision的出現(xiàn)打破了這一常規(guī),它將文本和圖像處理功能整合到一起,不僅簡(jiǎn)化了開(kāi)發(fā)流程,而且為各類應(yīng)用開(kāi)辟了新的可能性。
據(jù)ITBEAR科技資訊了解,不少開(kāi)發(fā)者已經(jīng)開(kāi)始利用這一新模型進(jìn)行創(chuàng)新實(shí)踐。例如,名為Devin的AI軟件工程助手正使用該模型提升其編程輔助能力;而健康健身應(yīng)用Healthify則通過(guò)它來(lái)分析用戶上傳的飲食照片,提供個(gè)性化的營(yíng)養(yǎng)建議;創(chuàng)意平臺(tái)Make Real更是巧妙地運(yùn)用GPT-4 Turbo with Vision,將手繪草圖轉(zhuǎn)化為實(shí)際可運(yùn)行的網(wǎng)站代碼。
盡管這一強(qiáng)大功能目前還沒(méi)有被整合到ChatGPT中,也未向公眾開(kāi)放,但OpenAI已暗示這一視覺(jué)增強(qiáng)的聊天功能不久后將在ChatGPT上亮相。