【ITBEAR】OpenAI近日為其GPT-4o模型推出了視覺微調功能,使該模型除了處理文本外,還能對圖像進行微調。此項更新顯著增強了模型在各類任務中的表現(xiàn)。
據(jù)悉,自GPT-4o開放微調以來,已有數(shù)十萬開發(fā)者利用文本數(shù)據(jù)集對該模型進行了微調,從而提升了其執(zhí)行特定任務的能力。如今,隨著視覺微調功能的加入,開發(fā)者們有望進一步拓展模型的應用場景。
OpenAI在官方博文中展示了幾個合作伙伴的成功案例。例如,Garb通過視覺微調提高了交通標志和限速標志的定位準確性;Automat在信息提取任務中的成功率大幅提升;而Coframe則通過微調改進了網站生成的一致性和布局正確性。
OpenAI還宣布向所有付費用戶開放這一新功能,并在2024年10月31日前提供每天100萬免費訓練token的優(yōu)惠。之后的收費標準也已明確公布。
隨著視覺微調功能的推出,GPT-4o模型在實用性和靈活性方面邁出了重要一步,預計未來將在多個領域發(fā)揮更大作用。