滾動資訊

當前位置：首頁 > 資訊 > 人工智能 > 正文內(nèi)容

微軟推出42億參數(shù)新AI模型Phi-3-vision，主打視覺理解

時間：2024-05-26 08:39:49 來源：ITBEAR編輯：茹茹 發(fā)表評論無障礙通道

【ITBEAR科技資訊】5月26日消息，微軟最近推出了其小語言AI模型家族(SLM)的全新成員——“Phi-3-vision”。此款模型以“視覺能力”為主打特色，不僅能理解圖文內(nèi)容，還被譽為能在移動平臺上實現(xiàn)流暢高效的運行。

Phi-3-vision模型，作為微軟Phi-3系列的首款多模態(tài)模型，其文字理解能力源于Phi-3-mini，并繼承了其輕量化特性，非常適合在移動設(shè)備或嵌入式系統(tǒng)中運行。該模型擁有42億的參數(shù)量，這一數(shù)字超過了Phi-3-mini的3.8億，但低于Phi-3-small的70億。其上下文長度達到了128k token，訓(xùn)練周期從2024年2月持續(xù)至4月。

據(jù)ITBEAR科技資訊了解，Phi-3-vision模型的最大亮點在于其“圖文識別能力”。它不僅能夠理解現(xiàn)實世界中圖片的含義，還能迅速識別和提取圖片中的文字信息。微軟表示，這款模型在辦公場合中表現(xiàn)出色，特別是在識別和理解圖表及方塊圖方面有著出色的能力。它可以根據(jù)用戶輸入的信息進行推理，并為企業(yè)提供有價值的戰(zhàn)略建議，其效果甚至可與大型模型相媲美。

在模型訓(xùn)練方面，微軟強調(diào)Phi-3-vision是通過多種類型的圖片和文字數(shù)據(jù)進行訓(xùn)練的，這些數(shù)據(jù)來源于一系列經(jīng)過嚴格篩選的公開內(nèi)容，如教育材料、代碼、圖文標注數(shù)據(jù)等，從而確保了模型能夠處理多樣化的輸入。同時，微軟也注重用戶隱私的保護，在訓(xùn)練數(shù)據(jù)中嚴格排除了任何個人信息。

性能方面，微軟提供了Phi-3-vision與其他競品模型如字節(jié)跳動的Llama3-Llava-Next(8B)、微軟研究院與其他機構(gòu)合作的LlaVA-1.6(7B)以及阿里巴巴的通義千問QWEN-VL-Chat等模型的對比圖表。結(jié)果顯示，Phi-3-vision在多個測試項目中均表現(xiàn)出色。

目前，微軟已經(jīng)將Phi-3-vision模型上傳至Hugging Face平臺。

舉報 0 收藏 0 打賞 0評論 0

更多>同類資訊

蘋果AI尋中國“盟友”，騰訊字節(jié)誰能“入果”？iPhone創(chuàng)新何在？

12-19

天陽科技與SS&C攜手，億元打造Algorithmics軟件獨家信創(chuàng)版

12-19

值得買科技榮獲卓越發(fā)展大獎，創(chuàng)新驅(qū)動消費產(chǎn)業(yè)高質(zhì)量發(fā)展

12-19

訊飛智作斬獲獵云網(wǎng)2024“年度生成式AI創(chuàng)新”大獎，AIGC未來可期

12-19

榮耀MagicOS 9.0升級全解析：新功能適配進度與長焦拍照優(yōu)化進行時

12-19

閃極AI“拍拍鏡”來襲：智能眼鏡新體驗，售價999元起接入大模型

12-19

閃極AI拍拍鏡震撼上市！國內(nèi)首款量產(chǎn)，售價僅999元起

12-19

蘋果中國AI大模型合作引關(guān)注，字節(jié)騰訊誰將脫穎而出？

值得一題的是，12月19日，北京智源人工智能研究院（智院研究員）發(fā)布國內(nèi)外100余個開源和商業(yè)閉源模型多份評測結(jié)果，作為今年英偉達全球第二大買家、擁有23萬張GPU的字節(jié)跳動豆包大模型名列前茅，語言模型結(jié)果…

12-19

張一鳴私募新動作，重心已悄然轉(zhuǎn)向大模型與AI戰(zhàn)略？

12-19

算力硬件引領(lǐng)市場熱潮，豆包概念股能否持續(xù)走強？

12-19

市場分化算力硬件爆發(fā)，抖音微信小店概念股活躍，后市如何演繹？

12-19

北證50深V反轉(zhuǎn)，AI硬件與微信小店成市場新寵？

12-19

OpenAI Canvas大升級：React渲染與文本格式化新工具來襲

12-19

OpenAI新招！ChatGPT熱線電話服務(wù)上線，老年機座機也能聊

12-19

AMD蘇姿豐領(lǐng)投，Liquid AI崛起：機器人之母帶隊，AI賽道再掀狂瀾

12-19

點擊查看更多 +

全站最新

“王妃”炫富帶貨后集體消失，網(wǎng)友直呼：別再消耗我們的善良！

蘋果AI尋中國“盟友”，騰訊字節(jié)誰能“入果”？iPhone創(chuàng)新何在？

打假人王海遭品牌起訴，道歉后又要反訴，這場“打假”戰(zhàn)何時休？

余承東透露：鴻蒙智行受車廠熱捧，資源有限難以滿足所有合作需求

余承東回憶：與北汽合作始于2017年一張PPT開啟華為汽車夢

榮耀Magic7 RSR保時捷設(shè)計：100倍AI長焦，樣張細節(jié)震撼曝光！

熱門內(nèi)容

本欄最新

蘋果AI尋中國“盟友”，騰訊字節(jié)誰能“入果”？iPhone創(chuàng)新何在？

天陽科技與SS&C攜手，億元打造Algorithmics軟件獨家信創(chuàng)版

值得買科技榮獲卓越發(fā)展大獎，創(chuàng)新驅(qū)動消費產(chǎn)業(yè)高質(zhì)量發(fā)展

訊飛智作斬獲獵云網(wǎng)2024“年度生成式AI創(chuàng)新”大獎，AIGC未來可期

榮耀MagicOS 9.0升級全解析：新功能適配進度與長焦拍照優(yōu)化進行時

閃極AI“拍拍鏡”來襲：智能眼鏡新體驗，售價999元起接入大模型

本網(wǎng)站LOGO小熊標志受版權(quán)保護，版權(quán)登記號：魯作登字-2015-F-025467，未經(jīng)ITBEAR官方許可，嚴禁使用。
聲明：本網(wǎng)站是公益性科普網(wǎng)站，為網(wǎng)友提供科技類資訊內(nèi)容，無障礙技術(shù)由太陽灣捐增，為閱讀障礙用戶提供內(nèi)容聽讀服務(wù)。如本站內(nèi)容侵犯了您的權(quán)利，請通知我們及時刪除。
中國（山東）自由貿(mào)易試驗區(qū) · 齊魯軟件園魯ICP備11015305號-1 商業(yè)合作入口
Copyright ? 小熊科技資訊 2007-2024 ITBEAR.COM.CN All rights reserved.

微軟推出42億參數(shù)新AI模型Phi-3-vision，主打視覺理解

微軟推出42億參數(shù)新AI模型Phi-3-vision，主打視覺理解