ITBear旗下自媒體矩陣:

云天勵飛首席科學(xué)家王孝宇:這個國際開源AI平臺讓你秒變算法專家!

   時間:2022-05-12 14:09:37 來源:互聯(lián)網(wǎng)編輯:星輝 發(fā)表評論無障礙通道

近日,由云天勵飛首席科學(xué)家王孝宇博士等多位國際AI科學(xué)家共同發(fā)起的AI基礎(chǔ)軟件平臺YMIR正式發(fā)布。

什么是 YMIR?

YMIR(挖米匠),是一個數(shù)據(jù)驅(qū)動的開源算法訓(xùn)練平臺,能夠做到以無代碼開發(fā)的方式,實現(xiàn)數(shù)據(jù)管理、數(shù)據(jù)挖掘、模型訓(xùn)練、模型驗證等功能。YMIR遵從Apache 2.0 許可協(xié)議,商用及個人使用均免費。

YMIR是由國際AI科學(xué)家共同發(fā)起的AI基礎(chǔ)軟件平臺。發(fā)起成員包括:前Snap計算機視覺主席,云天勵飛首席科學(xué)家王孝宇;美國硅谷NEC 實驗室媒體分析部主管、UCSD教授,印裔科學(xué)家Manmohan Chandraker;前谷歌、亞馬遜、Snap機器學(xué)習(xí)研究員,硅谷初創(chuàng)公司Heali聯(lián)合創(chuàng)始人、首席AI官,法裔科學(xué)家William Brendel等。

云天勵飛首席科學(xué)家 王孝宇

美國硅谷NEC 實驗室媒體分析部主管、UCSD教授 Manmohan Chandraker

前谷歌、亞馬遜、Snap機器學(xué)習(xí)研究員,硅谷初創(chuàng)公司Heali聯(lián)合創(chuàng)始人、首席AI官 William Brendel

YMIR 的五大特點?

YMIR是一個高度自動化的AI模型開發(fā)產(chǎn)品。其將模型開發(fā)行為抽象為數(shù)據(jù)收集、模型訓(xùn)練、數(shù)據(jù)挖掘、數(shù)據(jù)標(biāo)注等基本操作,并形成標(biāo)準(zhǔn)流程,提供一站式服務(wù)。實際使用時以圖形化的交互界面完成數(shù)據(jù)與模型不斷更新迭代的完整流程。由此,YMIR極大降低了AI模型研發(fā)的技能要求,不再要求從業(yè)者具備專業(yè)的AI技能。只要對系統(tǒng)操作員加以數(shù)據(jù)集、模型訓(xùn)練、模型迭代等概念知識的少量培訓(xùn),其便具備模型開發(fā)的能力,因而對人工智能向各行各業(yè)的普及具備重大意義。

針對具備一定專業(yè)能力的算法開發(fā)人員,YMIR平臺提供開放API,使用者可籍此將自己開發(fā)的模型訓(xùn)練、數(shù)據(jù)挖掘、數(shù)據(jù)標(biāo)注、模型診斷等工具對接YMIR開放接口實現(xiàn)端到端的一站式模型開發(fā)。

YMIR 主要以數(shù)據(jù)為中心,集成了數(shù)據(jù)和模型版本控制,同時引入工作空間等概念,實現(xiàn)多個模型開發(fā)任務(wù)的并行快速迭代,為模型的大規(guī)模批量生產(chǎn)提供平臺性支持。

YMIR V1.0 新增模型生產(chǎn)項目管理

1、傻瓜式迭代操作流程(保姆式模型開發(fā)流程指引)

YMIR 新版本與上一版本相比,引入項目管理式的工作流程,使AI模型的生產(chǎn)進(jìn)一步標(biāo)準(zhǔn)化。與老版本相比,模型生產(chǎn)操作員上手時間大幅縮短,并通過標(biāo)準(zhǔn)化的生產(chǎn)方式實現(xiàn)AI模型品控。

在以項目管理為理念的研發(fā)制式下,模型研發(fā)項目被切分為幾個關(guān)鍵模塊。每個模塊對應(yīng)一個任務(wù),這些任務(wù)具備前后依賴關(guān)系形成研發(fā)流程。只有流程前方任務(wù)完成后,流程后方任務(wù)才能被啟動。如下圖所示,當(dāng)一個模型研發(fā)項目被創(chuàng)建后,即能看到頁面上方的任務(wù)迭代流程指引,清晰說明當(dāng)前步驟與下一步驟,僅需按照指引點擊鼠標(biāo)操作即可,操作對小白用戶十分友好、非常銀杏化。

賬號登錄后即可見項目創(chuàng)建頁面

項目創(chuàng)建成功后的頁面

項目創(chuàng)建后的任務(wù)流程指引頁面

2、數(shù)據(jù)集自動整理

在AI模型開發(fā)的周期里,模型迭代占據(jù)90%以上的時間。而數(shù)據(jù)的迭代是模型迭代的關(guān)鍵部分,數(shù)據(jù)也是AI研發(fā)過程中最為重要的資產(chǎn),因此數(shù)據(jù)更新的追蹤和管理顯得尤為重要。能重現(xiàn)數(shù)據(jù)的更新過程,便能重復(fù)模型生產(chǎn)過程。

YMIR新增數(shù)據(jù)集版本管理功能,能自動生成數(shù)據(jù)集版本并記錄每次對數(shù)據(jù)集的操作。一方面,與上一版本相比,使用者無需通過手動命名數(shù)據(jù)集對不同功能數(shù)據(jù)集進(jìn)行區(qū)分,系統(tǒng)會自動進(jìn)行數(shù)據(jù)整理,歸入訓(xùn)練集、挖掘集、測試集等,并對這些數(shù)據(jù)集的更新進(jìn)行版本控制。數(shù)據(jù)集和模型的一一對應(yīng)關(guān)系亦被記錄下來。此功能對有大量數(shù)據(jù)挖掘的模型研發(fā)十分友好,減少數(shù)據(jù)集版本的冗余,提高數(shù)據(jù)集管理效率。YMIR用戶再也不用對著上百個雷同的數(shù)據(jù)集無從下手。另一方面,模型的研發(fā)過程被完整的記錄下來,可輕易重新生產(chǎn)模型。傳統(tǒng)的算法研發(fā)人員工作交接涉及,數(shù)據(jù)集、模型、訓(xùn)練流程等多個復(fù)雜環(huán)節(jié)的交接,很難重復(fù)之前的工作。而在YMIR平臺上產(chǎn)生的研發(fā)過程,尤其是數(shù)據(jù)集的迭代均有完整追蹤,基本不需要交接流程,企業(yè)再也不用擔(dān)心員工突然的離職。

數(shù)據(jù)集版本管理頁面(1)

數(shù)據(jù)集版本管理頁面(2)

模型迭代版本管理頁面

YMIR V1.0 無縫對接開放免費的標(biāo)注工具LabelFree

數(shù)據(jù)標(biāo)注的質(zhì)量與效率直接影響模型訓(xùn)練的質(zhì)量與效率,一個好的標(biāo)注工具可以讓模型訓(xùn)練事半功倍。LabelFree是一個開放的、可私有化部署的高性能數(shù)據(jù)標(biāo)注系統(tǒng)。其操作簡單、數(shù)據(jù)可靠,為算法服務(wù)提供可靠的底層數(shù)據(jù)支撐。

LabelFree項目管理頁面

1.大幅提升標(biāo)注質(zhì)量

LabelFree支持在數(shù)據(jù)標(biāo)注的早期階段對標(biāo)注質(zhì)量進(jìn)行嚴(yán)格把控。其支持多角色用戶管理功能,當(dāng)角色為質(zhì)檢員時,可對標(biāo)注結(jié)果進(jìn)行檢查與復(fù)核。

2.大幅提升標(biāo)注效率

LabelFree可大幅提升個人標(biāo)注效率。其支持大量標(biāo)注步驟快捷鍵操作,通過人機交互的優(yōu)化顯著提升標(biāo)注效率。

快捷鍵使用說明

LabelFree亦支持團隊標(biāo)注。其支持多人協(xié)作完成同一標(biāo)注任務(wù),并實現(xiàn)任務(wù)自動分發(fā)。

同時,LabelFree提供一鍵標(biāo)注服務(wù),幫助需要的個人及企業(yè)用戶在最短的時間內(nèi)獲取質(zhì)量可靠的標(biāo)注數(shù)據(jù)。

3、可靠的數(shù)據(jù)安全管理

數(shù)據(jù)的完全私有化管理,最大程度的保護數(shù)據(jù)安全。數(shù)據(jù)集管理服務(wù)依托具有彈性伸縮能力的原生對象存儲,為機器學(xué)習(xí)、大數(shù)據(jù)分析平臺提供高性能、高可用的數(shù)據(jù)基座。

4、完全的免費開放平臺

LabelFree平臺對數(shù)據(jù)集大小、用戶數(shù)量、項目數(shù)量等功能均無限制,用戶可在平臺上進(jìn)行各種自定義的數(shù)據(jù)標(biāo)注任務(wù)并獲得良好的體驗。

重磅!挖米要開直播啦!手把手教大家使用 YMIR,小白也能成為算法工程師!

歡迎大家試用新版本,接受所有吐槽哦~?部署或試用過程中有任何問題都?xì)g迎聯(lián)系小助手“挖米匠”(微信ID:itsymir)。


舉報 0 收藏 0 打賞 0評論 0
 
 
更多>同類資訊
全站最新
熱門內(nèi)容
網(wǎng)站首頁  |  關(guān)于我們  |  聯(lián)系方式  |  版權(quán)聲明  |  網(wǎng)站留言  |  RSS訂閱  |  違規(guī)舉報  |  開放轉(zhuǎn)載  |  滾動資訊  |  English Version