ITBear旗下自媒體矩陣:

IBM 推出開源工具,助力抗疫新冠病毒數(shù)據(jù)分析

   時間:2020-06-29 17:40:14 來源:C114中國通信網(wǎng) 作者:白開水不加糖編輯:星輝 發(fā)表評論無障礙通道

IBM 開源數(shù)據(jù)和 AI 技術(shù)中心(CODAIT)推出了一個新工具包 covid-notebooks,該工具包可幫助開發(fā)人員和數(shù)據(jù)科學家回答有關(guān)大流行的問題。

covid-notebooks 旨在幫助完成以下任務:

獲得有關(guān)爆發(fā)當前狀態(tài)的權(quán)威數(shù)據(jù),

清除最嚴重的數(shù)據(jù)質(zhì)量問題,

將數(shù)據(jù)整理成易于使用 Pandas 和 Scikit-Learn 等工具進行分析的格式,

以及構(gòu)建一組初始的示例報告和圖形。

IBM 方面表示,處理好這些任務,開發(fā)人員和數(shù)據(jù)科學家就可以解放出來,專注于高級分析和建模任務,而不用擔心數(shù)據(jù)格式和數(shù)據(jù)清理等問題。該存儲庫使用開發(fā)者友好的 Jupyter notebook 來涵蓋每個初始數(shù)據(jù)分析步驟。

此外還使用 Elyra Notebook Pipelines Visual Editor 和 KubeFlow Pipelines 創(chuàng)建了數(shù)據(jù)處理管道。示例如下:

這些管道使用戶只需單擊一個按鈕即可重新運行整個提取、轉(zhuǎn)換、分析工作流程。“我們資源庫中的工具使用權(quán)威來源,得出決策者可用于做出實時、關(guān)鍵決策的綜合見解。“

IBM 開源數(shù)據(jù)中心和 AI 中心首席架構(gòu)師 Frederick Reiss 表示:“對于正在分析 COVID-19 的影響并試圖根據(jù)數(shù)據(jù)提出可行計劃的數(shù)據(jù)科學家和決策者來說,相關(guān)信息可以說是鋪天蓋地。來自研究報告、新聞媒體、社交媒體和健康組織的數(shù)據(jù)幾乎源源不斷,這使得將數(shù)據(jù)分析為有用的行動的任務幾乎不可能完成。開發(fā)人員和數(shù)據(jù)科學家需要回答他們關(guān)于數(shù)據(jù)來源、工具以及如何從不斷變化的數(shù)據(jù)中得出有意義的、統(tǒng)計上有效的結(jié)論的問題。”

舉報 0 收藏 0 打賞 0評論 0
 
 
更多>同類資訊
全站最新
熱門內(nèi)容
網(wǎng)站首頁  |  關(guān)于我們  |  聯(lián)系方式  |  版權(quán)聲明  |  網(wǎng)站留言  |  RSS訂閱  |  違規(guī)舉報  |  開放轉(zhuǎn)載  |  滾動資訊  |  English Version