語音助手,人臉識別,外文翻譯等等,AI 已融入到了我們生活的方方面面,極大了促進(jìn)了社會的發(fā)展。深度學(xué)習(xí)是 AI 的核心技術(shù),在圖像分類,自然語言處理,自動駕駛等眾多領(lǐng)域顯示出了強(qiáng)大的能力,其中 Caffe,TensorFlow,Keras,PyTorch 是主流的深度學(xué)習(xí)框架,擁有強(qiáng)大的社區(qū)支持,是實(shí)踐深度學(xué)習(xí)不可或缺的工具。
以 Docker 和 K8S 為代表的容器技術(shù)被越來越多的企業(yè)和機(jī)構(gòu)采用,為此青云 QingCloud 推出深度學(xué)習(xí)平臺容器版,將主流的深度學(xué)習(xí)框架做成 Docker 鏡像, 用戶無需為搭建環(huán)境浪費(fèi)時間,直接通過容器啟動配置好的深度學(xué)習(xí)平臺,使得用戶可以專注于深度學(xué)習(xí)應(yīng)用的開發(fā),避免了框架繁瑣的安裝部署流程,還可以按需選擇不同版本的深度學(xué)習(xí)框架 Docker 鏡像,實(shí)現(xiàn)定制深度學(xué)習(xí)平臺的目的,提高用戶的開發(fā)和部署效率。
1: 青云深度學(xué)習(xí)平臺容器版
青云深度學(xué)習(xí)平臺容器版提供 GPU 和 CPU 兩個容器版本:
其中 GPU 版本分為 GPU 高級版和 GPU 基礎(chǔ)版,均搭載 NVIDIA Tesla P100 GPU,GPU 高級版和 GPU 基礎(chǔ)版的區(qū)別在于 CPU 核數(shù)、內(nèi)存的可配置范圍以及是否支持包年包月。
CPU 版本為 QingCloud 深度學(xué)習(xí)平臺攜手 Intel,推出了兩個針對 Intel CPU 優(yōu)化的深度學(xué)習(xí)平臺版本,優(yōu)化版 1:增加 avx 指令集支持以加速 Caffe, TensorFlow, Keras, PyTorch 訓(xùn)練;優(yōu)化版 2:增加 avx2, fma 指令集支持和 MKLDNN 庫以加速 Caffe, TensorFlow, Keras 訓(xùn)練,增加 avx2 指令集支持加速 PyTorch 訓(xùn)練。
據(jù)測試,Intel 優(yōu)化版 TensorFlow ,在 16 核 Broadwell 平臺上,ResNet 50 的推理速度可達(dá) 40 imgs/s ,能夠滿足一些輕量級模型的訓(xùn)練和推理需求。
GPU 容器版在 Docker 宿主機(jī)中安裝 NVIDIA Driver(387.26),nvidia-Docker2,Docker(18.03.1-ce),CPU 容器版在 Docker 宿主機(jī)上安裝 Docker(18.03.1-ce),容器版在宿主機(jī)上預(yù)置了一個或多個 Docker 鏡像,鏡像中均安裝 Caffe(BVLC 1.0 或 Intel 1.1)、TensorFlow(1.8.0),Keras(2.2.0),PyTorch(0.4.1)框架。
同時,為滿足用戶對不同 Deep Learning 框架版本、python 版本和 CUDA 版本的需求,青云深度學(xué)習(xí)平臺容器版提供了匹配不同版本的多個Docker image,用戶可依據(jù)需要拉取,各框架的 Repository 地址如下:
深度學(xué)習(xí)框架鏡像倉庫
TensorFlow:
https://hub.Docker.com/r/qingcloud/tensorflow/
Keras:
https://hub.Docker.com/r/qingcloud/keras/
Pytorch:
https://hub.Docker.com/r/qingcloud/pytorch/
Caffe:
https://hub.Docker.com/r/qingcloud/caffe/
TensorFlow+Keras+Pytorch+Caffe:
https://hub.Docker.com/r/qingcloud/deeplearning/
PS: 接下來,我們還將推出基于 K8S 的機(jī)器學(xué)習(xí)/ 深度學(xué)習(xí)平臺,敬請期待。
2: 平臺性能測試
為了讓用戶快速了解深度學(xué)習(xí)平臺的性能指標(biāo)以便于選擇,我們使用 TensorFlow 性能測試代碼中的 CNN Benchmark ,對常用硬件配置組合進(jìn)行了測試。 我們選擇 ResNet-50 模型,調(diào)用 Python 3.6 + TensorFlow 1.7.0 環(huán)境,使用合成數(shù)據(jù)進(jìn)行測試。
3: 模型和數(shù)據(jù)
為了方便用戶使用,我們收集了深度學(xué)習(xí)常用的數(shù)據(jù)集,以及一些常用模型的預(yù)訓(xùn)練權(quán)重,放在對象存儲中,用戶可直接使用這些數(shù)據(jù)開始自己的工作,節(jié)省下載數(shù)據(jù)的時間,提高工作效率。(下載地址:http://t.cn/RkK0v6y)
4: 訓(xùn)練與推理實(shí)踐
為了方便用戶的學(xué)習(xí)和實(shí)踐,我們還提供了包含圖像分類、目標(biāo)檢測、人臉識別及自然語言處理的示例,以下簡單舉例說明。(更多案例:http://t.cn/RkK0Lnl )
更多使用問題可查閱用戶指南:
https://docs.qingcloud.com/product/ai/deeplearning/