11月11日,在倫敦舉行的微軟未來解碼大會上,微軟劍橋研究院主任Chris Bishop公布了微軟「牛津計劃」最新的接口服務——通過照片識別出人物的情感。
這個新服務的功能還不止如此。本周早些時候,微軟為十一胡子月(Movember)男性健康慈善活動更新了人臉識別的API。這個活動號召男性在每年11月份都不要刮胡子,以引起全世界對男性健康的關注。這個新API可以識別出你胡子的濃密程度,并打分,貼上標簽。
這些好玩的應用,都建立在微軟「牛津計劃」強大的機器學習能力上。牛津計劃(Project Oxford)是一個炫酷的服務,它提供了一組工具包,能幫助開發(fā)者使用微軟的自然數(shù)據(jù)理解能力為自己的解決方案增加智能服務。這個計劃于2014年首次推出,包括了人臉識別、語音識別、計算機視覺、語言理解智能服務四大部分。微軟的人工助理服務Cortana和Skype翻譯服務(能實時翻譯50種文字和6種語音)都是基于這項技術。因此,一經推出就受到了從500強到初創(chuàng)公司的歡迎。
如果視頻無法播放,點擊這里試試
而今天,微軟對該計劃進行了更新,加入了新內容,并正式公布了公測版本。這個新版本能夠幫助開發(fā)者更好地使用服務——其中最引人注目的就是情感識別。微軟在一篇博客中公布了這個新API的細節(jié):
情感識別:基于微軟的Azure云服務,用標記了人類情緒的圖片數(shù)據(jù)集進行過訓練。它能夠識別出圖片中任何一張人臉的情緒。這個服務在圖片上使用元數(shù)據(jù),能夠識別圖上絕大多數(shù)人物是悲傷還是快樂,還能用在識別人們對特定事件(如展覽、市場信息等)的反應。
拼寫檢查:基于Web API,能夠集成入任意移動或云端應用,不僅能識別出拼寫錯誤,還能識別大小寫錯誤、語境拼寫錯誤以及其他問題。由于它在云端,所以永遠不用升級,并能繼續(xù)學習。
視頻加工:基于微軟的Hyperlapse視頻處理工具的技術,這個新API將在年底前進行測試。它能夠處理巨量的視頻數(shù)據(jù),識別出視頻中的單個人臉并進行追蹤。它還能根據(jù)一組參數(shù)檢測出視頻中人物或物體的行動——包括對視頻進行圖像穩(wěn)定處理,以消除攝像機移動所造成的影響。
說話者識別:目前,牛津計劃已經能夠輕易地將語音轉換為文字,但是這個新的說話者識別技術(今年年底開始測試)將能允許應用程序識別出究竟是誰在說話。微軟高級項目經理Ryan Galgon介紹說,這個服務將不會取代更強的驗證工具,但是它能識別出使用者身份的變化,能夠增強驗證工具的有效性。對安全要求不那么高的應用,它可以用來識別用戶——例如,識別電話會議中是誰在說話。
智能識別定制服務(CRIS):這個工具目前已經進行封閉式測試。它允許開發(fā)者構建對語音識別功能要求更高的應用程序。例如,可以用在體育館中的語音識別,那里有大量混凝土墻圍繞的空間,歡呼聲和背景噪聲十分嘈雜,使得普通的語音-文字引擎無法正常工作。
除了識別胡子,微軟的性別年齡檢測能力也有了極大提升,還在人臉識別應用接口中加入了微笑檢測工具。