ITBear旗下自媒體矩陣:

AI 是短視頻平臺的核心能力 快手其實是一家人工智能公司

   時間:2018-09-25 15:44:35 來源:洞察網(wǎng)編輯:星輝 發(fā)表評論無障礙通道

如何將每位用戶的注意力高效分配給海量豐富的短視頻,而非集中在少數(shù)爆款之上,光靠人工運營的方法是不可行的,這必須通過人工智能技術(shù)來實現(xiàn)。

AI 如何賦能短視頻平臺?

這是快手科技AI技術(shù)副總裁鄭文在極客公園「創(chuàng)新之火」活動上的演講主題。從純粹用于制作、分享 GIF 圖的工具性應用,到如今成為日活躍用戶量過億,用戶日均使用時長超一小時的新型短視頻社區(qū),這是快手七年走過的創(chuàng)業(yè)路。

七年,快手用戶累計發(fā)布短視頻超過 70 億條,從搞笑、幽默,游戲、娛樂,到各地風土、民情,內(nèi)容各異。對于快手,不少人認為它只是一家短視頻公司,短視頻平臺跟 AI 技術(shù)的關(guān)系并不大。

但是,如何將每位用戶的注意力高效分配給海量豐富的短視頻,而非集中在少數(shù)爆款之上,光靠人工運營的方法是不可行的,這必須通過人工智能技術(shù)來實現(xiàn)。

AI 技術(shù)讓記錄生活更有趣

面對每日數(shù)以千萬的新增視頻,該如何將其精準匹配到用戶眼前?快手 CEO 宿華曾形容,這是快手員工需要面對的前所未有的難題。為此,快手提出了一整套基于 AI 技術(shù)的解決方案,貫穿視頻生產(chǎn)、內(nèi)容理解,用戶理解,系統(tǒng)分發(fā)等使用快手的每個環(huán)節(jié)。在極客雇主交流會現(xiàn)場,快手科技AI技術(shù)副總裁鄭文說,AI 是快手連接內(nèi)容生產(chǎn)與消費兩個端口的核心能力。

快手上線了一批爆款特效,像是叫做快手時光機的「變老」表情,可以在十幾秒鐘中,讓視頻中人物的容顏變成 60 年之后、還有可以實時進行肢體識別的舞蹈游戲、AR 換臉等等。這些玩法背后是快手對前沿 AI 技術(shù)的開發(fā),涉及人體姿態(tài)估計、手勢識別、背景分割等多個技術(shù)模塊。這是在內(nèi)容生產(chǎn)領(lǐng)域,快手努力將記錄形式變得更加有趣的新嘗試。

用戶通過快手 app 拍攝、上傳了一段短視頻后,后臺機器會提取其內(nèi)含的基本信息,諸如視頻中人臉的性別、表情、顏值等,嘗試理解視頻內(nèi)容。機器還會依照場景識別、物體跟蹤、圖像質(zhì)量評估等維度,對圖像進行分類。語音識別,也是機器理解視頻的重要方面。機器會把語音轉(zhuǎn)化成文字,通過文字理解視頻表達的含義??焓侄嗝襟w內(nèi)容理解(Multi-Media Understanding)部門利用 AI 技術(shù)通過感知和推理兩個階段來解讀一個視頻,首先感知獲取視頻的客觀內(nèi)容信息,進而推理獲取視頻的高層語義信息。

像人把學到的知識存到大腦一樣,我們把快手的內(nèi)容整理并存儲到快手知識圖譜中,這樣融合感知內(nèi)容和知識圖譜,就可以完成對視頻高層語義及情感的識別。

促使機器理解用戶本身同樣不可或缺。用戶年齡、性別、是否使用 WiFi 等注冊的基本信息,用戶在使用快手時產(chǎn)生的大量行為數(shù)據(jù),都將傳輸?shù)揭粋€深度學習的模型中用于機器訓練,從而得到一組綜合性的用戶信息,以預測用戶的喜好,個體用戶之間的關(guān)聯(lián)。

快手如何破除「信息繭房」?

讓記錄形式更有趣,讓機器理解視頻內(nèi)容、深度洞悉用戶,這是快手利用 AI 技術(shù)賦能短視頻平臺的試探。

快手科技 AI 技術(shù)副總裁鄭文說,作為前沿技術(shù),人工智能在研發(fā)、執(zhí)行過程中還沒有一個非常成行的流程。根據(jù)自身發(fā)展情況,快手以問題為導向開展 AI 項目,首先明確需求,接著針對需求進行預研、收集數(shù)據(jù)、訓練模型,之后才是相應的功能開發(fā)與產(chǎn)品化。

人工智能與算法推薦曾引發(fā)一些爭議,大眾普遍認為,智能算法根據(jù)用戶興趣推薦內(nèi)容,久而久之,用戶便會被自己關(guān)心的事物圍繞,失去對外部世界的整體認知,形成「信息繭房」。對此,鄭文舉例快手的推薦機制作答:快手的推薦給用戶的內(nèi)容,絕非僅僅用戶最感興趣的部分,而是會考慮到內(nèi)容的多樣性,在更廣闊的領(lǐng)域發(fā)現(xiàn)感興趣的內(nèi)容。

鄭文舉例說,比如在社區(qū)中,會有一些跟你比較相似但不完全一樣的用戶,那么他們喜歡的內(nèi)容,你也有可能會感興趣,這樣就不是用戶自己一個人去探索,而是成千上萬相似但不同的人在一起探索?;谶@個邏輯的分發(fā)系統(tǒng),也可以真正顧及到長尾視頻,讓更多的人被看見。

作為記錄載體,短視頻形態(tài)本身具備普惠性。它極大降低了信息交流門檻,通過技術(shù)賦能,讓人們可以公平、有趣地記錄與分享生活。在極客雇主的交流會現(xiàn)場,鄭文說,記錄生活能夠提高人們的幸福感,在快手,人們可以看到更豐富的世界,而他們自己也能夠被世界看見。

今年四月,快手還與清華聯(lián)合成立了未來媒體數(shù)據(jù)研究院。該院以清華軟件學院與快手的技術(shù)難題攻關(guān)為基礎(chǔ),聯(lián)合新聞學院、社會學系等開展社會人文領(lǐng)域研究,涉及計算機圖形學、圖像處理、大數(shù)據(jù)和人工智能等領(lǐng)域,以合作開放的姿態(tài),探索技術(shù)賦能短視頻的更多可能。

舉報 0 收藏 0 打賞 0評論 0
 
 
更多>同類資訊
全站最新
熱門內(nèi)容
網(wǎng)站首頁  |  關(guān)于我們  |  聯(lián)系方式  |  版權(quán)聲明  |  網(wǎng)站留言  |  RSS訂閱  |  違規(guī)舉報  |  開放轉(zhuǎn)載  |  滾動資訊  |  English Version