ITBear旗下自媒體矩陣:

走進(jìn)大眾點(diǎn)評(píng)神秘團(tuán)隊(duì) 百種誠(chéng)信算法確保點(diǎn)評(píng)客觀

   時(shí)間:2014-06-30 11:52:01 來源:互聯(lián)網(wǎng)編輯:星輝 發(fā)表評(píng)論無障礙通道

對(duì)于不少消費(fèi)者來說,客觀、獨(dú)立的消費(fèi)點(diǎn)評(píng)信息能夠幫助更準(zhǔn)確做決策。而對(duì)第三方點(diǎn)評(píng)平臺(tái)來說,如何保證點(diǎn)評(píng)信息的獨(dú)立、客觀其實(shí)挑戰(zhàn)很大。

記者了解到,在大眾點(diǎn)評(píng)內(nèi)部,有一支很少為外界所知的神秘部隊(duì)——誠(chéng)信團(tuán)隊(duì),他們是點(diǎn)評(píng)世界的警察,完全獨(dú)立于業(yè)務(wù)團(tuán)隊(duì)之外,負(fù)責(zé)監(jiān)控和處理各種炒作、虛假點(diǎn)評(píng)。

面對(duì)造假手法和技術(shù)層出不窮的第三方炒作機(jī)構(gòu),這支部隊(duì)是如何與其戰(zhàn)斗,保證點(diǎn)評(píng)內(nèi)容的獨(dú)立、客觀的呢?帶著這種好奇,記者走進(jìn)了大眾點(diǎn)評(píng)誠(chéng)信團(tuán)隊(duì)。

技術(shù)算法配合人工審查,確保準(zhǔn)確過濾

和現(xiàn)實(shí)世界里有警察與小偷一樣,點(diǎn)評(píng)誠(chéng)信的世界里并不太平,時(shí)常存在著各種作弊與反作弊的斗爭(zhēng),而誠(chéng)信團(tuán)隊(duì)就好比點(diǎn)評(píng)世界里的警察,維護(hù)點(diǎn)評(píng)世界獨(dú)立、客觀的秩序。

在誠(chéng)信團(tuán)隊(duì),記者見到誠(chéng)信組員M君,她剛剛從滿屏的數(shù)據(jù)中抽身出來接受采訪,“審查處理各種虛假點(diǎn)評(píng)和炒作信息是我們非常重要的工作之一,每天需要從數(shù)以百萬計(jì)的點(diǎn)評(píng)中甄別出這些虛假信息,而對(duì)數(shù)據(jù)進(jìn)行分析是其中的一種方法”。M君表示,“每天至少需要看幾百份數(shù)據(jù)報(bào)表”,除此之外,她每天上班需要做的工作還包括瀏覽系統(tǒng)的反饋信息、處理客戶投訴、關(guān)注站務(wù)論壇等等,而這些僅僅是發(fā)現(xiàn)問題的方式。

當(dāng)問及是否需要人工一個(gè)個(gè)甄別時(shí),M君笑道:“當(dāng)然不可能,大眾點(diǎn)評(píng)有一套完善的誠(chéng)信系統(tǒng),主要通過技術(shù)算法來過濾虛假點(diǎn)評(píng),人工審查只是輔助,如果有異常數(shù)據(jù)出現(xiàn)的話,系統(tǒng)會(huì)自動(dòng)報(bào)警。”目前90%的虛假信息系統(tǒng)都會(huì)自動(dòng)處理,而剩下的10%則需要M君和他的小伙伴們進(jìn)行人工審查。“信息的甄別是一份細(xì)致而繁重的工作,有時(shí)候?yàn)榱苏页隹赡艽嬖诘奶摷傩畔?,我們還會(huì)給自己設(shè)定角色,從虛假信息發(fā)布方自我假設(shè)來揣摸預(yù)測(cè)。”M君還特別強(qiáng)調(diào),誠(chéng)信系統(tǒng)最大的挑戰(zhàn)在于既要保證抓得全、抓得及時(shí),盡量減少漏抓,還必須保證沒有錯(cuò)抓,所有的工作都是為了確保過濾的準(zhǔn)確性。

每周上線新算法打擊炒作點(diǎn)評(píng)

在M君看來,誠(chéng)信組的工作其實(shí)是個(gè)大循環(huán),即:發(fā)現(xiàn)問題——數(shù)據(jù)分析——提煉特征——設(shè)計(jì)算法——實(shí)現(xiàn)算法——驗(yàn)證上線優(yōu)化系統(tǒng)——多方收集反饋發(fā)現(xiàn)問題。而所有人的工作都圍繞著這些在不斷的分解和前進(jìn)。

如果說把前兩個(gè)步驟比喻成警察抓小偷的偵查過程的話,那接下來最重要的攻堅(jiān)工作便是抓住作弊分子與進(jìn)行安全升級(jí)。

在偵查完之后,M君和組員們需要從多個(gè)維度進(jìn)行分析確認(rèn)新出現(xiàn)的問題是否存在炒作點(diǎn)評(píng)的特征,如果有的話則將不同問題的特征提煉歸納出來,進(jìn)行算法設(shè)計(jì),驗(yàn)證可行后即上線,而這正是誠(chéng)信團(tuán)隊(duì)的重中之重。

“基于以前的作弊與反作弊工作,現(xiàn)在我們已經(jīng)有100種左右的算法,”M君表示,第三方炒作機(jī)構(gòu)和不法分子跟進(jìn)得很快,如果發(fā)現(xiàn)之前造假規(guī)則通不過的話會(huì)嘗試變換其他的方式,“現(xiàn)在每周都仍有新算法跟進(jìn)炒作點(diǎn)評(píng)。”

據(jù)了解,大眾點(diǎn)評(píng)已有100種左右的算法來篩選虛假點(diǎn)評(píng)。與此同時(shí),還與美國(guó)數(shù)據(jù)挖掘協(xié)會(huì)輪值主席Bing Liu及其研究團(tuán)隊(duì)進(jìn)行基礎(chǔ)反作弊算法的合作研究,并借鑒了美國(guó)信用卡盜卡識(shí)別的先進(jìn)算法,在技術(shù)上走在Yelp、淘寶等公司的前面。

舉報(bào) 0 收藏 0 打賞 0評(píng)論 0
 
 
更多>同類資訊
全站最新
熱門內(nèi)容
網(wǎng)站首頁  |  關(guān)于我們  |  聯(lián)系方式  |  版權(quán)聲明  |  RSS訂閱  |  開放轉(zhuǎn)載  |  滾動(dòng)資訊  |  爭(zhēng)議稿件處理  |  English Version