對(duì)于不少消費(fèi)者來說,客觀、獨(dú)立的消費(fèi)點(diǎn)評(píng)信息能夠幫助更準(zhǔn)確做決策。而對(duì)第三方點(diǎn)評(píng)平臺(tái)來說,如何保證點(diǎn)評(píng)信息的獨(dú)立、客觀其實(shí)挑戰(zhàn)很大。
記者了解到,在大眾點(diǎn)評(píng)內(nèi)部,有一支很少為外界所知的神秘部隊(duì)——誠(chéng)信團(tuán)隊(duì),他們是點(diǎn)評(píng)世界的警察,完全獨(dú)立于業(yè)務(wù)團(tuán)隊(duì)之外,負(fù)責(zé)監(jiān)控和處理各種炒作、虛假點(diǎn)評(píng)。
面對(duì)造假手法和技術(shù)層出不窮的第三方炒作機(jī)構(gòu),這支部隊(duì)是如何與其戰(zhàn)斗,保證點(diǎn)評(píng)內(nèi)容的獨(dú)立、客觀的呢?帶著這種好奇,記者走進(jìn)了大眾點(diǎn)評(píng)誠(chéng)信團(tuán)隊(duì)。
技術(shù)算法配合人工審查,確保準(zhǔn)確過濾
和現(xiàn)實(shí)世界里有警察與小偷一樣,點(diǎn)評(píng)誠(chéng)信的世界里并不太平,時(shí)常存在著各種作弊與反作弊的斗爭(zhēng),而誠(chéng)信團(tuán)隊(duì)就好比點(diǎn)評(píng)世界里的警察,維護(hù)點(diǎn)評(píng)世界獨(dú)立、客觀的秩序。
在誠(chéng)信團(tuán)隊(duì),記者見到誠(chéng)信組員M君,她剛剛從滿屏的數(shù)據(jù)中抽身出來接受采訪,“審查處理各種虛假點(diǎn)評(píng)和炒作信息是我們非常重要的工作之一,每天需要從數(shù)以百萬計(jì)的點(diǎn)評(píng)中甄別出這些虛假信息,而對(duì)數(shù)據(jù)進(jìn)行分析是其中的一種方法”。M君表示,“每天至少需要看幾百份數(shù)據(jù)報(bào)表”,除此之外,她每天上班需要做的工作還包括瀏覽系統(tǒng)的反饋信息、處理客戶投訴、關(guān)注站務(wù)論壇等等,而這些僅僅是發(fā)現(xiàn)問題的方式。
當(dāng)問及是否需要人工一個(gè)個(gè)甄別時(shí),M君笑道:“當(dāng)然不可能,大眾點(diǎn)評(píng)有一套完善的誠(chéng)信系統(tǒng),主要通過技術(shù)算法來過濾虛假點(diǎn)評(píng),人工審查只是輔助,如果有異常數(shù)據(jù)出現(xiàn)的話,系統(tǒng)會(huì)自動(dòng)報(bào)警。”目前90%的虛假信息系統(tǒng)都會(huì)自動(dòng)處理,而剩下的10%則需要M君和他的小伙伴們進(jìn)行人工審查。“信息的甄別是一份細(xì)致而繁重的工作,有時(shí)候?yàn)榱苏页隹赡艽嬖诘奶摷傩畔?,我們還會(huì)給自己設(shè)定角色,從虛假信息發(fā)布方自我假設(shè)來揣摸預(yù)測(cè)。”M君還特別強(qiáng)調(diào),誠(chéng)信系統(tǒng)最大的挑戰(zhàn)在于既要保證抓得全、抓得及時(shí),盡量減少漏抓,還必須保證沒有錯(cuò)抓,所有的工作都是為了確保過濾的準(zhǔn)確性。
每周上線新算法打擊炒作點(diǎn)評(píng)
在M君看來,誠(chéng)信組的工作其實(shí)是個(gè)大循環(huán),即:發(fā)現(xiàn)問題——數(shù)據(jù)分析——提煉特征——設(shè)計(jì)算法——實(shí)現(xiàn)算法——驗(yàn)證上線優(yōu)化系統(tǒng)——多方收集反饋發(fā)現(xiàn)問題。而所有人的工作都圍繞著這些在不斷的分解和前進(jìn)。
如果說把前兩個(gè)步驟比喻成警察抓小偷的偵查過程的話,那接下來最重要的攻堅(jiān)工作便是抓住作弊分子與進(jìn)行安全升級(jí)。
在偵查完之后,M君和組員們需要從多個(gè)維度進(jìn)行分析確認(rèn)新出現(xiàn)的問題是否存在炒作點(diǎn)評(píng)的特征,如果有的話則將不同問題的特征提煉歸納出來,進(jìn)行算法設(shè)計(jì),驗(yàn)證可行后即上線,而這正是誠(chéng)信團(tuán)隊(duì)的重中之重。
“基于以前的作弊與反作弊工作,現(xiàn)在我們已經(jīng)有100種左右的算法,”M君表示,第三方炒作機(jī)構(gòu)和不法分子跟進(jìn)得很快,如果發(fā)現(xiàn)之前造假規(guī)則通不過的話會(huì)嘗試變換其他的方式,“現(xiàn)在每周都仍有新算法跟進(jìn)炒作點(diǎn)評(píng)。”
據(jù)了解,大眾點(diǎn)評(píng)已有100種左右的算法來篩選虛假點(diǎn)評(píng)。與此同時(shí),還與美國(guó)數(shù)據(jù)挖掘協(xié)會(huì)輪值主席Bing Liu及其研究團(tuán)隊(duì)進(jìn)行基礎(chǔ)反作弊算法的合作研究,并借鑒了美國(guó)信用卡盜卡識(shí)別的先進(jìn)算法,在技術(shù)上走在Yelp、淘寶等公司的前面。