滾動(dòng)資訊

當(dāng)前位置：首頁 > 資訊 > 人工智能 > 正文內(nèi)容

為吸引人工智能專家雅虎公布13.5TB用戶數(shù)據(jù)

時(shí)間：2016-01-15 11:48:17 來源：騰訊科技編輯：星輝 發(fā)表評(píng)論無障礙通道

1月15日，外媒報(bào)道稱，為了‍‍‍‍‍吸引人工智能領(lǐng)域的頂級(jí)人才，雅虎公布大量用戶的互網(wǎng)絡(luò)行為數(shù)據(jù)。

周四，雅虎宣布，公司將公布最大規(guī)模的互聯(lián)網(wǎng)行為數(shù)據(jù)，數(shù)據(jù)涉及瀏覽雅虎體育、雅虎財(cái)經(jīng)、雅虎新聞、雅虎地產(chǎn)和其他版塊的2000萬匿名用戶。雅虎僅面向大學(xué)機(jī)構(gòu)公布數(shù)據(jù)，這些數(shù)據(jù)將讓研究人員切實(shí)了解大量用戶的互聯(lián)網(wǎng)行為方式。

由于多年停滯不前，雅虎正面臨嚴(yán)重的人才流失難題。人工智能領(lǐng)域快速增長，而且競(jìng)爭(zhēng)異常激烈，雅虎希望吸引該領(lǐng)域的學(xué)術(shù)研究人員。

雅虎此舉正值科技公司爭(zhēng)相與學(xué)術(shù)界加‍‍強(qiáng)合作之時(shí)，而科技公司尤為關(guān)注人工智能領(lǐng)域。人工智能涉及機(jī)器學(xué)習(xí)和深度學(xué)習(xí)技術(shù)，這類技術(shù)可訓(xùn)練機(jī)器挖掘海量數(shù)據(jù)，旨在回答復(fù)雜問題或預(yù)測(cè)用戶行為。

Facebook和谷歌(微博)已經(jīng)招募頂級(jí)人工智能研究人員。例如，2013年燕樂存(Yann LeCun)加盟Facebook，他繼續(xù)運(yùn)營紐約大學(xué)數(shù)據(jù)科學(xué)中心。

卡內(nèi)基梅隆大學(xué)計(jì)算機(jī)學(xué)院院長安德魯·穆爾(Andrew Moore)表示：“無論你擁有多少人才，管理者總是希望招募更多的人才。這些大型科技公司總覺得缺少某類研發(fā)人才。”

海量數(shù)據(jù)是機(jī)器學(xué)習(xí)的必備要素。利用這些數(shù)據(jù)，電腦可分析復(fù)雜的模式，根據(jù)雅虎的情況給出科學(xué)的建議，例如哪種標(biāo)題或設(shè)計(jì)更加吸引紐約地區(qū)的年輕女孩。大型互聯(lián)網(wǎng)公司一般嚴(yán)格控制這類數(shù)據(jù)，外部人士極難獲得。雅虎此次公布的數(shù)據(jù)體積為‍‍‍‍‍13.5 TB，相當(dāng)于美國國會(huì)圖書館數(shù)據(jù)體積的2/3。

穆爾表示，絕大多數(shù)學(xué)術(shù)計(jì)算機(jī)科學(xué)家未曾接觸如此龐大的用戶數(shù)據(jù)，學(xué)者可能要把數(shù)據(jù)存儲(chǔ)到大學(xué)外部的服務(wù)器，他們可能選擇亞馬遜或谷歌的云計(jì)算中心。

去年，雅虎和卡內(nèi)基梅隆大學(xué)簽署一份為期5年的合作合同，雅虎將為卡內(nèi)基梅隆大學(xué)提供1000萬美元研究資金，目的是基于用戶數(shù)據(jù)開發(fā)個(gè)性化應(yīng)用。

加州大學(xué)圣地亞哥分校電子與計(jì)算機(jī)系教授格特·蘭克利(Gert Lanckriet)表示：“公司外部人士難以獲得數(shù)據(jù)。”

專家認(rèn)為，雅虎數(shù)據(jù)的規(guī)模使其極具價(jià)值。相較針對(duì)少量數(shù)據(jù)設(shè)計(jì)的算法，針對(duì)海量數(shù)據(jù)設(shè)計(jì)的算法具有本質(zhì)區(qū)別。雅虎的數(shù)據(jù)可以讓研究人員開發(fā)大型算法，這種算法尤其適合企業(yè)。

自2006年以來，雅虎已經(jīng)發(fā)布了50多個(gè)數(shù)據(jù)集，包括2014年的1億張F(tuán)lickr照片緩存。此前，雅虎公布的最大數(shù)據(jù)集為413 GB。谷歌和亞馬遜公布的數(shù)據(jù)集相對(duì)較小。

數(shù)據(jù)科學(xué)初創(chuàng)公司Fast Forward Labs創(chuàng)始人希拉里·梅森(Hilary Mason)表示，一方面，科技公司要吸引人才和催生新理念。另一方面，它們要保護(hù)用戶隱私和保持競(jìng)爭(zhēng)優(yōu)勢(shì)。這種矛盾正逐漸加大。

梅森稱，眾多大型科技公司正嘗試打造同樣的功能，例如無人駕駛汽車、圖像識(shí)別和個(gè)性化服務(wù)。公布用戶數(shù)據(jù)之后，雅虎承擔(dān)些許暴露商業(yè)秘密的危險(xiǎn)，但雅虎認(rèn)為吸引人才能帶來更大回報(bào)。

盡管數(shù)家公司曾面向研究人員公布用戶數(shù)據(jù)，但結(jié)果令人失望。2006年，AOL向研究人員公布用戶數(shù)據(jù)，但意外泄露用戶的搜索記錄。2009年，Netflix公布大量用戶的電影推薦和日志，并提供100萬美元獎(jiǎng)金，以獎(jiǎng)勵(lì)改進(jìn)電影推薦算法的開發(fā)者。在兩個(gè)例子中，外部人員都利用數(shù)據(jù)推測(cè)用戶的身份，這種侵犯隱私的行為招致集體訴訟。Netflix被迫取消該獎(jiǎng)項(xiàng)。

2014年，F(xiàn)acebook和康乃爾大學(xué)共同研究和操縱用戶的情緒。研究過程中，F(xiàn)acebook調(diào)整用戶信息流的內(nèi)容，旨在研究用戶的情緒反應(yīng)，此舉引發(fā)了巨大爭(zhēng)議。隨后，F(xiàn)acebook不得不限制用戶數(shù)據(jù)的使用范圍。

梅森表示：“自從2006年AOL遭遇隱私災(zāi)難，科技公司一直害怕公布數(shù)據(jù)。”

雅虎數(shù)據(jù)的敏感度似乎較低，其中僅包括城市、性別、年齡等基本人口統(tǒng)計(jì)信息，以及用戶與雅虎網(wǎng)站相關(guān)的交互信息。

雅虎實(shí)驗(yàn)室首席研究科學(xué)家貝澤·耶茨(Ricardo Baeza-Yates) 表示，這次公布的數(shù)據(jù)集能夠有效地防止個(gè)人追蹤用戶。例如，雅虎移除了來自人口稀少地區(qū)的用戶信息。

舉報(bào) 0 收藏 0 打賞 0評(píng)論 0

更多>同類資訊

蘋果中國AI大模型合作引關(guān)注，字節(jié)騰訊誰將脫穎而出？

值得一題的是，12月19日，北京智源人工智能研究院（智院研究員）發(fā)布國內(nèi)外100余個(gè)開源和商業(yè)閉源模型多份評(píng)測(cè)結(jié)果，作為今年英偉達(dá)全球第二大買家、擁有23萬張GPU的字節(jié)跳動(dòng)豆包大模型名列前茅，語言模型結(jié)果…

12-19

張一鳴私募新動(dòng)作，重心已悄然轉(zhuǎn)向大模型與AI戰(zhàn)略？

12-19

算力硬件引領(lǐng)市場(chǎng)熱潮，豆包概念股能否持續(xù)走強(qiáng)？

12-19

市場(chǎng)分化算力硬件爆發(fā)，抖音微信小店概念股活躍，后市如何演繹？

12-19

北證50深V反轉(zhuǎn)，AI硬件與微信小店成市場(chǎng)新寵？

12-19

OpenAI Canvas大升級(jí)：React渲染與文本格式化新工具來襲

12-19

OpenAI新招！ChatGPT熱線電話服務(wù)上線，老年機(jī)座機(jī)也能聊

12-19

AMD蘇姿豐領(lǐng)投，Liquid AI崛起：機(jī)器人之母帶隊(duì)，AI賽道再掀狂瀾

12-19

AI創(chuàng)業(yè)熱潮下，清北復(fù)交畢業(yè)生都偏愛在哪座城市扎根？

12-19

小紅書搜索量激增，百度MEG能否避免重蹈極越覆轍？

12-19

蘋果在華大模型合作再添一員，智譜加入談判行列

12-19

蘋果尋國內(nèi)AI盟友，騰訊字節(jié)誰將入駐iPhone中國市場(chǎng)？

12-19

蘋果AI中國落地新動(dòng)向：騰訊字節(jié)在談，百度還能否入局？

智東西12月19日消息，據(jù)路透社報(bào)道，蘋果正在和騰訊、字節(jié)跳動(dòng)洽談，商討將其AI大模型整合到蘋果在中國銷售的iPhone手機(jī)中。路透社報(bào)道認(rèn)為，成為蘋果在中國的AI大模型合作伙伴，對(duì)于所合作的廠商來說十分…

12-19

據(jù)ZFinance，AI獨(dú)角獸企業(yè)MiniMax旗下的明星產(chǎn)品Talkie疑似在美國服務(wù)器下架。目前，在美區(qū)蘋果商店已無法搜索到Talkie應(yīng)用，而安卓版本則暫未受到影響。公開信息顯示，Talkie已火…

12-19

阿里“通義”團(tuán)隊(duì)大調(diào)整，分拆并入智能信息事業(yè)群謀新局？

據(jù)悉，通義團(tuán)隊(duì)中負(fù)責(zé)To C方向的產(chǎn)品經(jīng)理和工程團(tuán)隊(duì)，將調(diào)整至阿里智能信息事業(yè)群，與智能搜索產(chǎn)品“夸克”處于平級(jí)。這一調(diào)整反映了阿里云在基礎(chǔ)技術(shù)研發(fā)和應(yīng)用開發(fā)領(lǐng)域的分工，類似于其他大廠的做法，例如字節(jié)跳動(dòng)…

12-19

點(diǎn)擊查看更多 +

全站最新

黑洞風(fēng)狂飆！時(shí)速3600萬英里，能否重塑宇宙星系新貌？

月亮對(duì)地球有多重要？《我們真的需要月亮嗎》紀(jì)錄片深度解讀

水滴公司Q3財(cái)報(bào)亮點(diǎn)：營收穩(wěn)步增長，運(yùn)營利潤達(dá)2650萬

技嘉冰雕X870I主板全白亮相，AORUS PRO ICE圖賞來襲！

iQOO Neo10 Pro：游戲玩家新寵，旗艦性能暢爽體驗(yàn)

國產(chǎn)DDR5新突破！光威金百達(dá)32GB套裝僅需499元首發(fā)

熱門內(nèi)容

本欄最新

算力硬件引領(lǐng)市場(chǎng)熱潮，豆包概念股能否持續(xù)走強(qiáng)？

市場(chǎng)分化算力硬件爆發(fā)，抖音微信小店概念股活躍，后市如何演繹？

OpenAI Canvas大升級(jí)：React渲染與文本格式化新工具來襲

OpenAI新招！ChatGPT熱線電話服務(wù)上線，老年機(jī)座機(jī)也能聊

AI創(chuàng)業(yè)熱潮下，清北復(fù)交畢業(yè)生都偏愛在哪座城市扎根？

蘋果尋國內(nèi)AI盟友，騰訊字節(jié)誰將入駐iPhone中國市場(chǎng)？

本網(wǎng)站LOGO小熊標(biāo)志受版權(quán)保護(hù)，版權(quán)登記號(hào)：魯作登字-2015-F-025467，未經(jīng)ITBEAR官方許可，嚴(yán)禁使用。
聲明：本網(wǎng)站是公益性科普網(wǎng)站，為網(wǎng)友提供科技類資訊內(nèi)容，無障礙技術(shù)由太陽灣捐增，為閱讀障礙用戶提供內(nèi)容聽讀服務(wù)。如本站內(nèi)容侵犯了您的權(quán)利，請(qǐng)通知我們及時(shí)刪除。
中國（山東）自由貿(mào)易試驗(yàn)區(qū) · 齊魯軟件園魯ICP備11015305號(hào)-1 商業(yè)合作入口
Copyright ? 小熊科技資訊 2007-2024 ITBEAR.COM.CN All rights reserved.

為吸引人工智能專家 雅虎公布13.5TB用戶數(shù)據(jù)

為吸引人工智能專家雅虎公布13.5TB用戶數(shù)據(jù)