<thead id="mmbex"></thead>
<samp id="mmbex"><thead id="mmbex"></thead></samp>
<li id="mmbex"><tbody id="mmbex"></tbody></li>
    ITBear旗下自媒體矩陣:

    海天瑞聲在中關(guān)村論壇宣布開源多模態(tài)數(shù)據(jù)集 助力數(shù)字中國建設(shè)

       時間:2023-05-31 11:13:12 來源:互聯(lián)網(wǎng)編輯:茹茹 發(fā)表評論無障礙通道

    作為中國科技創(chuàng)新領(lǐng)域的重要盛會,以及科技企業(yè)實力和形象展示的重要舞臺,2023年度的中關(guān)村論壇于5月25日晚在北京開幕。中共中央政治局常委、國務(wù)院副總理丁薛祥出席開幕式并致辭。中共中央政治局委員、北京市委書記尹力在開幕式上宣讀習(xí)總書記的賀信。

    開幕式上,北京國際科技創(chuàng)新中心建設(shè)十項重大科技成果進行了發(fā)布和展示。據(jù)悉,本屆論壇設(shè)置了論壇會議、技術(shù)交易、展覽展示、成果發(fā)布、前沿大賽和配套活動六大板塊,共舉辦150余場活動,集中展示了人工智能、區(qū)塊鏈、量子信息、高端制造等領(lǐng)域的全球最新進展和前沿科技成果。

    今年中關(guān)村論壇將開設(shè)55場平行論壇,主要圍繞人工智能、生命科學(xué)等前沿領(lǐng)域,以及數(shù)據(jù)治理、女性科技創(chuàng)新等熱點議題。其中,人工智能開放生態(tài)建設(shè)論壇于5月26日上午舉辦。AI訓(xùn)練數(shù)據(jù)龍頭服務(wù)商海天瑞聲CEO王曉東受邀出席該論壇,并發(fā)表了題為《共享開放數(shù)據(jù)助力數(shù)字中國建設(shè)》的演講,宣布海天瑞聲將開放多模態(tài)數(shù)據(jù)集。此外,海天瑞聲將在A館1018中關(guān)村科技城展臺展示公司產(chǎn)品和解決方案。

    1685333448350267.png

    開源數(shù)據(jù)集

    助力AI開放生態(tài)構(gòu)建


    本屆中關(guān)村論壇的主題是“開放合作·共享未來”。開放生態(tài)是全球人工智能發(fā)展的大勢所趨,尤其是AI算法的優(yōu)化和模型的訓(xùn)練需要足夠優(yōu)質(zhì)和豐富的數(shù)據(jù)集支持,因此共享數(shù)據(jù)集就成為AI開放生態(tài)系統(tǒng)中非常關(guān)鍵的一環(huán),對行業(yè)的推動作用也變得至關(guān)重要。在此背景下,海天瑞聲在本次大會上宣布開放共享數(shù)據(jù)集就更顯得意義重大。

    海天瑞聲CEO王曉東表示,作為AI數(shù)據(jù)行業(yè)里首家上市公司,海天瑞聲天然肩負(fù)著開源開放、推進數(shù)據(jù)資源整合共享的社會責(zé)任。開源數(shù)據(jù)集可以幫助各領(lǐng)域的研究者和開發(fā)者快速獲得更多高質(zhì)數(shù)據(jù)樣本,進而提高模型的精準(zhǔn)度和魯棒性,幫助他們更好地進行算法研究和模型訓(xùn)練。此次即將開源的多模態(tài)數(shù)據(jù)集「DOTS-MM-0526」涵蓋圖像、語音、文本等多個維度。海天瑞聲希冀與全球AI開發(fā)者和研究人員建立更加緊密的合作關(guān)系,共同推動人工智能技術(shù)的發(fā)展和應(yīng)用。同時,開源數(shù)據(jù)集計劃亦是公司對于AI開放生態(tài)的一次有益嘗試,是公司在數(shù)據(jù)智能化應(yīng)用領(lǐng)域持續(xù)發(fā)力的體現(xiàn)。

    1685333455904195.png

    去年年底以來,ChatGPT、GPT-4等大模型接二連三地發(fā)布,讓我們加速走進了大模型時代,并真切地感受到了其與日俱增的能力。眾所周知,大模型也需要進行訓(xùn)練,那么在此過程中與數(shù)據(jù)相關(guān)的工作,與此前有什么不同呢?

    對此,海天瑞聲CTO黃宇凱認(rèn)為,從大方向上來看并沒有什么不同,還是需要先提出數(shù)據(jù)方案,然后進行設(shè)計,再執(zhí)行采集、標(biāo)注等一系列的工作流程,最終目標(biāo)也是讓客戶能夠基于所提供的數(shù)據(jù),訓(xùn)練出效果良好的模型。

    其中,不一樣的地方在于,不同企業(yè)關(guān)注的側(cè)重點不同。比如,大模型主要分為預(yù)訓(xùn)練和強化學(xué)習(xí)兩個階段,這兩個階段對數(shù)據(jù)都有很高的要求。就前者而言,雖然大模型對應(yīng)的是大數(shù)據(jù),但卻并不是數(shù)據(jù)越多越好,還要執(zhí)行數(shù)據(jù)清洗的步驟。數(shù)據(jù)公司必須掌握如何清洗、向哪個方向清洗,才能更好地應(yīng)用于大模型的基礎(chǔ)能力。對于后者來說,進行強化學(xué)習(xí)需要撰寫對應(yīng)的提示詞,這對數(shù)據(jù)標(biāo)注人員的邏輯思維能力和表達(dá)能力也有較高的要求。

    對于一家數(shù)據(jù)公司來說,數(shù)據(jù)安全與合規(guī)是其底線,也是立身之本。因此,海天瑞聲組建了專門的團隊,對歐盟頒布的《通用數(shù)據(jù)保護條例》、我國頒布的《數(shù)據(jù)安全法》和《個人信息法》等法規(guī)法規(guī)進行了深刻的研究,并制定了高于國家法律的數(shù)據(jù)合規(guī)要求。具體來說,其在整個公司層面上,要求所有成員在嚴(yán)格遵循當(dāng)?shù)胤煞ㄒ?guī)的基礎(chǔ)之上,開展包括數(shù)據(jù)采集、標(biāo)注等在內(nèi)的具體工作。

    語音圖像再到文本、實現(xiàn)AI數(shù)據(jù)全覆蓋

    品牌煥新展現(xiàn)海天瑞聲戰(zhàn)略新布局


    會上,王曉東還隆重發(fā)布了海天瑞聲企業(yè)品牌煥新戰(zhàn)略:公司將啟用全新Logo,英文名稱將從“SpeechOcean”改成“DataOcean AI”,中文名“海天瑞聲”不變。

    1685333460332868.png

    王曉東表示:“此次品牌升級不僅是一個簡單的改名,它還代表著海天瑞聲將在數(shù)據(jù)科技和人工智能領(lǐng)域的進一步發(fā)展和探索?!彼M一步闡述道,海天瑞聲因優(yōu)質(zhì)海量的智能語音數(shù)據(jù)被大家所熟知,但近些年來隨著人工智能技術(shù)的不斷迭代與發(fā)展,海天瑞聲的業(yè)務(wù)已從單純的語音領(lǐng)域服務(wù),擴展至提供覆蓋語音、計算機視覺、自然語言處理和多模態(tài)的數(shù)據(jù)解決方案及成品數(shù)據(jù)集,未來還將支持以數(shù)據(jù)驅(qū)動的生成式AI業(yè)務(wù)發(fā)展。顯然海天瑞聲早已不再局限于“語音Speech”而是更廣闊的“數(shù)據(jù)Data”海洋。為更好地反映公司的業(yè)務(wù)范圍和技術(shù)實力,海天瑞聲對企業(yè)品牌進行了升級,以更好地滿足客戶全方位需求。

    1685333472364968.jpg

    圖丨海天瑞聲新Logo(來源:資料圖)

    而品牌升級背后,海天瑞聲全新的戰(zhàn)略布局也逐漸清晰呈現(xiàn)。據(jù)了解,自2005年成立以來,海天瑞聲就一直在為AI產(chǎn)業(yè)鏈上的各類機構(gòu)提供AI算法模型開發(fā)訓(xùn)練所需的專業(yè)數(shù)據(jù)集。目前這些數(shù)據(jù)集已覆蓋智能語音、計算機視覺、自然語言等AI核心領(lǐng)域。經(jīng)過多年深耕,海天瑞聲的產(chǎn)品和服務(wù)已獲得阿里巴巴、騰訊、三星等國內(nèi)外頭部客戶的認(rèn)可,并在自動駕駛、虛擬主播、聲紋識別、人臉姿態(tài)等眾多人工智能場景及相關(guān)算法模型的訓(xùn)練過程中獲得應(yīng)用。

    隨著數(shù)據(jù)要素作為國家級戰(zhàn)略資源地位不斷凸顯,數(shù)據(jù)相關(guān)企業(yè)也肩負(fù)起未來數(shù)字化基建的重大責(zé)任。因此,無論是業(yè)務(wù)領(lǐng)域的自然擴展還是主動更名的品牌升級,都無疑在證明著一點,即海天瑞聲在保障基礎(chǔ)數(shù)據(jù)業(yè)務(wù)穩(wěn)健發(fā)展的同時已找到新的業(yè)績增長點并不斷發(fā)力。從近期其在自動駕駛業(yè)務(wù)的接連動作可以看到海天瑞聲正在發(fā)力聚焦自動駕駛賽道,通過平臺、算法研發(fā)以及數(shù)據(jù)安全能力的持續(xù)建設(shè),不斷將之打造成為公司核心競爭力之一,使之成為公司第二增長曲線。

    1685333477392790.png

    深入布局自動駕駛領(lǐng)域

    開發(fā)全棧式自動駕駛數(shù)據(jù)平臺


    基于海量數(shù)據(jù)構(gòu)建一套強大的數(shù)據(jù)鏈驅(qū)動系統(tǒng),是自動駕駛技術(shù)發(fā)展過程中的必要環(huán)節(jié)。而要想推動該系統(tǒng)高效運轉(zhuǎn)就少不了數(shù)據(jù)采集、管理、標(biāo)注、質(zhì)檢和仿真等環(huán)節(jié)的支持和相互配合。

    自動駕駛領(lǐng)域是海天瑞聲著重進行業(yè)務(wù)布局和彰顯技術(shù)實力的核心領(lǐng)域之一。就在上個月18日,海天瑞聲正式推出“DOTS-AD自動駕駛平臺”。 據(jù)海天瑞聲CTO黃宇凱介紹,這是一款專為自動駕駛場景設(shè)計的全棧式數(shù)據(jù)平臺,能夠支持多維度、全方位的自動駕駛標(biāo)注任務(wù),數(shù)據(jù)標(biāo)注效率提升高達(dá)8倍。支持萬人同時作業(yè),能夠解決項目經(jīng)理和標(biāo)注員的使用痛點,提升標(biāo)注效能,且支持多元化部署。

    特別要提到的是該平臺的四大核心功能:一是全面支持自動駕駛領(lǐng)域各維度2D/3D/4D點云或圖像數(shù)據(jù)標(biāo)注;二是能針對不同場景支持輔助標(biāo)注/自動化標(biāo)注;三是支持項目的柔性管理,支持流程/工具/標(biāo)簽的自定義;四是可實現(xiàn)對數(shù)據(jù)的智能化管理,確??蛻舻纳虡I(yè)敏感數(shù)據(jù)安全合規(guī)?;谶@些核心功能,海天瑞聲正建立起在智能駕駛數(shù)據(jù)訓(xùn)練領(lǐng)域的核心壁壘,也將賦能自動駕駛技術(shù)走邁向新高度。

    1685333483537616.png

    數(shù)據(jù)作為人工智能發(fā)展的重要一環(huán),大模型的出現(xiàn)為數(shù)據(jù)需求帶來了新的挑戰(zhàn)和機遇。海天瑞聲王曉東在此次中關(guān)村論壇上還表示,公司將堅持以“做智能世界的數(shù)據(jù)基石”為使命,積極與各方共同推動人工智能技術(shù)的發(fā)展和應(yīng)用,促進企業(yè)數(shù)字化、智能化進程的加速推進,為建設(shè)數(shù)字經(jīng)濟和智能社會做出貢獻。

    自2007年中關(guān)村論壇初次舉辦以來,其一直是中國面向全球科技創(chuàng)新交流合作的國家級平臺,并始終堅持“科技辦會”的重要理念。5月25日,習(xí)總書記向今年的中關(guān)村論壇致賀信。其指出,當(dāng)前,新一輪科技革命和產(chǎn)業(yè)變革深入發(fā)展,人類要破解共同發(fā)展難題,比以往任何時候都更需要國際合作和開放共享。中國堅定奉行互利共贏的開放戰(zhàn)略,愿同世界各國一道,攜手促進科技創(chuàng)新,推動科學(xué)技術(shù)更好造福各國人民。

    據(jù)悉,本屆論壇將持續(xù)到5月30日,期間將有80多個國家和地區(qū)的嘉賓出席,近200家外國政府部門、國際組織和機構(gòu)參與,近120位頂尖專家將發(fā)表演講。借由這樣一個平臺,海天瑞聲及更多優(yōu)秀的AI產(chǎn)業(yè)企業(yè)將共同探討如何更好地依托我國現(xiàn)有開放創(chuàng)新平臺建設(shè)人工智能開放生態(tài),如何更科學(xué)地投入更多研發(fā)資源,以提升產(chǎn)品質(zhì)量和服務(wù)水平,共同促進產(chǎn)業(yè)發(fā)展向前。

    舉報 0 收藏 0 打賞 0評論 0
     
     
    更多>同類資訊
    全站最新
    熱門內(nèi)容
    網(wǎng)站首頁  |  關(guān)于我們  |  聯(lián)系方式  |  版權(quán)聲明  |  網(wǎng)站留言  |  RSS訂閱  |  違規(guī)舉報  |  開放轉(zhuǎn)載  |  滾動資訊  |  English Version