滾動(dòng)資訊

當(dāng)前位置：首頁(yè) > 資訊 > 人工智能 > 正文內(nèi)容

時(shí)間：2024-12-07 08:04:07 來(lái)源：ITBEAR編輯：快訊團(tuán)隊(duì) 發(fā)表評(píng)論無(wú)障礙通道

在近期科技界的矚目之下，OpenAI啟動(dòng)了一場(chǎng)為期兩周的盛大新品發(fā)布活動(dòng)，命名為“shipmas”，旨在帶來(lái)一系列革新性的功能、產(chǎn)品及演示。活動(dòng)進(jìn)入第二天，OpenAI隆重推出了強(qiáng)化微調(diào)（Reinforcement Fine-Tuning，簡(jiǎn)稱RFT）技術(shù)，這一突破性進(jìn)展為開(kāi)發(fā)者和機(jī)器學(xué)習(xí)工程師在構(gòu)建針對(duì)復(fù)雜特定領(lǐng)域任務(wù)的專家模型上開(kāi)辟了新的道路。

強(qiáng)化微調(diào)技術(shù)通過(guò)一種創(chuàng)新的模型定制方法，使得開(kāi)發(fā)者能夠利用精選的高質(zhì)量任務(wù)集對(duì)模型進(jìn)行精細(xì)調(diào)整。該技術(shù)引入了參考答案來(lái)評(píng)估模型的響應(yīng)，進(jìn)而顯著提升模型在特定領(lǐng)域任務(wù)中的推理能力和準(zhǔn)確性。這一方法不僅深化了模型處理類似問(wèn)題的能力，還極大提高了其在該領(lǐng)域特定任務(wù)上的表現(xiàn)精度。

OpenAI官方對(duì)強(qiáng)化微調(diào)技術(shù)進(jìn)行了詳細(xì)介紹：開(kāi)發(fā)者可以運(yùn)用數(shù)十至數(shù)千個(gè)高質(zhì)量任務(wù)，對(duì)OpenAI的模型進(jìn)行個(gè)性化定制，并通過(guò)參考答案對(duì)模型的回答進(jìn)行評(píng)分。官方指出，RFT技術(shù)通過(guò)強(qiáng)化模型推理過(guò)程，顯著提高了其在特定領(lǐng)域任務(wù)上的準(zhǔn)確性。

與傳統(tǒng)的微調(diào)方法相比，強(qiáng)化微調(diào)利用強(qiáng)化學(xué)習(xí)算法，將模型的表現(xiàn)從一般高水平提升至專家級(jí)水平。RFT不僅超越了標(biāo)準(zhǔn)的監(jiān)督式微調(diào)，更讓模型學(xué)會(huì)以一種全新的方式進(jìn)行推理。通過(guò)對(duì)模型答案進(jìn)行評(píng)分并強(qiáng)化正確的推理路徑，RFT技術(shù)僅需少量示例便能顯著提升模型性能。

RFT技術(shù)還允許用戶利用自己的黃金數(shù)據(jù)集創(chuàng)建獨(dú)特的模型，并將其應(yīng)用于法律、金融、工程、保險(xiǎn)等需要深厚專業(yè)知識(shí)的領(lǐng)域。這一技術(shù)的推出，無(wú)疑為這些領(lǐng)域帶來(lái)了人工智能輔助的新機(jī)遇。

OpenAI此次活動(dòng)特別面向研究機(jī)構(gòu)、高校和企業(yè)開(kāi)放申請(qǐng)，尤其是那些目前由專家執(zhí)行一系列復(fù)雜狹窄任務(wù)，且有望從人工智能輔助中受益的機(jī)構(gòu)。OpenAI表示，強(qiáng)化微調(diào)技術(shù)在結(jié)果具有客觀“正確”答案，且大多數(shù)專家會(huì)達(dá)成一致的任務(wù)中表現(xiàn)出色，因此在法律、保險(xiǎn)、醫(yī)療、金融、工程等領(lǐng)域具有廣泛的應(yīng)用前景。

參與者將有機(jī)會(huì)提前訪問(wèn)Alpha版的強(qiáng)化微調(diào)API，并在特定領(lǐng)域任務(wù)中進(jìn)行測(cè)試。OpenAI還鼓勵(lì)參與者分享數(shù)據(jù)集，共同推動(dòng)OpenAI模型的改進(jìn)。這一舉措不僅促進(jìn)了技術(shù)的開(kāi)放共享，還加速了人工智能技術(shù)的迭代升級(jí)。

OpenAI預(yù)計(jì)將于2025年初公開(kāi)發(fā)布強(qiáng)化微調(diào)功能。OpenAI首席執(zhí)行官山姆·阿爾特曼對(duì)強(qiáng)化微調(diào)技術(shù)給予了高度評(píng)價(jià)：“強(qiáng)化微調(diào)的效果令人驚嘆，它是我2024年最大的驚喜之一?！边@一技術(shù)的推出，無(wú)疑將為人工智能技術(shù)的發(fā)展和應(yīng)用開(kāi)啟新的篇章。

舉報(bào) 0 收藏 0 打賞 0評(píng)論 0

更多>同類資訊

蘋(píng)果AI尋中國(guó)“盟友”，騰訊字節(jié)誰(shuí)能“入果”？iPhone創(chuàng)新何在？

12-19

天陽(yáng)科技與SS&C攜手，億元打造Algorithmics軟件獨(dú)家信創(chuàng)版

12-19

值得買(mǎi)科技榮獲卓越發(fā)展大獎(jiǎng)，創(chuàng)新驅(qū)動(dòng)消費(fèi)產(chǎn)業(yè)高質(zhì)量發(fā)展

12-19

訊飛智作斬獲獵云網(wǎng)2024“年度生成式AI創(chuàng)新”大獎(jiǎng)，AIGC未來(lái)可期

12-19

榮耀MagicOS 9.0升級(jí)全解析：新功能適配進(jìn)度與長(zhǎng)焦拍照優(yōu)化進(jìn)行時(shí)

12-19

閃極AI“拍拍鏡”來(lái)襲：智能眼鏡新體驗(yàn)，售價(jià)999元起接入大模型

12-19

閃極AI拍拍鏡震撼上市！國(guó)內(nèi)首款量產(chǎn)，售價(jià)僅999元起

12-19

蘋(píng)果中國(guó)AI大模型合作引關(guān)注，字節(jié)騰訊誰(shuí)將脫穎而出？

值得一題的是，12月19日，北京智源人工智能研究院（智院研究員）發(fā)布國(guó)內(nèi)外100余個(gè)開(kāi)源和商業(yè)閉源模型多份評(píng)測(cè)結(jié)果，作為今年英偉達(dá)全球第二大買(mǎi)家、擁有23萬(wàn)張GPU的字節(jié)跳動(dòng)豆包大模型名列前茅，語(yǔ)言模型結(jié)果…

12-19

張一鳴私募新動(dòng)作，重心已悄然轉(zhuǎn)向大模型與AI戰(zhàn)略？

12-19

算力硬件引領(lǐng)市場(chǎng)熱潮，豆包概念股能否持續(xù)走強(qiáng)？

12-19

市場(chǎng)分化算力硬件爆發(fā)，抖音微信小店概念股活躍，后市如何演繹？

12-19

北證50深V反轉(zhuǎn)，AI硬件與微信小店成市場(chǎng)新寵？

12-19

OpenAI Canvas大升級(jí)：React渲染與文本格式化新工具來(lái)襲

12-19

OpenAI新招！ChatGPT熱線電話服務(wù)上線，老年機(jī)座機(jī)也能聊

12-19

AMD蘇姿豐領(lǐng)投，Liquid AI崛起：機(jī)器人之母帶隊(duì)，AI賽道再掀狂瀾

12-19

點(diǎn)擊查看更多 +

全站最新

“王妃”炫富帶貨后集體消失，網(wǎng)友直呼：別再消耗我們的善良！

蘋(píng)果AI尋中國(guó)“盟友”，騰訊字節(jié)誰(shuí)能“入果”？iPhone創(chuàng)新何在？

打假人王海遭品牌起訴，道歉后又要反訴，這場(chǎng)“打假”戰(zhàn)何時(shí)休？

余承東透露：鴻蒙智行受車(chē)廠熱捧，資源有限難以滿足所有合作需求

余承東回憶：與北汽合作始于2017年一張PPT開(kāi)啟華為汽車(chē)夢(mèng)

榮耀Magic7 RSR保時(shí)捷設(shè)計(jì)：100倍AI長(zhǎng)焦，樣張細(xì)節(jié)震撼曝光！

熱門(mén)內(nèi)容

本欄最新

蘋(píng)果AI尋中國(guó)“盟友”，騰訊字節(jié)誰(shuí)能“入果”？iPhone創(chuàng)新何在？

天陽(yáng)科技與SS&C攜手，億元打造Algorithmics軟件獨(dú)家信創(chuàng)版

值得買(mǎi)科技榮獲卓越發(fā)展大獎(jiǎng)，創(chuàng)新驅(qū)動(dòng)消費(fèi)產(chǎn)業(yè)高質(zhì)量發(fā)展

訊飛智作斬獲獵云網(wǎng)2024“年度生成式AI創(chuàng)新”大獎(jiǎng)，AIGC未來(lái)可期

榮耀MagicOS 9.0升級(jí)全解析：新功能適配進(jìn)度與長(zhǎng)焦拍照優(yōu)化進(jìn)行時(shí)

閃極AI“拍拍鏡”來(lái)襲：智能眼鏡新體驗(yàn)，售價(jià)999元起接入大模型

本網(wǎng)站LOGO小熊標(biāo)志受版權(quán)保護(hù)，版權(quán)登記號(hào)：魯作登字-2015-F-025467，未經(jīng)ITBEAR官方許可，嚴(yán)禁使用。
聲明：本網(wǎng)站是公益性科普網(wǎng)站，為網(wǎng)友提供科技類資訊內(nèi)容，無(wú)障礙技術(shù)由太陽(yáng)灣捐增，為閱讀障礙用戶提供內(nèi)容聽(tīng)讀服務(wù)。如本站內(nèi)容侵犯了您的權(quán)利，請(qǐng)通知我們及時(shí)刪除。
中國(guó)（山東）自由貿(mào)易試驗(yàn)區(qū) · 齊魯軟件園魯ICP備11015305號(hào)-1 商業(yè)合作入口
Copyright ? 小熊科技資訊 2007-2024 ITBEAR.COM.CN All rights reserved.

OpenAI新推“強(qiáng)化微調(diào)”，能否讓AI成為各領(lǐng)域?qū)＜遥?/h1> 時(shí)間：2024-12-07 08:04:07 來(lái)源：ITBEAR編輯：快訊團(tuán)隊(duì) 發(fā)表評(píng)論無(wú)障礙通道

OpenAI新推“強(qiáng)化微調(diào)”，能否讓AI成為各領(lǐng)域?qū)＜遥?/h1>
時(shí)間：2024-12-07 08:04:07 來(lái)源：ITBEAR編輯：快訊團(tuán)隊(duì) 發(fā)表評(píng)論無(wú)障礙通道