滾動資訊

當(dāng)前位置：首頁 > 資訊 > 人工智能 > 正文內(nèi)容

阿里云QwQ模型開源：科學(xué)推理能力亮眼，數(shù)學(xué)編程表現(xiàn)超OpenAI o1

時間：2024-11-28 17:05:42 來源：ITBEAR編輯：快訊團隊 發(fā)表評論無障礙通道

阿里云通義團隊近日宣布了一項重要突破，他們成功推出了名為QwQ-32B-Preview的全新AI推理模型，并同步向公眾開源。這一舉措標(biāo)志著阿里云在AI技術(shù)領(lǐng)域的又一次飛躍。

據(jù)官方介紹，QwQ（全稱Qwen with Questions）是通義千問Qwen大模型系列中的最新實驗性研究模型。在評測中，QwQ展現(xiàn)出了令人矚目的科學(xué)推理能力，尤其是在數(shù)學(xué)和編程領(lǐng)域，其表現(xiàn)甚至達到了研究生水平。與OpenAI的o1模型相比，QwQ的整體推理能力毫不遜色。

阿里云通義千問團隊深入研究發(fā)現(xiàn)，當(dāng)給予模型充分的時間進行思考和自我反思時，其在數(shù)學(xué)和編程方面的理解會顯著加深。正是基于這一發(fā)現(xiàn)，QwQ在解決復(fù)雜問題上取得了突破性的進展。在衡量科學(xué)問題解決能力的GPQA評測集中，QwQ以65.2%的準(zhǔn)確率展現(xiàn)了其強大的科學(xué)推理能力。而在AIME評測中，QwQ更是以50%的勝率證明了其解決數(shù)學(xué)難題的實力。

不僅如此，QwQ在編程領(lǐng)域也展現(xiàn)出了非凡的才能。在MATH-500評測中，QwQ以90.6%的高分超越了o1-preview和o1-mini。在評估高難度代碼生成的LiveCodeBench評測中，QwQ更是答對了一半的題目，并在編程競賽題場景中展現(xiàn)出了出色的表現(xiàn)。這些成績無疑證明了QwQ在AI推理領(lǐng)域的領(lǐng)先地位。

值得注意的是，QwQ在面對復(fù)雜問題時，能夠進行深度自省和質(zhì)疑自身假設(shè)。通過深思熟慮的自我對話，QwQ能夠仔細(xì)審視其推理過程的每一步，從而確保答案的準(zhǔn)確性。例如，在解決經(jīng)典智力題“猜牌問題”時，QwQ通過梳理對話和推演，最終得出了正確答案，這一過程與擅長思考的人類解題過程頗為相似。

QwQ-32B-Preview的開源也引起了全球開發(fā)者的廣泛關(guān)注。在魔搭社區(qū)和HuggingFace等平臺上，QwQ一經(jīng)發(fā)布便吸引了大量開發(fā)者進行體驗。許多開發(fā)者對QwQ的表現(xiàn)給予了高度評價，認(rèn)為它是今年開源領(lǐng)域最重大的突破之一，讓中國在開源大模型和AI推理上占據(jù)了先機。

然而，通義團隊也坦誠地指出了QwQ目前存在的局限。盡管QwQ展現(xiàn)出了強大的分析能力，但它仍然是一個供研究的實驗型模型。在實際應(yīng)用中，QwQ可能會遇到不同語言混合使用、偶有不恰當(dāng)偏見以及對專業(yè)領(lǐng)域問題不了解等問題。不過，通義團隊表示，隨著研究的深入和模型的迭代，這些問題將逐步得到解決。

最后，QwQ-32B-Preview的推出和開源不僅為AI技術(shù)的發(fā)展注入了新的活力，也為全球開發(fā)者提供了一個學(xué)習(xí)和研究的寶貴資源。相信在不久的將來，QwQ將在更多領(lǐng)域展現(xiàn)出其強大的推理能力，為人類社會帶來更多的便利和進步。

舉報 0 收藏 0 打賞 0評論 0

更多>同類資訊

哈啰八年蛻變：從單車到生活服務(wù)平臺，出海與AI雙輪驅(qū)動未來增長

12-25

AI湯姆貓“重生”，陪伴玩具能否成為下一個百億級風(fēng)口？

12-25

蘋果自研AI芯片加速，或?qū)⒔K結(jié)與英偉達合作？

12-25

OpenAI或涉足人形機器人領(lǐng)域，攜手定制AI芯片探索新未來

12-25

AI賽道擁擠，誰將率先跳出同質(zhì)化包圍圈？

《大模型落地與前沿趨勢研究報告》就直接表示，互聯(lián)網(wǎng)時代應(yīng)用有很多關(guān)鍵要素可以構(gòu)建護城河，包括數(shù)據(jù)飛輪、網(wǎng)絡(luò)效應(yīng)、遷移成本、規(guī)模效應(yīng)、用戶心智等，但已經(jīng)不再適用大模型的業(yè)務(wù)模式。大模型始終是個底座，想要真正…

12-25

人形機器人融資數(shù)億，江蘇創(chuàng)新企業(yè)領(lǐng)跑，小米機器狗幕后推手再獲資本青睞

機器人前瞻（…

12-25

云天勵飛攜手閃極LOHO，正式發(fā)布AI智能眼鏡，打造外置智能大腦

12-25

AI熱潮下，人才短缺成最大瓶頸，未來發(fā)展路在何方？

作為某AI創(chuàng)業(yè)公司的合伙人之一，這一年，老李便一直為“缺人”的事發(fā)愁，“AI這個市場，也就天天喊得熱鬧，但實際上，沒有一個項目不缺人?！?馬哥的公司創(chuàng)始人原來是一家大廠的中層管理，2023年從大廠離職后，拉…

12-25

通義“二次入場”，能否在AI助手市場突出重圍？

這也導(dǎo)致了對通義App和網(wǎng)頁端的分流，大把的流量繞過了聚合版的通義，轉(zhuǎn)而流向了單個的AI產(chǎn)品?！鞍⒗锏闹匦倪€在B端，通義只能算得上C端測試性產(chǎn)品，但字節(jié)得把豆包打爆，才能在B端市場占據(jù)一席之地”。夸克在下載…

12-25

國產(chǎn)AI大模型崛起：豆包對話稱王，OpenAI o1推理數(shù)學(xué)領(lǐng)跑

從智源評測最新結(jié)果可以看出，今年下半年大模型發(fā)展更側(cè)重綜合能力提升與實際應(yīng)用；多模態(tài)模型快速發(fā)展，該領(lǐng)域內(nèi)涌現(xiàn)了不少新廠商與新AI模型；語言模型的發(fā)展則相對放緩。結(jié)合各項細(xì)分能力的評分來看，國產(chǎn)大模型更“…

12-25

藍籌領(lǐng)漲微盤暴跌，A股分化行情何時休？

12-25

百度AI科普走進中傳，數(shù)字人李白引領(lǐng)“AI+X”創(chuàng)意潮流

12-25

2025年數(shù)據(jù)管理新風(fēng)向：Denodo展望數(shù)字化轉(zhuǎn)型與AI融合新趨勢

12-25

聯(lián)想華北“芯”質(zhì)之旅：全棧AI引領(lǐng)智能化轉(zhuǎn)型新篇章

12-25

青云科技榮耀登榜，朝陽區(qū)2024算力伙伴新力量！

12-25

點擊查看更多 +

全站最新

華為閱讀年度榜單發(fā)布，沉浸式體驗帶你領(lǐng)略文學(xué)之美！

寶馬攜手鴻蒙，MyBMW、MINI應(yīng)用上線，開啟智能出行新時代

山姆代購驚現(xiàn)廁所分裝？食品安全何時能止！

穆峰達?線上首發(fā)：2型糖尿病與肥胖患者迎來全新治療選擇！

澳門回歸25載，橫琴如何助力經(jīng)濟多元發(fā)展綻放新光彩？

小米SU7冬測大放異彩，全能智能高效節(jié)能，雷軍公布滿分成績單

熱門內(nèi)容

本欄最新

哈啰八年蛻變：從單車到生活服務(wù)平臺，出海與AI雙輪驅(qū)動未來增長

AI湯姆貓“重生”，陪伴玩具能否成為下一個百億級風(fēng)口？

蘋果自研AI芯片加速，或?qū)⒔K結(jié)與英偉達合作？

OpenAI或涉足人形機器人領(lǐng)域，攜手定制AI芯片探索新未來

AI賽道擁擠，誰將率先跳出同質(zhì)化包圍圈？

人形機器人融資數(shù)億，江蘇創(chuàng)新企業(yè)領(lǐng)跑，小米機器狗幕后推手再獲資本青睞

本網(wǎng)站LOGO小熊標(biāo)志受版權(quán)保護，版權(quán)登記號：魯作登字-2015-F-025467，未經(jīng)ITBEAR官方許可，嚴(yán)禁使用。
聲明：本網(wǎng)站是公益性科普網(wǎng)站，為網(wǎng)友提供科技類資訊內(nèi)容，無障礙技術(shù)由太陽灣捐增，為閱讀障礙用戶提供內(nèi)容聽讀服務(wù)。如本站內(nèi)容侵犯了您的權(quán)利，請通知我們及時刪除。
中國（山東）自由貿(mào)易試驗區(qū) · 齊魯軟件園魯ICP備11015305號-1 商業(yè)合作入口
Copyright ? 小熊科技資訊 2007-2024 ITBEAR.COM.CN All rights reserved.

阿里云QwQ模型開源：科學(xué)推理能力亮眼，數(shù)學(xué)編程表現(xiàn)超OpenAI o1

阿里云QwQ模型開源：科學(xué)推理能力亮眼，數(shù)學(xué)編程表現(xiàn)超OpenAI o1