99re6这里有精品热视频,久久综合九色欧美综合狠狠,国产精品久久久久久无毒不卡,av免费无插件在线观看,欧美放荡办公室videos

  1. 創(chuàng)業(yè)頭條
  2. 前沿領域
  3. AI智能
  4. 正文

阿里發(fā)布Qwen3-Max,性能超GPT5,躋身全球前三

 2025-09-24 15:07  來源:互聯(lián)網  我來投稿 撤稿糾錯

  阿里云優(yōu)惠券 先領券再下單

9月24日,2025云棲大會開幕,阿里通義旗艦模型Qwen3-Max重磅亮相,性能超過GPT5、Claude Opus 4等,躋身全球前三。Qwen3-Max包括指令(Instruct)和推理(Thinking)兩大版本,其預覽版已在 Chatbot Arena 排行榜上位列第三,正式版性可望再度實現突破。

Qwen3-Max為通義千問家族中最大、最強的基礎模型。該模型預訓練數據量達36T tokens,總參數超過萬億,擁有極強的Coding編程能力和Agent工具調用能力。在大模型用Coding解決真實世界問題的SWE-Bench Verified測試中,Instruct版本斬獲69.6分,位列全球第一梯隊;在聚焦Agent工具調用能力的Tau2-Bench測試中,Qwen3-Max取得突破性的74.8分,超過Claude Opus4和DeepSeek-V3.1。

 【圖說】:Qwen3-Max-Instrurct測評分數

Qwen3-Max的推理增強版本Qwen3-Max-Thinking-Heavy也展現出非凡性能,結合工具調用和并行推理技術,其推理能力創(chuàng)下新高,尤其在聚焦數學推理的AIME 25和HMMT測試中,均達到突破性的滿分100分,為國內首次。Qwen3-Max推理模型之所以能夠取得優(yōu)異成績,原因在于大模型在解數學題時懂得調動工具,能夠寫代碼做題,同時,增加測試時的計算資源,也讓模型表現變得更好。

【圖說】:Qwen3-Max-Thinking-Heavy 測評分數

大模型預訓練原理Scaling Law(規(guī)?;▌t)認為,持續(xù)地增長數據和參數規(guī)模,是通向 AGI 的可能路徑之一。由于自然數據的數量有限,當前有部分學者認為預訓練的Scaling Law即將逼近上限,而Qwen3-Max的性能突破顯示,繼續(xù)增大數據、模型參數,依然能鍛造出更強的模型,給予了大家更多的信心。目前,通義千問系列模型已經實現從0.5B到超萬億的全尺寸覆蓋,包含三百多個大模型,可滿足不同場景的需求。

即日起,用戶可在通義千問QwenChat上免費體驗Qwen3-Max,也可通過阿里云百煉平臺調用API服務。

申請創(chuàng)業(yè)報道,分享創(chuàng)業(yè)好點子。點擊此處,共同探討創(chuàng)業(yè)新機遇!

相關文章

  • H20芯片開賣即叫停,英偉達如何解圍?

    文/道哥在深陷“后門”風波、接受網信辦問詢之后,英偉達的“特供版”H20芯片,又有了新消息。近日,美國科技媒體《TheInformation》援引知情人士消息稱,英偉達已悄然向其關鍵供應商——包括負責封裝的安靠科技、供應高帶寬內存的三星電子、以及承擔后端處理的富士康發(fā)出指令,要求暫停所有與H20AI

    標簽:
    英偉達
  • 真正的「國產英偉達」來了

    文/二風來源/節(jié)點財經一場關于“中國芯”的IPO審議,正把投資者們的目光鎖定在上交所。根據上交所發(fā)布的公告,上市審核委員會已定于9月26日審議摩爾線程的科創(chuàng)板首發(fā)申請。作為中國半導體自主化浪潮中最受矚目的“考生”之一,包括其創(chuàng)始人顯赫的英偉達背景、高達80億元人民幣的募資雄心,以及在國產GPU領域取

    標簽:
    英偉達
  • AI視頻生成賽道“分野”:小廠重產品,大廠重生態(tài)

    AI視頻生成賽道“分野”:小廠重產品,大廠重生態(tài)

  • 數據庫進入“內存自由”時代!阿里云PolarDB發(fā)布全球首個CXL數據庫服務器

    技術的進步永無止境,繼創(chuàng)下TPC-C性能&性價比雙冠之后,阿里云PolarDB云原生數據庫再度實現關鍵突破。9月24日杭州云棲大會上,阿里云宣布推出全球首款基于CXL(ComputeExpressLink)2.0Switch技術的PolarDB數據庫專用服務器。在原有RDMA網絡的基礎上,Polar

  • 為AI時代云服務器量身定制 阿里云操作系統(tǒng)Alinux 4重磅發(fā)布

    2025年9月24日,在杭州舉辦的云棲大會上,阿里云正式發(fā)布全新一代服務器操作系統(tǒng)AlibabaCloudLinux4(簡稱Alinux4)。Alinux4基于Linux6.6內核打造,是首個全面遵循龍蜥社區(qū)“開源生態(tài)合作倡議”規(guī)范的商業(yè)發(fā)行版。它不僅兼容主流開源社區(qū)生態(tài),更針對阿里云最新9代ECS

  • 阿里云重磅發(fā)布AI安全護欄 五項安全能力護航AI安全

    9月24日,杭州云棲大會技術主論壇上,阿里云重磅發(fā)布AI安全護欄,提供五項核心安全能力,護航AI安全。一方面為客戶提供融入AIAgent開發(fā)全鏈路的原生安全防護,另一方面持續(xù)用AI賦能安全產品智能化升級,打造Agentic-SOC安全運營,提升安全威脅檢測和響應效率。在過去的一年,AIAgent正在

  • 魔搭社區(qū)國際版上線,并發(fā)布科學智能專區(qū)與AIGC創(chuàng)作引擎

    9月24日,魔搭社區(qū)舉辦了“全球協(xié)作?科學突破?創(chuàng)意無限”的專題論壇,并發(fā)布魔搭社區(qū)國際版、科學智能專區(qū)與AIGC創(chuàng)作引擎FlowBench,旨在連接全球開發(fā)者、加速科研范式創(chuàng)新、賦能創(chuàng)意表達。自2022年11月初成立至今,魔搭社區(qū)已成長為中國最大AI開源社區(qū),其模型數量已突破10萬,服務了全球20

  • 七連發(fā)!阿里多款重磅發(fā)布亮相云棲大會

    9月24日,2025云棲大會現場,阿里云CTO周靖人接連發(fā)布了七款大模型技術產品。七款技術產品覆蓋語言、語音、視覺、多模態(tài)、代碼等模型領域,在模型智能水平、Agent工具調用以及Coding能力、深度推理、多模態(tài)等方面均實現突破。在大語言模型中,阿里通義旗艦模型Qwen3-Max全新亮相,性能超過G

  • 阿里云擴建全球基礎設施,將新增巴西、法國和荷蘭數據中心

    9月24日,阿里云在云棲大會上宣布新一輪全球基礎設施擴建計劃:將在巴西、法國和荷蘭首次設立云計算地域節(jié)點(region),并將擴建墨西哥、日本、韓國、馬來西亞和迪拜的數據中心,以便更好服務全球客戶日益增長的AI和云計算需求。目前,阿里云在全球29個地區(qū)運營91個可用區(qū),是中國最大、亞太第一的云服務商

  • 阿里AI成中國企業(yè)首選,Agent和Coding加速AI滲透

    9月24日,在2025云棲大會上,阿里巴巴集團CEO、阿里云智能集團董事長兼CEO吳泳銘表示,當下行業(yè)處于“自主行動”階段,AI掌握工具使用和編程能力以“輔助人”。記者獲悉,阿里云百煉平臺已有超20萬開發(fā)者開發(fā)了80多萬個Agent。同時,通義靈碼插件下載量已超2200萬,累計為開發(fā)者生成超60億行

編輯推薦