通義千問推新模型阿里股價大漲

设为首页
点击收藏
手机版

手机扫一扫访问
迪恩网络手机版
关注官方公众号

微信扫一扫关注
迪恩网络公众号

登陆注册

客服电话

点击联系客服
在线时间：8:00-16:00

客服电话

400-123-4567

电子邮件
helpdesk@macaubbs.com
快速发帖
问题反馈
APP下载

迪恩网络APP

随时随地掌握行业动态
官方微信

扫描二维码

关注迪恩网络微信公众号
返回顶部

來自: 澳門日報電子版收藏邀請

通義千問推新模型阿里股價大漲

【香港中通社六日電】中國阿里巴巴集團旗下通義千問大模型團隊六日宣佈，正式推出最新的推理模型QwQ-32B。據通義千問大模型團隊介紹，這是一款擁有320億參數的模型，其性能可與具備6,710億參數（其中370億被激活）的DeepSeek-R1媲美。

在數學推理、編程能力和通用能力的一系列基準測試中，通義千問大模型團隊把QwQ-32B與美國科企OpenAI的o1-mini，以及中國科企DeepSeek滿血版及蒸餾版進行比較，結果顯示，在測試數學能力的AIME24評測集上，以及評估代碼能力的LiveCodeBench中，QwQ-32B表現與DeepSeek-R1相當，遠勝於o1-mini及相同尺寸的R1蒸餾模型。

至於為何可實現這一點，奧秘仍在於大規模強化學習的方法。與依賴傳統的獎勵模型不同，通義千問大模型團隊通過校驗生成答案的正確性來為數學問題提供反饋，並通過代碼執行服務器評估生成的代碼是否成功通過測試用例來提供代碼的反饋。

目前，阿里已採用寬鬆的Apache2.0協議，將QwQ-32B模型向全球開源。

QwQ-32B面世後，六日，阿里巴巴港股股價升逾8%。