• 设为首页
  • 点击收藏
  • 手机版
    手机扫一扫访问
    迪恩网络手机版
  • 关注官方公众号
    微信扫一扫关注
    迪恩网络公众号

通義千問推新模型 阿里股價大漲

    通義千問推新模型   阿里股價大漲



    【香港中通社六日電】中國阿里巴巴集團旗下通義千問大模型團隊六日宣佈,正式推出最新的推理模型QwQ-32B。據通義千問大模型團隊介紹,這是一款擁有320億參數的模型,其性能可與具備6,710億參數(其中370億被激活)的DeepSeek-R1媲美。

    在數學推理、編程能力和通用能力的一系列基準測試中,通義千問大模型團隊把QwQ-32B與美國科企OpenAI的o1-mini,以及中國科企DeepSeek滿血版及蒸餾版進行比較,結果顯示,在測試數學能力的AIME24評測集上,以及評估代碼能力的LiveCodeBench中,QwQ-32B表現與DeepSeek-R1相當,遠勝於o1-mini及相同尺寸的R1蒸餾模型。

    至於為何可實現這一點,奧秘仍在於大規模強化學習的方法。與依賴傳統的獎勵模型不同,通義千問大模型團隊通過校驗生成答案的正確性來為數學問題提供反饋,並通過代碼執行服務器評估生成的代碼是否成功通過測試用例來提供代碼的反饋。

    目前,阿里已採用寬鬆的Apache2.0協議,將QwQ-32B模型向全球開源。

    QwQ-32B面世後,六日,阿里巴巴港股股價升逾8%。



26

鮮花
90

握手
64

雷人
24

路過
38

雞蛋

該文章已有0人參與評論

請發表評論

全部評論

扫描微信二维码

查看手机版网站

随时了解更新最新资讯

400-123-45678

在线客服(服务时间 9:00~18:00)

在线QQ客服
地址:上海市虹口区武进路齐浜大厦456号2幢10楼
电邮:green_ps@ppap.com.cn
移动电话:13301215647

Powered by Discuz! X3.4© 2001-2013 Comsenz Inc.