近日,阿里云通義千問系列模型再傳佳音,其最新開源的通義千問QwQ-32B模型在業(yè)界引起了廣泛關注。隨著國家超算互聯(lián)網(wǎng)平臺、算能科技、壁仞科技等一眾國產算力平臺的相繼接入,以及通義千問衍生模型數(shù)量突破10萬個的壯舉,中國AI開源生態(tài)正展現(xiàn)出前所未有的活力與實力。
通義千問QwQ-32B模型以其320億參數(shù)量,在數(shù)學、代碼及通用能力等多項權威評測中表現(xiàn)出色,與參數(shù)規(guī)模更大的DeepSeek-R1模型不相上下。這一模型的開源,不僅為開發(fā)者提供了更多選擇,也極大地推動了國產算力平臺的適配與優(yōu)化。
國家超算互聯(lián)網(wǎng)平臺率先上線通義千問QwQ-32B API服務,向用戶提供免費100萬tokens的試用額度,降低了用戶的使用門檻。隨后,算能科技、硅基流動SiliconCloud等國產算力平臺也迅速跟進,紛紛推出基于QwQ-32B的推理加速版或一體機,為開發(fā)者提供更加便捷、高效的AI算力支持。
值得一提的是,壁仞科技推出的QwQ-32B大模型一體機,通過軟硬件協(xié)同優(yōu)化,實現(xiàn)了75TPS的推理速度,這一成績在業(yè)界堪稱佼佼者。同時,青云科技AI算力云平臺也上線了該模型,進一步降低了企業(yè)部署AI應用的門檻。
除了產業(yè)界的積極響應,學術界也對通義千問QwQ-32B模型表現(xiàn)出了濃厚的興趣。東南大學等科研機構宣布接入該模型,旨在推動學術研究與產業(yè)應用的深度融合,為AI技術的發(fā)展注入新的活力。
技術方面,通義千問QwQ-32B模型通過大規(guī)模強化學習,實現(xiàn)了在性能上的質的飛躍。這一突破不僅降低了算力成本,還使得該模型能夠更好地適配國產芯片與算力平臺,為中國AI自主化提供了關鍵支撐。此外,阿里巴巴還計劃未來發(fā)布基于Qwen2.5-Max的推理模型,其復雜任務處理能力及推理能力將進一步提升。
在全球開源生態(tài)方面,阿里千問模型家族已經覆蓋了從0.5B至110B參數(shù)的全尺寸版本,衍生模型數(shù)量超過10萬個,涵蓋了自然語言處理、代碼生成、多模態(tài)交互等多個場景。在HuggingFace社區(qū),通義千問持續(xù)領跑,其中Qwen2.5-1.5B模型更是占據(jù)了2024年全球模型下載量的26.6%,位居榜首。
值得一提的是,在全球前三大開源模型中,中國公司占據(jù)了兩席,分別是阿里千問和DeepSeek。這一成績不僅彰顯了中國在AI開源領域的領先地位,也預示著中國AI產業(yè)在未來的發(fā)展中將擁有更多的話語權和競爭力。