午夜精品久久久久久久99热浪潮_中国一级特黄毛片大片久久_欧美a∨一区二区三区久久黄_大地资源色婷婷视频在线_亚洲欧美闷骚少妇影院_jizzjizzjizz亚洲熟妇无码

阿里發布最強開源模型Qwen 3,參數量僅為DeepSeek-R1的1/3

藍鯨新聞4月30日訊(記者 武靜靜)趕在了五一節前,阿里巴巴開源新一代通義千問模型 Qwen3。據介紹,其參數量僅為 DeepSeek-R1 的 1/3,成本大幅下降,但性能表現不錯。

報告顯示,Qwen3-235B-A22B?在代碼、數學、通用能力等基準測試中,超過了與DeepSeek-R1、o1、o3-mini、Grok-3 和 Gemini-2.5-Pro 等全球頂尖模型。成為了全球最強的開源模型。

通過模型架構的改進、訓練數據的增加以及更有效的訓練方法,Qwen3實現了模型體積更小情況下,性能表現也比更大參數規模的Qwen2.5基礎模型要好。特別是在 STEM、編碼和推理等領域,Qwen3 Dense 基礎模型的表現甚至超過了更大規模的 Qwen2.5 模型。

博客中,阿里稱,Qwen3 Dense 基礎模型的整體性能與參數更多的Qwen2.5基礎模型相當。例如,Qwen3-1.7B/4B/8B/14B/32B-Base 分別與 Qwen2.5-3B/7B/14B/32B/72B-Base 表現相當。

有意思的是,除了擁有235B參數的MoE模型外,Qwen 3還配備了一個小型MoE模型,即Qwen3-30B-A3B。該模型的激活參數量為3B,不及QwQ-32B模型的10%,然而其性能卻更為出色。

我們可以把MoE架構理解為一個大型的客服中心,其中有許多專門處理不同問題的專家——有的專家專門處理技術問題,有的專家處理賬單查詢,還有的專家負責解答產品使用問題。在大模型訓練過程中,當數據進入模型中后,大模型會像“客服中心”一樣,根據問題的性質被分配給最合適的專家來解決,可以提高查詢的計算效率。

此次,阿里開的源模型有Dense模型,也有MoE模型。其中,開源了兩個 MoE 模型的權重:Qwen3-235B-A22B,一個擁有 2350 多億總參數和 220 多億激活參數的大模型,以及Qwen3-30B-A3B,一個擁有約 300 億總參數和 30 億激活參數的小型 MoE 模型。

六個 Dense 模型也已開源,包括 Qwen3-32B、Qwen3-14B、Qwen3-8B、Qwen3-4B、Qwen3-1.7B?和 Qwen3-0.6B,均在 Apache 2.0 許可下開源。可以直接商用。

Qwen 3系列的其中一個創新點在于其"混合型"模型設計,可以在深度思考這種慢思考模式(用于復雜的邏輯推理、數學和編碼)和快思考模式(用于高效、通用的聊天) 之間的無縫切換 ,確保在各種場景下實現最佳性能。

這意味著,用戶終于不需要手動操作開啟并關閉“深度思考”功能,且擔心模型過度思考的問題了,此前,很多大模型用戶反饋稱,大模型動不動就深度思考輸出長篇大論,很多小問題也如此完全沒必要。

關鍵在于,這種快慢思考靈活切換的模式能有效的降低成本,阿里在博客中稱:這兩種模式的結合大大增強了模型實現穩定且高效的“思考預算”控制能力。這樣的設計讓用戶能夠更輕松地為不同任務配置特定的預算,在成本效益和推理質量之間實現更優的平衡。

在部署方面,阿里稱僅需4張H20即可部署千問3滿血版,顯存占用僅為性能相近模型的三分之一。這意味著相比相比滿血版deepseek R1,部署成本大降75%~65%。

阿里介紹稱,Qwen3經過了四階段的訓練流程,相當于,先教基礎→再練深度思考→混合快慢模式→最后全面優化。阿里表示,Qwen3在工具調用、指令執行和數據格式處理方面表現優秀。建議搭配Qwen-Agent使用,它能簡化工具調用的代碼實現。

此次,阿里還專門優化了 Qwen3 模型的 Agent 和 代碼能力,同時也加強了對 MCP 的支持。在示例中看到, Qwen3 可以絲滑的調用工具。

開源正在成為阿里核心的AI戰略,從2023年起,阿里通義團隊就陸續開發了覆蓋0.5B、1.5B、3B、7B、14B、32B、72B、110B等參數的200多款「全尺寸」大模型。

在此前的一次采訪中,通義相關負責人曾告訴藍鯨新聞,“開源不是目的而是結果。只有做出真正有競爭力的產品,開源才有意義。這倒逼我們必須做到兩點:一是模型性能要達到全球SOTA水平,二是要能媲美甚至超越閉源模型。

AI財評
【財經銳評】阿里Qwen3開源模型以"小體積高性價比"破局大模型商業化困境 阿里此次開源Qwen3系列模型展現出清晰的商業化路徑:1)通過MoE架構創新實現"降本增效",235B參數模型僅需4張H20顯卡部署,成本較競品降低65%-75%,直擊企業最敏感的TCO(總擁有成本)痛點;2)獨創"快慢思考"動態切換機制,在保證復雜任務性能的同時優化推理效率,這種彈性計算設計可顯著降低API調用成本;3)全尺寸矩陣化產品布局(0.6B-235B)覆蓋從邊緣計算到云端的不同場景,配合Apache 2.0開源協議,快速構建開發者生態。 值得關注的是,其30B-A3B小模型性能超越32B稠密模型,印證了"模型效率>絕對規模"的行業新趨勢。這既是對Meta等海外巨頭的技術反擊,更是為即將到來的AI公有云價格戰儲備"低成本武器"。不過,開源策略能否轉化為云業務收入,仍需觀察其企業級工具鏈的變現能力。當前節點釋放重磅開源模型,或為Q3季度云棲大會的商業化版本埋下伏筆。
主站蜘蛛池模板: 青青久操视频 | 国产大片黄在线观看 | 精品国产一区二区三区四区四 | 精品国产AⅤ一区二区三区 99在线精品视频免费观看20 | 黄色成年网站 | 国产精品成人永久在线四虎 | 日日夜夜爱爱 | 人操人视频 | 男人猛躁进女人视频免费播放 | 粗大的内捧猛烈进出在线视频 | 午夜小视频在线观看 | 136fldh福利免费视频观看 | 欧美成人r级一区二区三区 亚洲午夜无码久久 | 成年人在线看视频 | 高潮久久久久久久久 | 3333少妇影院 | 9色.com| 国产九一视频在线观看 | 在线免费观看污网站 | 久久精品成人无码观看56 | 伊人网视频在线观看 | 公车上玩弄白嫩少妇 | 农村一级毛片 | 青青草青娱乐在线 | 窝窝成人| 国产亚洲欧美一区 | 亚洲视频在线播放网站 | 久操视频免费看 | 欧美精品四区 | 亚洲第一无码av无码专区 | 日本无码人妻丰满熟妇A片 调教奴隶色の女教师在线播放 | 国产成人无精品久久久久国语 | 日韩免费a级片 | 中文字幕成人 | 日韩在观看线 | 午夜精品一区二区三区福利视频 | 亚洲中文av一区二区三区 | 久久国产精品张柏芝 | 国产成人精品久久亚洲高清不卡p | 午夜无码乱码在线观看 | 91动漫网站 |