摘要:春節前夕,DeepSeek發布其開源模型DeepSeek-R1,用較低的成本達到了接近于OpenAI開發的GPT-o1模型的性能。短短幾天內,DeepSeek便登頂中美兩區蘋果應用市場免費榜榜單。這體現了國內人工智能領域的顯著進步。
這個春節假期,中國人工智能企業深度求索(DeepSeek)無疑是最火爆的話題之一。
1月20日,DeepSeek正式發布R1系列模型并開源,根據AI產品榜統計,DeepSeek僅上線18天日活1500萬,成為全球增速最快的AI應用。
根據AIcpb數據,截至2月4日,DeepSeek日活用戶數超越了2000萬人。如Meta CEO、OpenAI CEO等人都對DeepSeek系列模型的高性能與高性價比等優勢給予了高度評價。
2月5日開盤,DeepSeek概念股集體大漲,安凱微、安恒信息、每日互動、三六零、天娛數科等股漲停。
DeepSeek模型引動巨震
DeepSeek的橫空出世引發了AI產業的深刻討論。
華泰證券科技研究認為,DeepSeek本質是對現有AI算法的效率優化,短期可能導致短期訓練需求下降,但隨著模型普及和應用場景擴展,長期推理需求將顯著增長,這種趨勢類似于“蒸汽機降低煤耗但提升煤炭總用量”的歷史現象。未來大模型競爭中,“算法效率”的重要性或上升,投資重點可能從“算力軍備”轉向“算法效率”。
據悉,DeepSeek在多個方面展現出技術創新,主要包括模型架構創新、訓練方法突破、蒸餾優化、推理效率提升等。這些創新使DeepSeek在性能、效率和成本方面都取得了顯著進展,為AI技術的發展提供了新的方向。特別是在解決復雜數學、物理和推理問題時,其速度是ChatGPT的兩倍,且在編程問題上提供了迅速而全面的答案。
DeepSeek的成功,意味著即使不使用最先進的GPU,也可以開發滿足一般消費者需求的大模型。英偉達的Blackwell/Rubin等最先進的GPU的用途,可能會局限在探索下一代超大規模模型(Frontier Model)上。
與此同時,這也為中小開發者依托開源生態實現快速發展提供了一條發展路徑。目前,基礎大模型的開發,主要集中在OpenAI、Google、Anthropic、阿里,字節、百度的科技巨頭手中。開源協議能使中小開發者基于前沿模型二次開發,推動大模型創新從少數科技巨頭向分布式社區轉移,為中小軟件企業創造更多創新機會。
中信證券研究認為,DeepSeek的模型優異表現有望推動海外大模型廠商軍備競賽的升級。Meta CEO在24Q4財報里表示,DeepSeek的崛起會加強對Meta AI戰略和投資的信心,并將算力基礎設施的建設看作其戰略優勢,同時將2025財年資本開支預期提高到600億-650億美金,同比增長53%-66%。
近日,OpenAI上線o3-mini系列模型,是目前OpenAI推理系列中最新性價比模型,其價格也較o1-mini下降近60%,這一價格水平與DeepSeek相比仍然相差較大。
OpenAI首席執行官奧爾特曼表示,該公司沒有計劃起訴DeepSeek,“DeepSeek是一個令人印象深刻的模型,但我們相信我們會繼續開拓前沿并推出出色的產品,所以很高興能有另一個競爭對手。”
上市公司加速布局
2月4日,同花順新增概念指數”DeepSeek概念”,相關指數代碼886100。截至目前,一共有12只核心概念股,具體包括每日互動、美格智能、安凱微、天娛數科、杭鋼股份、萬興科技、三六零、安恒信息、青云科技、夢網科技、昆侖萬維、海光信息。
每日互動今日觸及漲停板,2月4日晚公司公告,經公司核實,深度求索的關聯公司—浙江九章資產管理有限公司(簡稱“幻方科技”)的一位重要股東確實曾為每日互動創始核心骨干成員;但截至本公告披露日,每日互動未持有深度求索和幻方科技的股權,也尚未向DeepSeek提供語料數據。
每日互動在較早時間就接入DeepSeek相關版本并完成各方面的評估及利用自有算力進行私有化部署,目前主要用于業務垂直場景使用、研發提效(AI4SE)、知識庫問答以及將其納入數據智能操作系統(DiOS)的功能模塊等。
安恒信息今日觸及漲停板,公司自設立以來一直專注于網絡信息安全領域,主營業務為網絡信息安全產品的研發、生產及銷售,并為客戶提供專業的網絡信息安全服務。
近日,安恒信息旗下恒腦.安全垂域大模型正式集成DeepSeek,完成基于DeepSeek R1的安全大模型的訓練,推出首個“DeepSeek”版安全智能體。此次推出的“DeepSeek”版安全智能體在釣魚郵件識別、數據分類分級、告警研判等關鍵業務場景表現出色。
安凱微是一家專注于物聯網智能硬件SoC芯片的芯片設計公司,主要產品包括物聯網攝像機芯片(視覺SoC)和物聯網應用處理器芯片。
根據1月25日官微,公司AK39系列芯片的天才虎AI智能錄音筆Pro 4G版推出市場,對接多家大模型底座,開啟智能錄音筆全新篇章。通過對接了豆包、通義千問、文心一言、DeepSeek、Kimi等多家大語言模型,并通過調優,能夠對不同大模型的特性進行分析與整合,實現對多源語言理解優勢的有效融合。
2月4日,就在春節假期結束前的一天,多家上市公司通過官微發布了與DeepSeek相關消息。青云科技表示,公司旗下AI算力云服務——基石智算CoresHub正式上線DeepSeek-R1系列模型,限時免費。
萬興科技表示,公司率先完成DeepSeek最新推理大模型DeepSeek-R1的深入適配,涵蓋旗下視頻創意、繪圖創意及文檔創意軟件業務多款產品。
夢網科技表示,隨著DeepSeek大模型的全球影響力持續擴大,公司將DeepSeek大模型深度集成至多源AI調度引擎“天慧智匯臺2.0”,推動消息通信服務從基礎連接向智能決策升級,為行業開辟降本增效新路徑。