本報訊 (記者袁傳璽)1月20日,國內兩家備受關注的人工智能大模型創業公司北京月之暗面科技有限公司(以下簡稱“月之暗面”)(Kimi)和杭州深度求索人工智能基礎技術研究有限公司(以下簡稱“深度求索”)(DeepSeek)均發布了最新模型。
在月之暗面發布的k1.5多模態思考模型中,多模態思考模型實現了SOTA級別多模態推理和通用推理能力。在short-CoT模式下,Kimik1.5的數學、代碼、視覺多模態和通用能力大幅超越了GPT-4o和Claude 3.5 Sonnet。在long-CoT模式下,Kimi k1.5的數學、代碼、多模態推理能力達到了OpenAI o1正式版的水平。月之暗面表示,這應該是全球范圍內,首次有OpenAI之外的公司實現o1正式版的多模態推理性能。
深度求索發布的DeepSeek-R1在后訓練階段大規模使用強化學習技術,在僅有極少標注數據的情況下,極大提升了模型推理能力。在數學、代碼和自然語言推理等任務上,R1的性能也可以比肩o1正式版。同時根據DeepSeek公布的測試數據,R1在美國AIME 2024、MATH-500和SWE-bench Verified測試中的比分均高于OpenAI o1。
與OpenAI不同,這兩家公司都公開了原理及技術報告:Kimik1.5發布原創技術long2short,高效思維鏈+原生多模,DeepSeek-R1則繼續主打高性價比。
中央民族大學教授郭全中表示:“中國AI公司之前基本都在摸著OpenAI的石頭過河,但從K1.5等國產大模型開始,以硅谷為中心的格局已悄然發生變動。國產大模型的突破不僅在于技術指標的提升,也展示了中國AI技術正在走向自主創新的新階段。期待看到更多中國企業在全球AI舞臺上展現實力,推動人工智能技術向著更高水平邁進。”
(編輯 張鈺鵬)