本報訊 (記者梁傲男)7月9日,記者從北京智譜華章科技股份有限公司(以下簡稱“智譜”)獲悉,智譜發布并開源的視覺語言大模型GLM-4.1V-9B-Thinking憑借9B的模型尺寸,成功登頂HuggingFaceTrending榜單。

智譜/供圖
據記者了解,GLM-4.1V-Thinking是一款支持圖像、視頻、文檔等多模態輸入的通用推理型大模型,專為復雜認知任務設計。它在GLM-4V架構基礎上引入“思維鏈推理機制(Chain-of-ThoughtReasoning)”,采用“課程采樣強化學習策略(Reinforcement Learning with Curriculum Sampling)”,系統性提升模型跨模態因果推理能力與穩定性。
其輕量版GLM-4.1V-9B-Thinking模型參數控制在10B級別,在兼顧部署效率的同時實現性能突破。該模型在MMStar、MMMU-Pro、ChartQAPro、OSWorld等28項權威評測中,有23項達成10B級模型的最佳成績,其中18項更是持平或超越參數量高達72B的Qwen-2.5-VL,充分展現了小體積模型的極限性能潛力。
業內人士表示,GLM-4.1V-9B-Thinking標志著GLM系列視覺模型實現從感知走向認知的關鍵躍遷。
(編輯 何成浩)