上海AI企業發布全球首個混合架構開源模型
2025年06月18日10:07 | 來源:人民網-上海頻道

人民網上海6月18日電 6月17日,總部位於上海徐匯的AI企業MiniMax(稀宇科技)正式發布其自主研發的MiniMax-M1系列模型,M1被定義為“全球首個開源的大規模混合架構推理模型”。
技術報告顯示,M1模型在處理百萬級Token的長文本上實現了重大突破,支持高達100萬Token的上下文窗口,成為上下文最長的推理模型。此外,它還支持8萬Token推理輸出,為處理復雜文檔分析、長篇代碼生成等任務提供了可能性。
開源技術報告截圖
MiniMax-M1的卓越性能,根植於其獨特的架構設計和算法創新。其中,兩大核心技術——線性注意力機制混合構架和更快的強化學習算法,構成了其高效能、低成本的基石。
分析人士認為,MiniMax此舉不僅為開發者和企業提供了一個高性能、低門檻的新選擇,也用事實証明了通過技術創新可以有效打破“算力-資本”的壁壘。這種“卷成本、卷效率”的競爭模式,將倒逼更多模型廠商走向真正的技術驅動和價值創造,而非停留在參數和估值的虛假繁榮中。
據了解,完整的M1模型權重、技術報告均已在Hugging Face和GitHub上開放獲取。同時,公司正積極與國家超算平台、vLLM等業界主流開源框架合作,以確保開發者能夠輕鬆、高效地部署和使用M1模型。
MiniMax相關負責人表示,M1的發布僅僅是MiniMax“開源周”的序幕。在接下來的四個工作日裡,MiniMax計劃每天發布一項新的技術或產品更新,持續為AI社區帶來驚喜。
(責編:唐小麗、軒召強)
分享讓更多人看到
- 評論
- 關注