面对生成式AI的激烈竞争,微软在自主AI技术研发上迈出了关键一步。2025年8月,微软发布了两款自研AI模型:大语言模型 MAI-1预览版和语音生成模型 MAI-Voice-1,旨在减少对合作伙伴OpenAI的过度依赖,并在AI领域树立更强的自主地位。

微软加速AI自主研发,推出MAI系列模型降低外部依赖(图1)

战略转型:押注全栈自研模型
此次发布标志着微软AI战略的重要转变。

  • MAI-1预览版:被微软AI部门CEO穆斯塔法·苏莱曼称为公司首个“从头到尾自主训练的基础模型”。该模型在大约1.5万张英伟达H100 GPU上完成训练,并已运行在更新的GB200芯片集群上。

  • MAI-Voice-1:一款高效的语音生成模型,能在单张GPU上不到一秒生成一分钟高保真音频,目前已集成到Copilot等应用中。

微软此前曾尝试开发小规模开源模型,但推出MAI-1意味着其正朝着规模化、全栈式的基础模型战略全面转型。

平衡合作与竞争的新格局
微软与OpenAI的关系正在发生微妙变化。

  • 历史合作:微软是OpenAI的最大投资者,累计投入超130亿美元,并通过Azure云提供算力支持。

  • 当前动向:随着OpenAI在算力上更多元地依赖其他云服务商,双方合作不如以往紧密。微软甚至已将OpenAI列入其年度报告的竞争对手名单。

  • 未来定位:苏莱曼强调,微软的目标是深化与OpenAI的合作,同时确保自身拥有打造世界顶级模型的内部技术能力。未来的关键在于“编排器”系统——它能智能判断何时使用第三方模型(包括OpenAI的),何时调用自研模型。

性能与展望:自研之路的起点
目前,MAI-1预览版在社区评测中与顶尖模型尚有差距,但微软视其为重要起点。苏莱曼表示,团队在相对较小的集群上取得了世界级性能,随着模型投入生产并收集反馈,性能将显著提升。微软计划未来推出更多专业化模型,以覆盖不同需求场景。

通过MAI系列模型的推出,微软正试图在快速发展的AI领域掌控自身命运,平衡深度合作与自主创新的关系,为其产品整合和商业化节奏争取更大主动权。