原文标题:《一文读懂微软 Build 2026 开发者大会:「Agent 优先」时代到来,一口气发七款自研模型》
原文作者:李海伦,腾讯科技
美国当地时间 6 月 2 日,微软 Build 2026 开发者大会在旧金山梅森堡拉开帷幕。此次大会主题聚焦于前沿 AI 技术的实战应用,微软发布了一系列覆盖自研 AI 模型、智能体应用、操作系统安全、开发者工具、云服务及新型硬件平台的产品与更新。
在 2025 年的开发者大会,微软确立了「AI 智能体时代」方向,发布了 Copilot Studio 多智能体编排、Windows AI Foundry,并宣布全面支持 Model Context Protocol,GitHub Copilot 推出编程智能体 Coding Agent。
在微软的叙事中,2025 年解决的是「智能体时代,该用什么标准和框架」,2026 年聚焦的是「如何用自家的模型和产品,真正跑起来」——模型层补上了能挑大梁的自研主力,产品层把智能体从演示推向了系统、硬件和云的全栈落地。
这次发布会,核心发布可分为六个板块:MAI 自研模型家族、以 Scout 和 GitHub Copilot 应用为代表的智能体生态、Windows 系统级 AI 安全沙箱 MXC、面向开发者的 Surface RTX Spark Dev Box 与系统优化、Project Solara 新型智能体设备平台,以及包括 Microsoft IQ、Rayfin、ASSERT、ACS 等在内的开发者工具与治理框架。
01 七款模型从零训练,拒绝蒸馏
整场主题演讲以微软 CEO 萨提亚·纳德拉的愿景陈述为主线徐徐展开。他抛出「智能体优先」的战略框架后,各业务线高管依次登台,推出具体产品把这套框架落到实处。
在大会上,苏莱曼宣布推出七款由微软 AI 内部开发的全新模型,统一归入 MAI 家族。
他将 MAI 的使命描述为构建一台「爬山机器」,通过持续投入计算量、更优数据和更精准评估,实现循环往复的自我改进,让用户始终保持在技术前沿。
训练计算规模方面,苏莱曼指出,用于训练前沿模型的计算量已增长一万亿倍,预计未来三年内还将再增长一千倍。微软所有 MAI 模型均「从零开始进行爬山,零蒸馏」,不依赖第三方模型输出进行训练。

微软 AI 部门负责人苏莱曼介绍七款自研模型
具体模型如下:
旗舰推理模型 MAI-Thinking-1,这是一个中型模型。微软表示,它在关键的软件工程测试中,性能可以跟市面上最好的模型打平。在盲测对比中,人类评判员对它的偏好程度跟 Sonnet 4.6 不相上下。这个模型是从零开始、用干净数据训练,未使用第三方模型蒸馏。
编程模型 MAI-Code-1-Flash,是一个推理高效的 agentic 编码模型,拥有 50 亿参数,专为 GitHub Copilot、VS Code 和微软技术栈量身定制并深度集成。微软表示其可与 Haiku 媲美但成本更低。
文生图模型 MAI-Image-2.5 及其超高效 Flash 变体,支持文生图和图像编辑,微软称其在 Arena 评分上超越了谷歌 Nano Banana Pro。
转录模型 MAI-Transcribe-1.5,具备 SOTA 级别准确性。据称速度比竞品模型快五倍,内置支持 43 种语言的领域特定术语识别。
语音生成模型 MAI-Voice-2,提供高质量、自然听感的语音生成,支持 15 种语言,能够根据短样本适配声音,具备防滥用保护措施。其 Flash 变体即将推出,以更低成本实现同样功能。
所有模型共享相同的数据规范、基础设施和评估框架。除了在 Azure Foundry 上分发并为微软第一方产品优化外,这些模型还将在 Open Router 以及 Fireworks 和 Baseten 上向开发者提供。开发者首次能够自行调整模型权重。
在会上,纳德拉介绍了 Microsoft Frontier Tuning,一种让企业用自身工作数据定制模型的方法。其逻辑是,最有价值的数据不是通用语料,而是智能体在企业里执行任务的真实轨迹、步骤和决策。

微软 CEO 纳德拉介绍 Frontier Tuning
这套机制把 MAI 模型接入实际业务流程,让模型在真实环境中边做边学。苏莱曼说:「你正在构建自己的模型:在你的环境中,用你的数据训练,由你控制。你的机构知识会成为模型的一部分,并且只属于你。」
效果方面,微软为 Excel 调整的 MAI 模型与 GPT-5.4 水平相当,同时效率提高 10 倍。麦肯锡采用 Frontier Tuning 后,MAI 在所有测试模型中实现最高胜率,成本降低约 10 倍。
在医疗健康领域,微软宣布与梅奥诊所合作,共同打造一个用于医疗保健的前沿 AI 模型。该模型将梅奥诊所的临床专业知识、去标识化的临床数据和纵向洞察,与微软的基础 AI 能力结合。
微软同时透露,MAI 模型正与自研的 Maia 200 芯片进行协同设计,通过软硬件联合优化已实现 1.4 倍的效率提升。
02 智能体生态全面落地
微软在大会上宣告了向「Agent 优先」的宏大转型,旨在自动化知识工作者使用软件的方式,将 AI 助手植入日常办公交互中。
Scout 是此次发布的核心智能体产品。这款被称为「永远在线」的 AI Agent,构建于 OpenClaw 框架之上,可在 Microsoft Teams 中像人类同事一样交互。
Scout 能浏览用户的工作消息、日历和电子邮件收件箱,自动完成任务、重新安排冲突会议,并起草听起来很专业的回复。用户可在 Teams 中直接向它发送指令,也可以为它命名。

微软新任命的企业副总裁奥马尔·沙欣解释了 Scout 的设计理念:「你的公司本质上就是雇佣了你的助理。拥有私人助理的全部意义在于,当你不在工作时,他们还在工作。」
Scout 通过微软 Frontier 计划提供,需要 GitHub Copilot 订阅。微软正测试一款 Scout 桌面应用,将向选择「前沿」功能访问权限的订阅用户推出。在微软内部,沙欣说销售部门是使用该工具最大、增长最快的群体。
GitHub Copilot 桌面应用是另一项重要发布。GitHub 首席产品官马里奥·罗德里格斯(Mario Rodriguez)介绍,这是一款「构建在 GitHub 之上的、Agent 原生的桌面体验」。

通过统一的「My Work」视图,开发者可看到跨连接仓库的动态工作,包括活动会话、议题、拉取请求和后台自动化。
每个会话在其自己的 Git worktree 中运行,并行 Agent 互不干扰。应用具备 Agent Merge 功能,可带领拉取请求完成审查、检查和合并。Canvas 界面用于人机之间的双向交互,开发者可检查、引导和验证 Agent 代表自己执行的工作。
GitHub Copilot 应用面向 Windows 11、Windows 11 on Arm、Mac 和 Linux 提供技术预览版,需要 GitHub Copilot 订阅,未来将向 Copilot Free 用户开放。该应用支持云端和本地沙箱、代码审查,两者均附带策略支持。
在智能体安全治理方面,微软发布了 Agent 控制规范(ACS),这是一个新的开源标准,旨在为开发者提供更一致、更细粒度的方法来控制 AI Agent 的行为。ACS 让开发、合规和安全团队能够为 Agent 定义策略文件,规定 Agent 可以做什么、绝对不能做什么、何时需要人类批准,以及应记录哪些证据供审查。

ACS 作为一个 SDK 发布,附带 LangChain、OpenAI Agents SDK、Anthropic Agents SDK、AutoGen、CrewAI、Semantic Kernel、Microsoft.Extensions.AI、MCP 工具等的插件。由于策略可写成单个文件,可以与 Agent 捆绑在一起,跟随 Agent 穿越不同框架和环境。
ASSERT(Adaptive Spec-driven Scoring for Evaluation and Regression Testing)是另一项测试工具。这是一个开源框架,通过使用 AI 将对目标、策略或预期行为的高级自然语言描述,转化为结构化的评分测试。
ASSERT 接收关于 AI 模型预期行为的简明语言描述,生成可接受与不可接受行为集合、问题场景和测试用例,针对目标系统运行测试并评分。它还能记录 AI 系统所采取的路径,包括中间操作和工具调用,以便开发者检查失败位置。
03 Agent 越自主越危险,微软用 MXC 在系统层划红线
随着 AI Agent 日益强大和自主,微软识别出一个关键问题:Agent 越自主越有用,让它不受护栏约束地在企业网络上运行就越危险。微软官方博客将此描述为一个「多层系统问题」,Agent 与人类、工具、应用、模型以及其他 Agent 之间的每一次交互「都会暴露新的攻击面,并引入不同的故障模式」。
针对这一问题,微软推出了 Microsoft Execution Containers(MXC),这是一个内置在 Windows 操作系统本身的、由策略驱动的执行层。
微软 Windows 和设备执行副总裁帕万·达武鲁里强调,这对于使 AI Agent 具有商业可行性至关重要,它们「围绕安全性、包含、隔离和让用户控制」,将使 Agent 对普通消费者和企业部署来说足够安全。

微软 CEO 纳德拉介绍系统级安全沙箱 MXC
MXC 本质上是一个 SDK 和策略模型,嵌入在 Windows 和 Windows Subsystem for Linux 中,提供微软所称的「可组合的沙箱频谱」。该频谱范围从轻量级进程隔离(已被 GitHub Copilot 的命令行界面采用),延伸到微型虚拟机、Linux 容器,以及在 Windows 365 上运行的完整云实例。
该系统将 Agent 的执行与用户的桌面、剪贴板、用户界面和输入设备分离开。每个 Agent 被绑定到一个身份,要么是本地 ID,要么是由 Microsoft Entra 支持的云预配身份,确保 Agent 的每一个动作都可被归因、审计和治理。
MXC 现已提供早期预览版。与微软企业安全栈集成的 Agent 365 将于 2026 年 7 月推出预览版,将 Entra 身份服务、Intune 设备管理、Defender 威胁防护和 Purview 数据治理能力层叠到 MXC 之上,使 IT 部门能集中管理 Agent 隔离。
在合作伙伴方面,OpenAI、英伟达、Manus、Nous Research(Hermes Agent 制造商)以及 OpenClaw 开源项目已宣布在 MXC 上构建。
值得一提的是,OpenClaw 的合作,是创建者彼得·斯坦伯格(Peter Steinberger)主动联系微软表达合作兴趣,最终这事发展成了全面的平台级伙伴关系。
04 三项更新,让 Edge 的 AI「不联网也能跑」
微软 Edge 浏览器也获得了本地 AI 能力升级。微软表示,自 Build 2025 引入 Phi-4-mini 后,团队根据网页开发者反馈扩展了端侧 AI 能力。
第一项是 Aion-1.0-Instruct,一个比 Phi-4-mini 更小、更快、更高效的本地小语言模型。
它可在 GPU 和 CPU 能力较弱的 PC 上运行,现以开发者预览版提供,将于 7 月登陆 Hugging Face。
第二项是语言检测和翻译 API,随 Edge 148 版本提供。这两个 API 由 Edge 内置的端侧 AI 模型驱动,用于 JavaScript,允许网站和浏览器扩展识别文本语言并在语言对之间翻译。
微软称其「提供快速、高质量的翻译,支持超过 145 种语言,并针对网络上的翻译工作负载进行了优化」,此服务免费。
第三项是通过 Web Speech API 实现语音识别,在 Edge Canary 和 Dev 频道中以实验形式提供。
该 API 帮助开发者将语音或音频输入整合到网站和浏览器扩展中,在设备本地运行,也可基于云端语音转文本和文本转语音服务作为后盾。
05 开发者工具与云服务迭代
在数据智能层面,微软发布了 Microsoft IQ,把此前各自独立的四个上下文源合并成 Agent 的共享基础。
微软 Fabric 首席技术官阿米尔·内茨打了个比方:《黑客帝国》里那些绿色代码瀑布不是装饰,而是构建那个世界的地基。他说,「我们在数据世界做的事,就是给 Agent 造一个基于数据的现实」。
Microsoft IQ 的四个上下文源分别为:Work IQ,捕获组织日常运作方式,利用电子邮件、文档、会议和日程安排;Foundry IQ,管理机构知识,策划和索引知识库;Fabric IQ,通过数据对业务的实时运营状态进行建模,定义基于 Fabric 实时智能的实时信号所锚定的实体、关系和业务规则,该功能预计在未来几个月正式发布;Web IQ,添加来自网络的实时全球上下文。

有了这套上下文体系,Agent 就不再是一个只会执行命令的工具,而是一个了解公司运转情况的虚拟员工。
光有共享的「地基」还不够。当 Agent 开始生成应用时,每个应用都需要一个后端,如果放任不管,这些应用就会在上下文层之外形成新的数据孤岛。为此微软发布了 Rayfin,一个开源 SDK 和 CLI,它把 Agent 构建的应用直接部署到 Fabric 平台作为受治理的生产后端,应用数据默认进入统一的 OneLake 数据湖,再反馈回 Microsoft IQ,而不是在外部堆积。
微软把它定位为 Supabase 和 Neon 的竞争对手,核心区别就是治理:所有应用都走同一套数据和合规通道。内茨说这是个双向过程,Agent 建应用时从企业的数据规则里取信息,应用跑起来产生的数据又反过来更新这套规则,下一个 Agent 就能用上最新的东西。
微软同时推出的 WSL 容器功能,让开发者能在 Windows 上直接创建和管理 Linux 容器,微软还给它配了命令行界面和 API,允许在本机 Windows 应用里运行 Linux 容器,这个功能将在未来几个月提供公开预览。
为了不让开发者在环境配置上浪费时间,微软还发布了 Windows Developer Configurations,可以快速设置一台新机器并套用开发者优化配置,自动安装 WSL、PowerShell 7 和 Visual Studio Code,同时在文件资源管理器里启用 Git 版本控制并显示隐藏文件。
06 两款新硬件,把 AI 重活拉回本地端
这场 Build 不只是模型、Agent 和开发工具的软件秀,硬件也没缺席。当 AI 计算越来越吃算力、Agentic 工作流又需要持续不断地跑,微软索性把目光投向了开发者手边的设备,与其每次都去租昂贵的云 GPU,不如让这些活儿直接在本地机器上完成。
Surface 产品公司副总裁安德鲁·希尔宣布了两款新设备:
Surface RTX Spark Dev Box 是一款紧凑型开发者 PC,搭载 NVIDIA RTX Spark 超级芯片,结合 NVIDIA Blackwell RTX GPU 和 NVIDIA Grace CPU,提供高达 1 Petaflop 的 AI 算力,配备 128 GB 统一内存。
该设备采用铝制机箱兼作散热器,专为长时间运行的训练任务、大模型推理和复杂 Agentic 流程设计。
设备预装 Windows 11 Pro,并在镜像层面为开发者预配置:深色主题、为开发简化的任务栏、移除小部件、开启「请勿打扰」模式、开发者模式已启用、PowerShell 7 为默认 Shell。WSL 2 已配置好 GPU 直通和 CUDA 支持,VS Code、GitHub Copilot、Git、Python 和 Node.js 均已安装。
安全方面,Surface RTX Spark Dev Box 建立在符合微软零信任原则的芯片到云安全之上,包括 Secured-core PC 架构、BitLocker 加密和 Microsoft Defender 保护,并可与 Entra ID 和 Intune 集成实现大规模管理和治理。
希尔解释称:「开发者构建软件的方式正在发生根本性变化。AI 模型的能力和复杂性日益增长,Agentic 工作流需要持续的计算能力,而且即便是那些不需要最先进模型的任务,每一次迭代也可能产生云端成本」。
另一款 Surface Laptop Ultra 专为开发者、创作者和技术专业人士设计的高性能笔记本电脑,已经于早些时候推出,两者共同代表 Surface 的下一步:为构建未来的人们打造专用设备。Surface RTX Spark Dev Box 将于今年晚些时候在美国上市,仅在 Microsoft.com 独家销售。
07 让设备运行 AI Agent 而非应用的新平台
微软应用科学部门负责人史蒂维·巴蒂什介绍了被称为 Project Solara 的内部项目。
这是一个从芯片到云的新平台,基于 Android 而非 Windows,旨在让设备运行 AI Agent 而非应用。巴蒂什解释其出发点:「界限正在崩塌。你不一定需要传统的应用模式。你不需要传统的方式来开发体验。」
首批两款概念设备已在 Build 大会上展示:

桌面中心设备,放在 PC 旁边,响应语音命令,通过面部识别登录用户,呈现当天最紧急的事项。连接显示器后可变成一台在云端运行的完整 Windows 机器。
可穿戴工牌设备,重新构想了标准员工 ID 卡。一键按下指纹即可唤醒 Agent,轻触可录制和转录对话,内置摄像头让 Agent 能根据用户所见采取行动。
在医疗保健演示中,这款工牌运行了为医护人员设计的 Agent,能扫描患者二维码、记录和转录就诊过程、记录生命体征并开出处方。在另一个应用中,内置摄像头扫描了写着办公室改造创意的头脑风暴板,并提出了添加绿植的建议。
巴蒂什表示,微软不会自己生产这些设备,而是设想硬件制造商和其他行业合作伙伴将这些参考设计转化为自己的产品,每个都针对特定行业、公司或场景。
08 量子芯片升级,可靠性提升千倍
微软还发布了下一代拓扑量子芯片 Majorana 2。

相比前代 Majorana 1,这次的核心变化是超导体材料从铝换成铅,这一调整使量子比特可靠性提升 1000 倍,平均量子比特寿命达到 20 秒,部分实例可持续一分钟。
其他技术路线的量子比特寿命通常仅微秒级。基于这一进展,微软将可扩展量子计算机的预期实现时间缩短一半,目前预计在 2029 年前达成。
该芯片的研发全程使用了 Microsoft Discovery 平台的 Agentic AI 能力。AI 智能体承担了制造管理、量子态自动化测量和跨学科数据分析等任务,将原本数周的测量周期压缩了几个数量级,并从近二十年积累的数据中识别出人类难以察觉的关联。
微软技术院士切坦·纳亚克说:「Agentic AI 几乎渗透到我们所做的一切事情中。」但他强调 AI 只提供指导,「始终是科学家在回路中」。
Microsoft Discovery 平台也于本次大会正式发布,这是一个面向前沿研发的组织级平台,允许研究人员部署由人类指导的自主 Agent 团队,进行假设生成、实验优化和理论验证。微软同时推出了 Microsoft Discovery 应用的早期预览版,个人可免费下载,使用 GitHub Copilot 账户在本地运行。
原文链接