原文标题:Big Ideas 2026: Part 1
原文作者: a16z New Media
编译:Peggy,BlockBeats
摘要:过去一年,AI 的突破已从模型能力转向 系统能力:理解长时序、保持一致性、执行复杂任务、与其他智能体协作。产业升级的重心也因此从单点创新,转向重新定义基础设施、工作流与用户交互方式。
在年度《Big Ideas》中,a16z 的四个投资团队分别从基础设施、增长、医疗健康与互动世界四个维度给出了 2026 年的关键洞察。
本质上,它们共同描绘了一个趋势:AI 不再是一个工具,而是一个环境、一套系统、一个与人类并行的行动主体。
以下为四大团队对 2026 年结构性变革的判断:

作为投资人,我们的工作就是深入科技行业的每一个角落,理解其运行脉络,判断下一步的演进方向。因此,每到十二月,我们都会邀请各投资团队分享他们认为来年科技创业者将要攻克的一个「大创意」。
今天,我们带来 Infrastructure、Growth、Bio + Health 以及 Speedrun 团队的观点。其他团队的看法将于明日继续发布,敬请期待。
Infrastructure 团队
Jennifer Li:初创公司将驯服多模态数据的「混沌」
非结构化、多模态数据一直是企业最大的瓶颈,也是尚未开发的最大宝库。每家公司都被 PDF、截图、视频、日志、邮件以及各种半结构化的「数据泥浆」淹没。模型越来越智能,但输入却越来越混乱——这导致 RAG 系统产生幻觉,使智能体以微妙且高成本的方式出错,也让关键工作流程仍高度依赖人工质检。
如今 AI 企业真正的限制因素是数据熵:在一个容纳了企业 80% 知识的非结构化世界里,新鲜度、结构性与真实性在持续衰减。
正因如此,解开非结构化数据的「乱麻」正在成为一代人的创业机会。企业需要一种持续的方法来清洗、结构化、验证并治理其多模态数据,从而让下游的 AI 工作负载真正发挥作用。应用场景遍布各处:合同分析、用户入职、理赔处理、合规、客服、采购、工程检索、销售使能、分析流水线,以及所有依赖可靠上下文的智能体工作流。
能够从文档、图像与视频中提取结构、调和冲突、修复数据流水线、保持数据新鲜可检索的平台型初创公司,将掌握企业知识与流程的「王国之钥」。
Joel de la Garza:AI 将重塑网络安全团队的招聘困境
过去十年里,CISO 最头疼的问题就是招聘。2013 到 2021 年,全球网络安全岗位缺口从不到 100 万飙升至 300 万。原因在于安全团队需要高度专业的技术人才,却让他们从事令人身心俱疲的一级安全工作,例如翻日志,而几乎没人愿意做这种工作。
问题更深的根源在于:网络安全团队自己制造了苦差事。他们购买「无差别侦测一切」的工具,因此团队不得不「审查一切」——这反过来制造了人为的「劳动力稀缺」,形成恶性循环。
2026 年,AI 将打破这一循环,通过自动化绝大部分重复与冗余任务,显著缩小人才缺口。任何在大型安全团队呆过的人都知道,一半的工作完全可以用自动化解决;问题是,当你每天都被工作淹没时,你根本无法抽身思考应该自动化什么。真正 AI 原生的工具将替安全团队完成这一点,让他们终于能把精力放回原本想做的事情上:追踪攻击者、构建系统、修复漏洞。
Malika Aubakirova:智能体原生基础设施将成为「标配」
2026 年最大的基础设施震荡不会来自外部,而是来自内部。我们正在从「人类速度、低并发、可预测」的流量,转向「智能体速度、递归、爆发式、海量」的工作负载。
当下的企业后端是为 1:1 的「从人类动作到系统响应」而设计的。它并不适合应对一个智能体的单一「目标」触发 5000 个子任务、数据库查询与内部 API 调用的毫秒级递归风暴。当一个智能体试图重构代码库或修复安全日志时,它并不像用户;对传统数据库或限流器来说,它更像一次 DDoS 攻击。
要为 2026 年的智能体工作负载构建系统,就必须重新设计控制平面。「智能体原生(agent-native)」基础设施将开始崛起。新一代系统必须将「惊群效应」视为默认状态。冷启动必须缩短,延迟波动必须收敛,并发上限必须以数量级提升。
真正的瓶颈将转向协调本身:在大规模并行执行中进行路由、锁控制、状态管理与策略执行。能在工具调用的洪流中生存下来的平台,才会成为最终胜者。
Justine Moore:创意工具全面走向多模态
我们已经拥有用 AI 讲故事的基本构件:生成式声音、音乐、图像与视频。但只要内容不止是一段短片,要取得接近导演级别的控制力,仍然耗时、痛苦、甚至不可能。
为什么不能让模型接收一段 30 秒的视频,让它用我们提供的参考图像和声音创建一个新角色,继续拍完同一场景?为什么不能让模型从新的角度「重拍」,或让动作匹配参考视频?
2026 将是 AI 真正实现多模态创作的一年。用户可以把任意形式的参考内容丢给模型,与它共同生成新作品,或编辑已有场景。
我们已经看到初代产品的出现,如 Kling O1 与 Runway Aleph,但这仅仅是开始——模型层与应用层都需要新的创新。
内容创作是 AI 的「杀手级应用」之一,我预计各类用户群体将出现多个成功产品——从 meme 制作者到好莱坞导演。
Jason Cui:AI 原生数据栈将继续迭代
过去一年,「现代数据栈」正在明显整合。数据公司从采集、转换、计算等模块化服务,走向捆绑与统一平台(如 Fivetran/dbt 合并、Databricks 的扩张)。
尽管生态系统更成熟了,但距离真正 AI 原生的数据架构,我们仍处在早期阶段。我们对 AI 如何继续改造数据栈的多个环节感到兴奋,并开始看到数据与 AI 基础设施正不可逆地走向深度融合。
我们尤其关注以下方向:
数据如何在传统结构化存储之外,继续流向高性能向量数据库
AI 智能体如何解决「上下文问题」:持续访问正确的数据语义与业务定义,从而让类似「与数据对话」的应用在多系统间保持一致理解
当数据工作流更智能体化、自动化后,传统 BI 工具与电子表格将如何演进
Yoko Li:我们将真正「走进视频的内部」

在 2026 年,视频将不再是一种被动观看的内容,而开始变成我们能够「走进去」的地方。视频模型终于能够理解时间、记住已经呈现的内容,并在我们做出动作时作出反应,同时保持一种接近现实世界的稳定与连贯,而不仅是输出几秒钟毫无关联的图像。
这些系统能够在较长时间里维持角色、物体与物理规律,使动作真正产生影响,让因果得以展开。视频因此从一种媒介,转变为一种可以构建事物的空间:机器人能够在其中训练,游戏机制能够演化,设计师能够进行原型实验,智能体能够通过「做事」来学习。
呈现出来的世界,不再像一段短视频,而像一个「有生命的环境」,开始缩小感知与行动之间的鸿沟。这是人类第一次能够真正「栖居」在自己生成的视频之中。
Growth 团队
Sarah Wang:企业的「记录系统」地位将开始动摇
2026 年,企业软件的真正变革将来自一个核心转向:记录系统的中心地位终于开始下降。
AI 正在压缩从「意图」到「执行」之间的距离:模型可以直接读取、写入并推理企业运营数据,使 ITSM、CRM 等系统从被动数据库转变为自主执行的工作流引擎。
随着推理模型和智能体工作流的快速进步,这些系统不再只是响应需求,而是能够预测、协调并执行端到端流程。
界面将变成动态的智能体层,而传统的系统记录层逐渐退居为一个「廉价的持久化存储」,战略主导权将让位于掌控智能执行环境的玩家。
Alex Immerman:垂直 AI 从「信息获取与推理」升级到「多人协作模式」
AI 推动垂直行业软件迎来爆发式增长。医疗、法律、住房领域的公司在短期内就突破了 1 亿美元 ARR;金融与会计也紧随其后。
最初的革命是信息获取:寻找、提取、总结信息。
2025 年带来了推理:Hebbia 解析财务报表、Basis 在多个系统间核对试算平衡表、EliseAI 诊断维修问题并调度供应商。
2026 年将解锁「多人模式」(multiplayer)。
垂直软件天然具备行业特定的界面、数据与集成能力,而垂直行业工作本质上是多方协作:买家、卖家、租户、顾问、供应商,各方权限、流程、合规要求各不相同。
今天,各方 AI 各自为战,导致交接点混乱无权威:分析合同的 AI 无法与 CFO 的建模偏好沟通;维修 AI 不知道现场人员对租户作出的承诺。
多人模式的 AI 将打破这一状况:自动在各方之间协调;维持上下文;同步变更;自动路由给功能专家;让对手方的 AI 在边界内协商,并将不对称之处标记给人类审核
当事务因「多智能体 + 多人类」的协作而提升质量时,切换成本就会飙升——这一层协作网络,将成为 AI 应用长期缺失的「护城河」。
Stephenie Zhang:未来的创作对象将不再是人类,而是智能体
到 2026 年,人们将通过智能体与网络交互,而面向人的内容优化方式将失去原有重要性。
我们曾为可预测的人类行为优化:谷歌排名;亚马逊前几项商品;新闻文章的 5W+1H 和吸睛开头
人类可能忽略埋在第五页的深度洞见,但智能体不会。
软件也将随之改变。应用过去是为人眼与点击设计的,优化意味着更好的 UI 与流程;而智能体接管检索与解释后,视觉设计的重要性下降:工程师不再盯着 Grafana,AI SRE 会自动解析遥测并在 Slack 中给出洞察;销售团队无需手动翻 CRM,智能体会自动汇总模式与洞察
我们不再为人类设计,而是为智能体设计。新的优化不再是视觉层级,而是机器可读性。这将全面改变内容创作方式与工具体系。
Santiago Rodriguez:「屏幕时长」的 KPI 将消失
过去 15 年,「屏幕时长」一直是衡量产品价值的金标准:Netflix 的观看时间;医疗系统中鼠标点击数;用户在 ChatGPT 停留的分钟数
但在即将到来的「按结果付费」(outcome-based pricing)的时代,屏幕时长将被彻底淘汰。
如今已初见端倪:ChatGPT 的 DeepResearch 查询几乎不需要屏幕时长,却提供巨大价值;Abridge 自动记录医患对话并处理后续工作,医生几乎不用看屏幕;Cursor 完成完整应用的开发,工程师已经开始规划下一阶段;Hebbia 自动从大量公开文件中生成 pitch deck,投行分析师终于能睡觉
挑战随之而来:企业需找到更复杂的 ROI 衡量方式——医生满意度、开发者生产力、分析师福祉、用户幸福度……这些都随 AI 上升。
能够讲出最清晰 ROI 故事的公司,将继续胜出。
Bio+Health 团队(生物与健康方向)
Julie Yoo:「健康 MAUs」成为核心用户群
2026 年,一个新的医疗用户群将走到舞台中央:「健康 MAUs」(每月活跃但未生病的健康人群)。
传统医疗主要服务三类人:
-Sick MAUs:高成本、周期性需求者
-Sick DAUs:如长期重症护理者
-Healthy YAUs:基本不就医的人
Healthy YAUs 随时可能变成 Sick MAUs/DAUs,而预防性护理原本可以延缓这一变化。但由于当前以「治疗为导向」的医保体系,主动检测和监测几乎不被覆盖。
健康 MAUs 的出现改变了这一结构:他们并不生病,却愿意定期监测自己的健康状况,是最大的潜在人群。
我们预计,AI 原生初创公司 + 传统机构的「再包装」都会加入,提供周期性健康服务。
随着 AI 让医疗交付成本下降,预防导向的保险产品出现,以及用户愿意为订阅服务付费,「健康 MAUs」将成为下一代健康科技最有潜力的客户群——持续活跃、数据驱动、以预防为导向。
Speedrun 团队(游戏、互动媒体与世界模型方向)
Jon Lai:世界模型将重塑叙事方式
2026 年,AI 世界模型将通过交互式虚拟世界与数字经济,彻底改变叙事。Marble(World Labs)与 Genie 3(DeepMind)等技术,能够从文本生成完整 3D 世界,让用户像玩游戏一样探索。
随着创作者采用这些工具,全新的叙事形式将出现——甚至可能诞生「生成版 Minecraft」,让玩家共同创造庞大、演化的宇宙。
这些世界将模糊玩家与创作者的边界,形成共享的动态现实。不同类型如奇幻、恐怖、冒险,可并列存在;其中的数字经济将繁荣,创作者能够通过制作资产、指导玩家、开发互动工具获得收入。
这些生成世界也将成为 AI 智能体、机器人乃至潜在 AGI 的训练场。世界模型带来的不仅是一个新游戏品类,而是一种全新的创意媒介与经济前沿。
Josh Lu:「属于我的一年」
2026 年将成为「我的一年」:产品不再面向「平均消费者」批量生产,而是为「你」量身定制。
在教育,Alphaschool 的 AI 导师为每位学生匹配其节奏与兴趣。
在健康,AI 为你定制补剂、运动计划、饮食方案。
在媒体,AI 让内容按你的口味实时重混。
过去百年的巨头靠找到「平均用户」获胜;下一个百年的巨头将靠找到「平均用户中的个人」获胜。
2026 年,世界将不再为所有人优化,而将为「你」优化。
Emily Bennett:第一所 AI 原生大学将诞生
2026 年,我们将看到第一所真正的 AI 原生大学——一个围绕智能系统从零构建的机构。传统大学已应用 AI 做评分、辅导、排课,但现在正出现一种更深层的变革:一所能够实时学习与自我优化的「适应性学术生物体」。
你可以想象这样一所大学:课程、指导、科研合作、校园运营都根据反馈循环实时调整;课程表自我优化;阅读清单随着新研究出现而动态更新;每个学生的学习路径实时变化
先例已经出现:亚利桑那州立大学与 OpenAI 的合作产生数百个 AI 项目;纽约州立大学将 AI 素养纳入通识教育
在 AI 原生大学中:
-教授成为「学习体系建筑师」:策划数据、调模型、教学生如何审视机器推理
-评估方式将转向「AI 觉知」评估:不是问学生是否用了 AI,而是如何使用 AI
随着各行业急需能够与智能系统协作的人才,这所大学将成为新经济的「人才引擎」。
[原文链接]