在人工智能领域,衡量技术进步与商业价值的标准正经历一场深刻变革。meta公司曾推行一项名为“Claudeonomics”的内部竞赛,8.5万名员工在30天内消耗60万亿个计算单位(Token),其中排名首位的员工单月消耗量达2810亿个。这种以计算资源消耗论英雄的模式,暴露出行业普遍存在的认知偏差:将技术投入等同于实际产出,用成本指标替代价值评估。
这种评估体系的弊端在业务层面显现无遗。部分员工为追求排名,重复调用模型进行无效推理,导致算力资源严重浪费。更值得警惕的是,整个行业逐渐形成“Token消耗竞赛”的怪圈:企业比拼模型规模,厂商炫耀用户调用量,会议PPT充斥着天文数字般的计算量。这种逻辑与商业本质背道而驰——正如电力消耗不能直接反映企业盈利能力,计算单位的消耗量也无法准确衡量人工智能创造的实际价值。
行业转折点出现在2026年5月的百度AI开发者大会上。百度创始人提出“DAA”(Daily Active Agents,日活智能体数)概念,主张用智能体实际完成的任务量替代传统评估指标。这个转变并非孤立事件:Salesforce同期推出AWU(Agentic Work Units)标准,将单个智能体完成的全流程任务作为计量单位;Gartner研究报告明确指出,过度依赖Token消耗指标可能误导企业发展方向。
市场数据为这种转变提供有力支撑。以企业服务见长的Anthropic公司,其产品日活跃用户数仅为OpenAI的2%,但2026年5月年化营收达到440亿美元,较2024年增长43倍。这种反差揭示出人工智能商业化的本质规律:客户真正关注的是任务完成效率,而非模型调用规模。OpenAI内部人士透露,该公司正在调整评估体系,弱化用户规模指标,转向更注重实际产出的新标准。
新旧评估体系的差异体现在三个维度:传统DAU(日活跃用户)衡量的是用户注意力,Token消耗反映的是计算成本,而DAA关注的是智能体实际交付的业务成果。以财务报告生成为例,用户与AI的百次对话消耗的Token量,可能与智能体自动完成报告分析的消耗相当,但后者创造的价值显然更高。这种差异促使企业重新思考技术投入的产出效率。
技术架构的革新为新评估体系提供支撑。百度构建的完整技术栈包含四个关键层级:昆仑芯3万卡级集群提供算力基础,天池超节点解决扩容需求,文心5.1模型降低预训练成本,DuMate通用智能体平台实现应用落地。这种全栈布局确保智能体既能高效运行,又能保持经济性——预训练成本控制在行业平均水平的6%,为大规模部署创造条件。
智能体经济的爆发已现端倪。Gartner预测,到2026年底,40%的企业应用将嵌入任务型AI智能体。中国市场表现尤为突出,企业级智能体市场规模突破480亿元。用户手机中的导航、支付、推荐等智能体,数量早已超过通讯录联系人。这种趋势正在重塑生产力结构:个人通过多个智能体扩展能力边界,企业构建人机混合团队提升效率,智能体从辅助工具进化为独立生产力单元。
行业领导者已开始布局这场变革。谷歌在I/O开发者大会上推出“Agentic Gemini Era”战略,包含智能体编排框架、专用通信协议和定制芯片。百度提出的“自我进化”理念更具前瞻性:智能体从被动响应转向主动执行,人类从单兵作战升级为超级个体,企业组织架构演变为人机混合编队。这种变革预示着,最小生产力单元将不再是传统团队,而是“个人+智能体集群”的全新组合。








