2026.05.20 | APP 生态中心 · 行业日报
VOL.050
日报 DAILY

APP 生态中心 行业日报 · 2026.05.20

2026 年 5 月 20 日 · 周三 编辑 / Hermes
01工具箱动态Toolchain
头条 / TOP STORY

Cursor Composer 2.5:第一个"性能追平 Opus 4.7 / GPT-5.5,但价格不到 1 美元/任务"的编码模型

Cursor 5/18 发了自家的 Composer 2.5。基于 Moonshot 开源 checkpoint Kimi K2.5 训出来,定位是"长时间持续编码 + 复杂指令跟随"。和上一代相比有两个关键差异:(1) 基准跑分追平 Anthropic Opus 4.7 和 OpenAI GPT-5.5,但单任务成本压到 1 美元以下;(2) 训练数据合成任务量是 Composer 2 的 25 倍,配合"基于文字反馈的强化学习"做行为塑形。Cursor 同时公布:正在和 SpaceXAI 联合训练一个算力 10 倍的更大模型,从零开始。

简单说:自研模型从 Anthropic/OpenAI 的"用户"变成"竞争对手"——这条路 Cursor 是头部 IDE 里第一个走通的。

来源 / https://cursor.com/blog/composer-2-5

Anthropic × KPMG:把 Claude 推到 27.6 万员工,做了一件比"卖订阅"更狠的事

5/19 Anthropic 官宣和 KPMG 的全球战略联盟——138 个国家、276,000 名员工全员开通 Claude。但真正值得抠的是它的4 个落地姿势,每个都对应一个清晰的 B 端付费场景:

  1. 嵌进 Digital Gateway(KPMG 自己的客户工作台,跑在 Azure 上)——Claude Cowork + Managed Agents 直接进生产线,不用切窗口;
  2. 网络安全——Claude 帮 KPMG 找/修客户关键系统的漏洞,用 KPMG 的 Trusted AI 框架兜底;
  3. 私募股权 PE 优选合作伙伴——KPMG Blaze 把 Claude Code 塞进 PE 投资组合公司,加速 IT 现代化;
  4. KPMG 和 UT Austin 联合发了篇"human-in-the-loop"研究,明确说最大价值不来自技术接入,而来自员工对工作流的判断和重塑

💬 「Building an AI agent to help clients adjust to changing tax regulations used to take weeks. With Cowork and Managed Agents integrated in Digital Gateway, that same capability takes minutes.」 — Rema Serafi, KPMG US 税务副主席

编辑视角编辑视角: Anthropic 跟 PwC、KPMG 这种"几十万人专业服务公司"一家家拿,是非常聪明的 B 端打法——拿下一个咨询巨头,就等于通过它的客户网络渗透到无数大企业。对 Momcozy 也有镜像启发:B 端合作的"杠杆点"不是产品本身,是对方已经触达的工作流。如果未来要把母婴 AI 助手推到月子中心 / 母婴用品零售 / 妇产科诊所,应该想清楚——我们提供的不是 App,是"嵌进对方现有服务流"的能力。
来源 / https://www.anthropic.com/news/anthropic-kpmg
02今晚一个人Practitioner

How I AI 这周来的嘉宾是 Marily Nika——Google 的 AI 产品 lead。她在节目里没讲方法论,直接打开屏幕演示了一遍她做新产品概念的完整工作流——用一个"智能冰箱"的虚构 idea 当例子,20 分钟跑完了过去要几周的工作量

她的核心做法叫"Tool Hopping"(工具跳跃)——不依赖任何一个全能 AI,而是让每一步专门用一个最擅长的工具,前一步的输出直接当下一步的输入:

  1. 市场调研用 Perplexity 扒 Reddit 上用户的真实争论
  2. 生成 PRD用一个她自己训练的 custom GPT
  3. 做交互原型用 v0
  4. 拍给老板看的产品视频用 Flow + Sora

她在节目里抛了一个特别值得抄的小技巧:当你不想被 AI 哄着开心、想找一个 idea 的真实漏洞时——让 AI 创建两个对立观点的 agent,让它们针对你的 idea 辩论 20 轮,最后再提取"说服反对派需要的最小功能集"。这比一个 AI 自言自语稳定得多。

💬 「PMs who use AI will replace those who don't. AI 不会取代产品经理,但会用 AI 的 PM 一定会取代不会用的。」 — Marily Nika

编辑视角编辑视角: Marily 的工作流对中心总监级别有两个直接借鉴:(1) 不要押宝单一工具,建立"工作流地图"——你的团队里 PM/设计/调研/视觉每个人应该有"我这个环节最优解"的对应工具栈,不是统一一个 Claude 或 ChatGPT;(2) "对抗式 agent"应该立刻引进 Momcozy 的产品评审——下次评审 Kris 给的方案前,先让两个对立 agent 辩论 20 轮,把方案的脆弱点先暴露出来,再让人开会。
来源 / https://www.lennysnewsletter.com/p/this-week-on-how-i-ai-pms-who-use
03母婴 / FemTech 信号Vertical
赛道动态

Illinois 联手 Google + Drive Health,把"AI 母婴 agent"投到 5.6 万乡村妈妈手里

伊利诺伊州刚启动一个数字母婴健康试点项目:Drive Health(科技公司)+ Google Public Sector 一起,把一个AI agent 跑在云端边缘设备上,部署给 56,000 名乡村库克县的孕产妇。这群人的处境很尖锐——伊利诺伊三分之一的县属于"maternal care desert"(母婴医疗荒漠)——也就是没有正规产检/分娩资源。

这个 AI agent 做的事情远超"问答机器人":(1) 实时孕产健康咨询;(2) 管理用户的护理计划,提醒她按时跟进;(3) 直接下单基因筛查检测;(4) 预约疫苗接种。它不是给医生用的,是给妈妈本人用的。

编辑视角编辑视角: 这条信号有两层含义对 Momcozy 都很重要:(1) "政府/医疗系统主导的 maternal AI agent"已经在落地了——这意味着未来 2-3 年里,妈妈这个用户群对"AI 给我健康建议"的接受度会被官方动作大幅推高,对消费级母婴 AI 是免费的市场教育;(2) agent 的核心价值不在对话,在"主动管理 + 执行动作"(下单测试、预约、跟进计划)——这才是 agent 和 chatbot 的真正分水岭。Momcozy 母婴 AI 助手如果还停留在"问答"层面,会被一个能"帮你把事办了"的 agent 形态吃掉。
来源 / https://www.healthcareitnews.com/news/maternal-health-ai-agent-cloud-device-pilot-connect-rural-mothers-care
"
You don't get easier, you get more efficient — and then you use that efficiency to do more.」 「你没有变轻松,你变得更高效——然后你用多出来的效率去做更多的事。
Jenny Wen(Anthropic 设计主管),关于 AI 工作流的真实代价