小互 AI 日报 — 2026-06-14

2026-06-14 · 周日生成 10:40:57

覆盖源

171

条目数

48

高分 8+

15

主题簇

4

🌟 今日头条

Anthropic发布Fable/Mythos 5：百万token上下文，性能翻倍

Anthropic推出两个新旗舰模型Claude Fable 5和Mythos 5。两者共享同一底层架构，区别在安全策略：Fable 5配备安全分类器可拒绝特定请求，Mythos 5无此限制但仅限Project Glasswing项目内授权组织使用。核心突破是百万token上下文窗口（默认100万），最高支持128K输出token——远超Opus 4.8。定价为输入token每百万$10、输出每百万$50，是Opus的双倍。智能推理（Adaptive Thinking）默认开启、不可禁用，支持调整推理深度。独特之处是强制30天数据保留政策（Anthropic首次）和自动降级重试机制——拒绝请求自动转向其他Claude模型，避免重复计费。现已上线Claude API、AWS/Google/Microsoft等云平台。

💬 编辑点评

百万 token 和双倍价格是同比增长，但关键是 Adaptive Thinking 能否真正提升推理质量。对需要长上下文的专业用户有吸引力，普通创作者实际应用场景有限。

产品动态

🔥今日要点

01

苹果WWDC发布全新Siri AI：深度整合个人上下文和跨应用操作

10/10 新产品

苹果在WWDC 2026发布全新设计的Siri AI，称为有史以来最智能、最博学版本。新Siri深度整合iPhone、iPad、Mac、Apple Watch和Vision Pro，核心能力包括：根据用户消息、邮件、相册抽取个人上下文；跨应用执行操作；理解屏幕内容并解答问题；获取实时网络信息。

02

Pyodide 314.0 发布：WASM 轮子可直接发布到 PyPI

9/10 教程

Pyodide 314.0 现在支持将为其构建的 Python 包直接发布到 PyPI，基于 PyEmscripten 平台标准（PEP 783）。这简化了与网络 Python 运行时兼容的包的分发流程，让开发者更便捷地共享和安装跨平台 Python 包。

阅读原文 →

03

Google Gemini-SQL2 在文本转 SQL 基准测试中大幅领先

9/10 新产品

Google Research 基于 Gemini 3.1 Pro 开发的 Gemini-SQL2，在 BIRD 文本转 SQL 基准测试中达到 80.04% 准确率，大幅超越 OpenAI 和 Anthropic 的方案。

阅读原文 →

04

微软 SkillOpt：用 Markdown 文件优化 GPT-5.5 性能

9/10 教程

微软与三所中国大学联合开发的 SkillOpt，通过优化 AI 代理的指令文档来提升性能。该方法只需训练格式化的 Markdown 文件，就能增强 GPT-5.5 的能力。这是一种简洁而有效的代理优化方案，对构建更强的 AI 系统有参考价值。

阅读原文 →

05

Claude Fable 5 在 FrontierMath 难题上超越 GPT-5.5

9/10 新产品

Anthropic 的 Claude Fable 5 在 FrontierMath 最难难度级别上达到 88% 准确率，相比 Opus 4.5（2026 年初不足 10%）有巨大提升，超过 GPT-5.5 的 75%。

阅读原文 →

06

Kimi K2.7 Code 发布：万亿参数开源模型，成本低至竞品 1/12

9/10 新产品

月之暗面 Moonshot AI 发布的 Kimi K2.7 Code 是一个万亿参数的开源模型，专为编程任务设计。虽然在编码基准测试上落后于 GPT-5.5 和 Claude Opus 4.8，但成本仅为前者的 1/12。这为成本敏感的开发者和企业提供了经济的 AI 编程方案选择。

阅读原文 →

📊今日主题热点

📌 Claude Fable 5政策风波

Anthropic新模型发布后遭美国政府禁用的完整事件链

Anthropic发布Fable/Mythos 5：百万token上下文，性能翻倍 10

Claude Fable 5 在 FrontierMath 难题上超越 GPT-5.5 9

亚马逊安全研究报告促发白宫禁令，Anthropic Fable 5 遭封杀 9

Anthropic 的安全警告适得其反——美国政府停用 Claude Fable 5 7

Anthropic 遵守美国政府命令下线 Claude Fable 5 7

📌 消费端AI芯片厂商出击

苹果/Google在WWDC/iOS推进AI能力落地应用

苹果WWDC发布全新Siri AI：深度整合个人上下文和跨应用操作 10

Google Gemini-SQL2 在文本转 SQL 基准测试中大幅领先 9

Apple iOS 27：AI 照片编辑工具首次亮相 7

我用 Gemini 快速原型了个草坪护理应用 5

📌 开源模型与生态竞争

Kimi K2.7、WebMCP标准、LangChain等开源工具的融资与迭代

Pyodide 314.0 发布：WASM 轮子可直接发布到 PyPI 9

Kimi K2.7 Code 发布：万亿参数开源模型，成本低至竞品 1/12 9

Terraform MCP Server 正式发布：AI 助手与基础设施交互 9

WebMCP 标准进入 Chrome 原点试验：浏览器 AI agent 新时代 9

开源 AI 必须获胜 4

OpenAI Codex 0.140.0-alpha.19 版本发布 3

OpenAI Codex 0.140.0-alpha.18 版本发布 3

📌 AI代理框架与生产力工具

Databricks/Terraform/LangChain等框架的agent管理与成本优化

微软 SkillOpt：用 Markdown 文件优化 GPT-5.5 性能 9

Databricks 推出 Omnigent：AI 代理的统一管理平台 9

Terraform MCP Server 正式发布：AI 助手与基础设施交互 9

EP218：典型 AI 代理栈详解 6

Mastra vs LangChain：AI 代理框架对比与实战 6

/architect：减少80%的Fable token，Fable负责协调/审核，Codex负责构建 5

📖值得深入

🕐 约 3 分钟 · 观点/深度 9/10

白宫 AI 政策混乱：为什么州政府开始自行其是

💡 观点与论证值得借鉴

Gary Marcus 批评白宫的 AI 政策执行混乱，讨论为什么各州开始独自制定 AI 监管政策。这反映了联邦层面协调的不足，以及建立更一致的国家 AI 战略的必要性，对理解美国 AI 治理碎片化现状有参考价值。

阅读原文 →

🕐 约 3 分钟 · 观点/深度 7/10

微软CEO纳德拉坦承也"沉迷" Token 最大化

💡 观点与论证值得借鉴

微软CEO纳德拉警告企业不要"Token最大化"（无差别地对所有任务使用最强大的AI模型）。他强调边际生产力收益必须与Token成本相匹配，主张更智慧、更选择性的AI使用。但纳德拉坦诚自己也无法抗拒这一诱惑，称其"令人上瘾"。他的观察深刻地揭示了成本控制与强大AI便利性之间的矛盾，反映了企业在AI成本急剧攀升时面临的普遍困境。

阅读原文 →

🕐 约 3 分钟 · 教程 6/10

luau-wasm 0.1a0 发布

💡 可拆解成教程素材

luau-wasm 0.1a0 发布，为 WebAssembly 环境引入 Lua 编程语言。这个早期版本让开发者可以在浏览器应用和其他 WASM 运行时中使用 Lua，扩展了 Lua 的应用场景。

阅读原文 →

🕐 约 3 分钟 · 教程 6/10

EP218：典型 AI 代理栈详解

💡 可拆解成教程素材

详解 AI 代理系统的典型技术栈，包括核心层次和架构设计。讨论生产环境中最难实现的模块，如推理引擎、内存管理、工具集成等。帮助开发者理解 AI agent 的实战构建过程和关键设计决策。

阅读原文 →

🕐 约 3 分钟 · 教程 6/10

Mastra vs LangChain：AI 代理框架对比与实战

💡 可拆解成教程素材

详细对比 Mastra 和 LangChain 两大 AI 代理框架。作者基于 Mastra 构建的生产级 AI 支持平台 SupportMesh，分享实战经验，包括循环流程、类型化步骤设计等核心开发模式，帮助开发者选择合适的代理框架。

阅读原文 →

📂按类别浏览

新产品

Databricks 推出 Omnigent：AI 代理的统一管理平台

9

Databricks 推出的 Omnigent 是一个元框架，用于大规模组合、控制和共享多个 AI 代理。该工具帮助团队编排代理、管理代理交互、跨环境部署代理，简化了多代理 AI 应用的开发和部署流程。

阅读原文 →

Terraform MCP Server 正式发布：AI 助手与基础设施交互

9

HashiCorp 正式发布 Terraform MCP Server，允许 AI agents 通过 Model Context Protocol 与 Terraform 基础设施交互。这一集成使 AI 助手能自动化基础设施管理任务，减轻工程师的重复工作。

阅读原文 →

Suno 音轨分离：从零生成更纯净

9

重大更新：Suno 的音轨分离刚刚大幅升级。🚀 我们现在从零重新生成音轨，而非仅仅隔离频率。结果如何？纯净无伪影的音轨，可直接拖入你的 DAW。

阅读原文 →

观点/深度

开源 AI 必须获胜

4

一篇观点文章，主张开源 AI 必须成为行业主流力量，以确保广泛可用性、防止垄断、推动社区创新。详情见原文。

阅读原文 →

Andrew Yang：降低生活成本是下一个创业风口

3

前政治人物 Andrew Yang 认为降低美国人的生活成本——包括住房、食品、通信等高消费领域——将是下一波创业浪潮的主要机会。他指出这些市场存在巨大的优化空间。

阅读原文 →

Cory Doctorow 周刊：股东至上主义与科技社会

2

知名技术评论家 Cory Doctorow 的周刊专栏，涵盖股东至上主义、数字所有权、企业问责、劳工权利等多个话题。内容从微软与开源之争到工人权利和知识产权等。

阅读原文 →

行业分析

亚马逊首席执行官与美国官员会谈引发对 Anthropic 模型的整治

7

亚马逊 CEO 与美国官员的会谈直接导致美国政府对 Anthropic 公司的 AI 模型采取整治行动。此次事件涉及对 Anthropic 旗下大语言模型的监管升级，具体措施及模型版本细节尚未披露。

阅读原文 →

生成式 AI 在电影制作中的真实进展：超越营销噪音

6

虽然生成式 AI 在电影产业的潜力备受关注，但目前还没有推出令人信服的 AI 电影作品供大众观看。大多数 AI 视频模型仅能生成短视频片段，远达不到电影级制作标准，暴露了 AI 在创意产业应用的现实瓶颈。

阅读原文 →

教程

SQLite 查询结果列源表映射研究

7

研究如何将 SQLite 查询结果的列映射回其源表信息。该工作探索了在 Datasette 中如何为任意 SQL 查询增加元数据，显示结果包含了哪些表的哪些列，增强查询透明度和数据血缘追踪能力。

阅读原文 →

我用 Gemini 快速原型了个草坪护理应用

5

作者用 Gemini API 在短时间内快速构建了草坪护理应用原型。虽然遇到 bug，但 AI 能立即提供修复建议，展示了生成式 AI 在个人快速迭代开发中的实际应用价值和开发效率提升。

阅读原文 →

/architect：减少80%的Fable token，Fable负责协调/审核，Codex负责构建

5

/architect项目将Fable token减少80%，由Fable进行协调和审核，Codex负责构建任务。

阅读原文 →

📭今天可以忽略

这些被自动过滤了。给你看看原因，免得你担心错过：

OpenAI秘密申报IPO，AI巨头融资竞速升温
→ 已写过且无新增事实
SQLite 查询结果列源表映射研究
→ 已写过且无新增事实
Amazon CEO 可能是 Anthropic 模型限制的举报人
→ 已写过且无新增事实
OpenAI 遭州总检察长联合调查
→ 已写过且无新增事实
我用 Gemini 快速原型了个草坪护理应用
→ 已写过且无新增事实
开源 AI 必须获胜
→ 已写过且无新增事实
OpenAI Codex 0.140.0-alpha.19 版本发布
→ 小版本号 alpha/beta/rc 发布，无新功能
OpenAI Codex 0.140.0-alpha.18 版本发布
→ 小版本号 alpha/beta/rc 发布，无新功能

📎 长尾信息 (15) · 点击展开

我用 Gemini 快速原型了个草坪护理应用 5

/architect：减少80%的Fable token，Fable负责协调/审核，Codex负责构建 5

开源 AI 必须获胜 4

Python 框架剖析地缘政治风险对金融市场的影响 4

OpenAI Codex 0.140.0-alpha.19 版本发布 3

OpenAI Codex 0.140.0-alpha.18 版本发布 3

Construction Physics 阅读列表（06/13/2026） 3

Andrew Yang：降低生活成本是下一个创业风口 3

AWS CDK Mixins：可组合的基础设施抽象 3

Vercel Blob 存储：Hobby 用户配额提升 3

互联网大规模平台如何处理百万级日交易 3

Node.js 中的 Saga 模式：分布式事务回滚 3

Intel 8087 浮点芯片的 69 位加法器核心 3

Cory Doctorow 周刊：股东至上主义与科技社会 2

用 JavaScript 构建浏览器端 PDF 裁剪工具 2