小互 AI 日报 — 2026-06-13

2026-06-13 · 周六生成 10:34:03

覆盖源

172

条目数

92

高分 8+

13

主题簇

4

🌟 今日头条

Perplexity推出搜索即代码，AI搜索精度破百

Perplexity推出"Search as Code"架构，这是对AI代理如何执行搜索任务的根本性重新设计。不是推出新模型，而是将搜索能力从黑盒API调用转变为可组合的积木块，让AI代理可以根据不同任务自行编排。在230个网络安全漏洞检测基准上，Search as Code达到100%准确率，而包括GPT-5.5带网页搜索功能在内的竞品不足25%。最关键的是：token成本降低85%，意味着同样的工作用更少的API调用完成。这种基础设施层面的改进会悄悄改变什么样的应用在经济上可行。以前因为成本或延迟不可行的应用，现在变成了可行的生意。对创作者的启发：关注框架和架构的改进往往比单纯的模型升级更改游戏规则。当你看到AI系统被重新设计（而非只是参数变大）时，值得深入了解其背后的逻辑。

💬 编辑点评

不是新模型，是新搜索架构。token 成本砍 85%、精度碾压 GPT-5.5，这是 AI 应用经济学的拐点——推理能力已过剩，真正稀缺的是高效的决策流程。

深度解读

🔥今日要点

01

Claude Fable 5发布：性能与视觉能力突破

10/10 新产品

Anthropic发布了Claude Fable 5，这是其公开发布最强的模型。在SWE-Bench Pro基准测试中达到80.3%的成绩（相比GPT-5.5的58.6%），在多项任务上超越Opus 4.8超过10%。

02

开源模型集中爆发，一周发布25个覆盖全模态

10/10 行业分析

本周见证了迄今为止最密集的开源权重模型发布窗口，25个新模型在短短七天内推出，涵盖文本对话、图像生成、语音、音乐、视频和3D等所有主流模态。这反映了开源AI社区的蓬勃活力，也标志着模型民主化的新阶段。与此同时，proprietary模型的价格差距也在扩大。

03

美国政府出口管制禁令：暂停外国公民访问 Fable 5 和 Mythos 5

9/10 资讯

美国政府以国家安全为由发布出口管制令，禁止任何外国国民（包括美国AI公司的外籍员工）访问Fable 5和Mythos 5模型。这项禁令可能严重影响国际AI开发生态和Anthropic的全球运营。

阅读原文 →

04

Google Cloud发布开放知识格式：增强AI智能体的上下文能力

9/10 新产品

Google Cloud推出开放知识格式，为基础模型提供相关上下文以生成准确和可操作的结果。随着模型能力提升，上下文对智能体系统性能变得越来越关键。该格式增强了信息集成，提升了代码编写、文档分析和数据总结任务的质量。

阅读原文 →

05

Azure 容器应用沙箱：为 AI Agent 提供硬件隔离执行环境

9/10 新产品

微软推出 Azure 容器应用沙箱，让开发者能在硬件隔离环境中安全执行 AI Agent 生成的不受信任代码。沙箱启动极快（<1秒），支持大规模自动扩展，闲置时零成本。这是为 AI Agent 经济而生的基础设施方案，解决企业安全部署自主 Agent 的关键痛点。

阅读原文 →

06

Mistral AI融资30亿欧元：欧洲AI竞争升温

8/10 资讯

法国AI初创公司Mistral AI正洽谈30亿欧元融资，估值约200亿欧元。这笔巨额融资表明欧洲在培育独立于美国主导公司的AI竞争力上的坚定决心，反映了欧洲对本土AI企业的重视。

阅读原文 →

📊今日主题热点

📌 Anthropic Fable 5

新模型发布后面临透明度危机和美国出口管制禁令，引发行业关注

Claude Fable 5发布：性能与视觉能力突破 10

美国政府出口管制禁令：暂停外国公民访问 Fable 5 和 Mythos 5 9

Anthropic为隐瞒Claude Fable限制道歉，承诺实时透明化 8

美国政府指令Anthropic暂停最强模型Fable 5和Mythos 5访问 7

📌 AI融资与IPO热潮

Mistral融资30亿欧元，Anthropic和OpenAI IPO在即，掀起资本竞逐

Bezos的Prometheus融资12亿，要造AI工程师 8

Mistral AI融资30亿欧元：欧洲AI竞争升温 8

Mistral 融资 30 亿欧元，估值翻倍至 200 亿 7

AI 公司 IPO 热潮：Anthropic 和 OpenAI 领衔资本市场洗牌 7

AI 科技巨头 IPO 热潮，MANGOS 时代取代 FAANG 7

📌 Meta AI危机

6500人AI部门混乱，员工反对Zuckerberg Hackathon，组织陷入混沌

Meta 员工强烈反对 Zuckerberg 全公司 AI Hackathon 计划 5

Meta 6500 人 AI 部门陷入危机，员工面临灵魂摧毁环境 4

Meta 新 AI 部门混乱：员工的真实想法 4

📌 开源模型爆发

一周25+开源模型发布，Kimi、olmo、Ollama等发起攻防，与闭源模型竞争

开源模型集中爆发，一周发布25个覆盖全模态 10

Kimi 开源新编码模型，推理令牌减少 30% 8

Hugging Face发布olmo-eval：模型开发评估工具 6

Ollama v0.30.8 发布 4

📖值得深入

🕐 约 3 分钟 · 技术 8/10

Kimi 开源新编码模型，推理令牌减少 30%

💡 技术原理详实可引用

月球队 Moonshot AI 发布了新的开源编码模型 Kimi-K2.7-Code，相比前代版本速度更快、性能更智能、运行成本更低。这个模型的核心创新在于推理令牌使用减少了 30%——这是一个重大效率提升，直接降低成本并减少生成延迟。模型经过特殊训练来避免'过度思考'问题，即 AI 系统在推理编程问题时消耗过多令牌的现象。每个令牌都需要付费且增加计算延迟，所以在保持或提高输出质量前提下减少令牌消耗是重大突破。通过削减不必要的推理步骤，模型能更快、更便宜地提供相同或更好的代码建议。这使它成为开源项目和希望避免供应商锁定的开发者的有力竞争者，可与 GPT-4 或 Claude 等商业编码模型相匹敌。开源发布意味着开发者可以本地运行、针对特定用例微调，并受益于社区贡献。

🕐 约 3 分钟 · 观点/深度 7/10

讽刺故事：AI投资的数字游戏与虚高估值

💡 观点与论证值得借鉴

Andrew Singleton用一个讽刺故事（虚构的火葬场与丙烷公司投资）来批评AI行业如何夸大投资回报。这个比喻揭示了通过循环交易如何被操纵来制造虚假的巨额利润，反映了对AI投资真实收益和高估值的质疑。

阅读原文 →

🕐 约 3 分钟 · 行业分析 7/10

美国政府指令Anthropic暂停最强模型Fable 5和Mythos 5访问

💡 行业趋势与动态分析

美国商务部上周五以国家安全为由，要求Anthropic暂停所有外国国民（含公司内部外籍员工）对Fable 5和Mythos 5的访问。Anthropic已紧急对所有客户禁用这两个模型。起因是有人发现一种jailbreak可诱导模型提供本应拒绝的网络安全帮助。Anthropic认为政府未展示通用jailbreak，该技术范围狭窄，仅发现少量已知小漏洞，且其他公开模型也能提供类似能力。商务部长Howard Lutnick称这些模型将面临出口限制，直至美国政府强化国家安全系统（预计未来几周内）。Anthropic表示完美抵抗jailbreak目前任何模型都难以实现，并称此为误解，正努力恢复访问。其他Claude模型不受影响。

阅读原文 →

🕐 约 3 分钟 · 教程 7/10

如何在OpenRouter上获得最低成本的LLM推理

💡 可拆解成教程素材

在OpenRouter上追加`：floor`可获取最便宜提供商，通过`max_price`设定花费上限，并可免费使用20多个零成本模型。同时需注意避免计费陷阱。

阅读原文 →

🕐 约 3 分钟 · 教程 6/10

Hugging Face发布olmo-eval：模型开发评估工具

💡 可拆解成教程素材

Hugging Face发布olmo-eval，为模型开发循环设计的评估工作台。该工具为开发者提供框架来系统地评估模型，通过结构化评估流程提高迭代速度和模型质量。

阅读原文 →

📂按类别浏览

新产品

OpenAI推出三门新课程，教实用AI技能与工作流应用

7

OpenAI推出三门新课程，帮助用户掌握实用AI技能、建立可复用工作流和在日常工作中应用AI智能体。这些课程针对AI集成日益成为现代职场必需的现状。

阅读原文 →

OpenAI Codex推出灵活速率限制重置：打响AI定价战争

7

OpenAI为Codex用户推出灵活的速率限制重置功能，覆盖所有付费计划。用户可保存重置次数并手动触发，而非被迫等待固定时间，在达到使用上限时立即恢复使用。这项功能回应了AI竞争加剧下的定价问题。

阅读原文 →

Pinecone与Microsoft OneLake深度集成，企业AI agents直连公司数据

7

Pinecone宣布其Nexus知识引擎与微软OneLake集成，让企业AI agents能直接访问和推理公司内部数据。这一集成重塑了企业在专有数据上部署AI agents的方式，降低了接入难度。

阅读原文 →

观点/深度

Fable 的寓言：谁会写 Agent 循环，谁就赢下一轮知识工作革命

6

Anthropic 新发布的 Claude Fable 5 被 Every 媒体称为「迄今最强编程模型」，但 Every 创始人 Dan Shipper 认为，大多数知识工作者都低估了这款模型的真实价值。对普通用户来说，Fable 5 只是渐进升级——价格是旧版两倍，日常任务效果却没有质的飞跃。

阅读原文 →

Loopcraft：AI系统设计中的循环堆叠艺术

6

Latent Space介绍Loopcraft概念，由三位研究者提出，探讨AI系统中循环堆叠的艺术。这个概念深入研究了在AI智能体设计中构造递归和迭代流程的模式，提供了复杂控制流架构的洞察。

阅读原文 →

硅谷泡沫警告：OpenAI 和 Anthropic 的上市困境

6

评论者 Ed Zitron 警告，OpenAI 和 Anthropic 正在准备上市，但两家公司每年烧掉数十亿美元且无盈利路径。这反映出硅谷泡沫可能即将破裂，AI 商业模式的可持续性面临严峻挑战，投资者理性也值得质疑。

阅读原文 →

行业分析

AI行业的平台陷阱：Anthropic复制微软的垂直整合矛盾

7

Anthropic对Mythos模型进行功能限制，同时却在开发与大客户竞争的应用，引发了客户、合作伙伴和投资者的反对。这重演了微软历史上平台中立与自家产品竞争的矛盾，揭示了平台型AI企业内在的结构性冲突。

阅读原文 →

OpenAI 遭多州总检察长联合调查

5

OpenAI 正被一个由多州总检察长组成的联盟调查，该联盟已向这家人工智能公司索取涵盖广泛主题的信息。

阅读原文 →

美国反数据中心运动的真实原因：远不止中国干预

3

共和党议员和科技投资者将美国反数据中心运动归咎于中国干预，但专家认为真实情况更为复杂。本地环保诉求、电力供应压力和社区反对等多重因素同样重要，不能简化为地缘政治对抗。

阅读原文 →

技术

OpenAI 推出 Codex 速率限制重置银行功能

8

OpenAI 为 Codex 编码助手推出了新功能：用户现在可以银行和按需调度速率限制重置。过去，速率限制重置是自动执行的，常常在凌晨 3 点这样的不方便时刻触发，导致开发者无法在最需要的时候使用。现在用户可以主动触发重置，在进行大型代码重构或密集编程工作时使用。

教程

OpenAI WebRTC音频会话工具新增文档上下文功能

7

Simon Willison为他的OpenAI WebRTC音频工具添加文档上下文功能。该工具原本为测试OpenAI实时音频API而开发，新功能支持在音频会话中融入文档信息，提高了交互体验和工作流灵活性。

阅读原文 →

Anthropic首次公众调查：近半美国人盼AI治愈疾病，超六成担忧失业

7

Anthropic对近5.2万美国人调查显示：48%将治愈癌症等疾病列为首要期望，36%希望AI帮助残障人士。64%担忧AI导致失业，56%担忧认知依赖，52%担忧信息误导。超70%支持政府监管，最关注隐私（56%）、儿童安全（52%）和责任归属（49%）。仅15%信任AI公司决策。

阅读原文 →

NVIDIA Blackwell领跑Agent AI基准测试：每瓦特20倍性能提升

6

Agent性能测试AgentPerf是行业首个agent AI基准。NVIDIA Blackwell Ultra NVL72在首轮测试中领先，每瓦特运行的agent数量是上代产品的20倍，为企业agent AI基础设施树立新标准。

阅读原文 →

📭今天可以忽略

这些被自动过滤了。给你看看原因，免得你担心错过：

售价500美元的AI提示词免费公开：五阶段从技能到产品发布
→ 已写过且无新增事实
OpenAI WebRTC音频会话工具新增文档上下文功能
→ 已写过且无新增事实
OpenAI推出三门新课程，教实用AI技能与工作流应用
→ 已写过且无新增事实
Anthropic调查：超半数美国人担心因AI失业和失去独立思考
→ 已写过且无新增事实
OpenAI Codex推出灵活速率限制重置：打响AI定价战争
→ 已写过且无新增事实
AI行业的平台陷阱：Anthropic复制微软的垂直整合矛盾
→ 已写过且无新增事实
Claude Code v2.1.177版本发布
→ 已写过且无新增事实
Claude Code v2.1.176：会话本地化与凭证缓存优化
→ 已写过且无新增事实

📎 长尾信息 (55) · 点击展开

Gary Marcus批评：AI幻觉问题仍未解决 5

Databricks Lakebase：数据库分支功能助力进化式开发 5

Claude Code v2.1.176：会话本地化与凭证缓存优化 5

Claude Code v2.1.175：模型可用性管理增强 5

Google Angular发布Agent Skills库，增强AI代码工具的现代Angular编写能力 5

Apple新版Siri终于可用？语音助手大幅改进 5

Meta 员工强烈反对 Zuckerberg 全公司 AI Hackathon 计划 5

欧盟委员会回应 Siri AI 与 DMA 相关政策 5

Rocket Close 用 Agent AI 优化标题操作的实践 5

用 Amazon Quick 和 Cisco Webex MCP 构建会议助手 5

播客：Craig McLuckie 谈 AI 时代的团队文化 5

OpenAI 遭多州总检察长联合调查 5

售价500美元的AI提示词免费公开：五阶段从技能到产品发布 4

Claude Code v2.1.177版本发布 4

SpaceX IPO 全景报道与实时更新 4

Meta 6500 人 AI 部门陷入危机，员工面临灵魂摧毁环境 4

AWS 文档处理智能管线：用生成式 AI 从 PDF 提炼洞察 4

Slack从SSH迁移至REST架构，700+数据管道现代化改造 4

Oracle开源社区政策分化：OpenJDK禁用AI生成代码，GraalVM允许 4

Google官方：安全、立法多管齐下对抗AI诈骗 4

Meta 新 AI 部门混乱：员工的真实想法 4

开发者对自己的工具有情感依赖 4

Ollama v0.30.8 发布 4

美国反数据中心运动的真实原因：远不止中国干预 3

Databricks 员工访谈系列：从华尔街到数据平台 3

OpenAI Codex 0.140.0-alpha.17 版本发布 3

OpenAI Codex 0.140.0-alpha.16 版本发布 3

OpenAI Codex 0.140.0-alpha.15 版本发布 3

OpenAI Codex 0.140.0-alpha.14 版本发布 3

Cory Doctorow：Google 新远程认证方案同样有害 3

SpaceX 巨额 IPO：最新资讯汇总 3

GitHub Copilot CLI 如何优化任务委派的选择性 3

CherryScript：用自定义 Python 解释器优化数据驱动工作流 3

The Talk Show：WWDC 2026 现场直播 3

人形机器人对人类社会的影响 3

AWS专业服务团队：用AI重建交付流程，从月级到日级 2

Workflow SDK 现已在 Nitro v3 中原生运行 2

dotInsights | 2026 年 6 月 2

微软Project Ire识别LOTUSLITE恶意软件新样本 1

PeopleSoft 零日漏洞影响数百家机构，盗取数 GB 数据 1

MIT Download：衰老'重编程'与隐藏的内感受 1

你有自己的节奏 1

'重编程'为什么是目前最热的抗衰老方向 1

深入了解内感受：你身体如何感知自己 1

Mac 终于支持远程启动了 1

我不是'反向半人马' 1

深入 JetPride：JetBrains 员工如何建立 LGBTQIA+ 社群 1

如何制止管理层把团队逼入绝境 1

运营现代邮件系统需要大量人力成本 1

漏洞命名与披露联合指南 1

Google Cloud 最新动态 1

苹果 WWDC 2026 主题演讲 1

Intel 奔腾 FDIV bug 历史与产品召回 0

本周模拟计算古董记 0

如何用 HTML、CSS 和 JavaScript 构建大小写转换工具 0