小互 AI 日报 — 2026-06-05

2026-06-05 · 周五生成 10:32:49

覆盖源

182

条目数

553

高分 8+

23

主题簇

4

🌟 今日头条

谷歌推Dreambeans，用AI把日常数据变成插图故事

Google Labs推出Dreambeans应用，通过AI自动扫描用户Gmail、Google相册和日历数据，生成包含AI插图的日常故事。这款应用的核心创新是将用户零散的邮件、日程、照片等数据点转化为具有完整叙事结构（开始、中间、结尾）的短故事，用AI插图呈现，大幅改善传统通知系统的冗余感。相比邮件摘要和推送通知，Dreambeans把冷冰冰的信息处理转化为温暖的故事叙述。产品名称"梦豆"结合了梦幻和轻松的内涵，充满创意。应用本质上是对日常信息管理的重新想象，让每日的日历、邮件、相册变成一部个人日报故事。虽然上线范围和定价细节尚未明确，应用目前已通过Google Labs推出。这次发布体现了Google在AI个性化和叙事生成方向的持续探索，展示AI如何将琐碎日常数据转化为引人入胜的内容形式，可能吸引希望获得更有条理和视觉丰富的信息体验的用户。

💬 编辑点评

浪漫创意，但问题在于：用户真的需要故事化通知而非快速扫描吗？将碎片数据装裱成短篇，对忙碌创业者反而是低效的信息摄取。

阅读原文 → 产品动态

🔥今日要点

01

Instagram AI工具被黑客利用接管账户，Meta修复安全漏洞

10/10 行业分析

Instagram的AI客服工具存在严重安全漏洞，黑客利用该漏洞绕过账户恢复保护机制。攻击者通过欺骗AI系统来改变目标账户绑定的邮箱地址，然后利用Instagram的密码重置流程接管账户。一些黑客使用VPN伪造地理位置，使其看起来与账户持有人在同一国家。

阅读原文 →

02

Spiral 4.0上线：新样式引擎、按Token计费、原生Agent支持

10/10 新产品

Every推出Spiral 4.0重大更新，这个AI写作工具引入了从想法到润编的全流程语音优先起草功能。新版本包含新的MCP（模型上下文协议），与现有的CLI和API一起使用，使任何Agent或工作流都能以你的风格进行创作。团队功能得到扩展，支持在工作区中共享样式、提示词、知识库、聊天记录和草稿。

阅读原文 →

03

NVIDIA Nemotron 3 Ultra 在 AI Gateway 上线

9/10 资讯

Nemotron 3 Ultra from Nvidia is now available on Vercel AI Gateway . Nemotron 3 Ultra is an open Mixture-of-Experts reasoning model built for orchestr…

阅读原文 →

04

Nemotron 3.5 Content Safety：面向全球企业AI的可定制多模态安全

9/10 新产品

Nemotron 3.5 Content Safety基于Gemma 3 4B IT，提供128K上下文窗口，支持用户提示、可选图像与助手响应的统一多模态安全评估。新增自定义策略执行，允许企业用自然语言定义专属安全规则；THINK模式可输出可审计的逐步推理痕迹。

阅读原文 →

05

苹果宣布 App Store 14 万亿美元交易额，90% 无需分成

9/10 资讯

Apple's App Store generated $1.4 trillion in sales, up from $1.3 trillion last year, with $149 billion in sales for digital goods.

阅读原文 →

06

数据驱动对话文化如何支撑平台工程

9/10 资讯

To provide SRE as a service, a team built a center of excellence, introducing Federated SREs and roles like production manager and technical tribe lea…

阅读原文 →

📊今日主题热点

📌 生图工具版本竞速

Reve、Ideogram、Dreambeans、Grok等多家AI公司同周密集推出或更新图像生成工具，竞争升温。

谷歌推Dreambeans，用AI把日常数据变成插图故事 10

Reve 2.0与Ideogram 4.0同日发布，图像生成迎来精准布局时代 8

xAI 更新 Grok Imagine 至 1.5 版本，新增 720p 图像转视频功能 7

📌 ChatGPT个性化升级

OpenAI围绕用户记忆、偏好存储和长期交互能力进行功能迭代，打造更贴身的AI助手。

OpenAI API 新增内容审核评分 9

ChatGPT 新增 Dreaming 内存系统，跨对话保留用户偏好 7

ChatGPT 按工作/爱好/旅行偏好分类存储用户档案 7

Sam Altman：「主动 AI」是 ChatGPT 后的下一个阶段 7

📌 Google AI助手完善

Google强化NotebookLM和Gemini在记录、游戏和系统集成方向的功能更新，布局AI助手生态。

Google Gemini Mac 应用：原生应用但过度推荐 9

NotebookLM 来源归属功能上线 9

Gemini macOS 双击 Command 附加活动窗口 9

NotebookLM 推出福尔摩斯游戏笔记本 9

📌 Agent框架升级浪潮

Spiral、OpenProse、Replit、Claude Code等开发工具和框架齐发，加强Agent能力和开发体验。

Spiral 4.0上线：新样式引擎、按Token计费、原生Agent支持 10

OpenProse开源：让AI智能体工作流行为可重复可审查 9

Replit Agent 联手 Shopify 快速建店 9

Claude Code v2.1.163 发布：版本管理和插件管理功能 7

📖值得深入

🕐 约 3 分钟 · 观点/深度 7/10

AI 热情者vs怀疑者：不同视角下的软件构建赛跑

💡 观点与论证值得借鉴

观点指出 AI 圈内两类人的紧张关系：热情者急于追赶 AI 能力演进，怀疑者关注工程可持续性。两种观点都有道理，关键是如何在加速和稳妥之间找平衡。

阅读原文 →

🕐 约 3 分钟 · 观点/深度 7/10

ChatGPT 按工作/爱好/旅行偏好分类存储用户档案

💡 观点与论证值得借鉴

ChatGPT 新内存功能按工作、爱好、旅行偏好等建立条理化用户档案。信息保持最新的成功率从 52.2% 提升到 75.1%，迭代效果明显。

阅读原文 →

🕐 约 3 分钟 · 观点/深度 7/10

Sam Altman：「主动 AI」是 ChatGPT 后的下一个阶段

💡 观点与论证值得借鉴

Sam Altman 预测「主动 AI」是 ChatGPT 之后的下一个产品阶段——AI 不再被动等待提示，而是在后台主动运行、自主行动。这反映 AI 产品形态的演进方向。

阅读原文 →

🕐 约 3 分钟 · 教程 7/10

Alex Imas 和 Phil Trammell：AGI 后什么仍然稀缺？

💡 可拆解成教程素材

经济学家 Alex Imas 和 Phil Trammell 指出，AGI 时代机器人数量可以快速复制增长，但人类独特技能（以芭蕾舞演员为例）的数量保持不变，揭示了即使技术大幅进步，某些稀缺资源仍不可替代。

阅读原文 →

🕐 约 3 分钟 · 教程 7/10

马斯克谈SpaceX上市：正处大规模资本扩张期

💡 可拆解成教程素材

马斯克在JPMorgan活动上回应SpaceX上市问题：他已被建议上市近10年，自2014-2015年起SpaceX就已实现正现金流并自筹资金，之前的私募轮次实际是面向投资者和员工的流动性/回购轮次。当前不同之处在于SpaceX正进入显著资本增长阶段，计划发射约10万颗通信卫星（可能超10万颗），AI和机器人对带宽需求巨大，还将在太空中建设AI数据中心，马斯克认为这将成为AI扩张的主要手段。

阅读原文 →

📂按类别浏览

新产品

OpenProse开源：让AI智能体工作流行为可重复可审查

9

OpenProse是开源编程语言，让你用纯英文指定多智能体工作流，直接解决AI自动化的采纳障碍。不同于需要定制代码的传统框架，OpenProse利用语言模型解释人类可读规范。这直击使用Claude Code和Codex团队的真正痛点：不是智能，而是可靠性和可信度。

阅读原文 →

NotebookLM 来源归属功能上线

9

今天，我们推出又一项呼声很高的功能：来源归属！🥳 无需再猜测。现在你可以看到每个创作物背后所用的确切公式（提示词 + 来源）。想要调整？只需轻点"迭代"，随心定制 💖

阅读原文 →

Gemini macOS 双击 Command 附加活动窗口

9

使用适用于 macOS 的 Gemini 应用，获取针对屏幕内容的定制帮助。💻 只需同时按下两个 Command ⌘ 键，即可将当前活动窗口无缝附加到聊天中，无需手动截图或切换标签页。

阅读原文 →

观点/深度

脑部基础模型的预测困境：为什么线性模型击败亿级参数模型

6

研究发现在 fMRI 脑部数据上预训练的大型脑部基础模型，预测人类认知表现时反而不如简单线性回归。模型越大问题越严重，说明当前的脑部大模型遗漏了脑信号中的关键统计特征。

阅读原文 →

树状结构模型：人-AI 交互中的互补性形式化

6

研究用树状结构形式化描述人与 AI 协作中的互补性：什么情况下人-AI 组合会超过彼此单独能力。这是学术工作，对多智能体系统设计有理论指导意义。

阅读原文 →

AI 研究的真伪之灾：为什么 SOTA 声称需要更强证据

6

论文指出 AI 研究中广泛存在的问题：SOTA（最先进）声称通常用简单基准聚合分数支撑，而这些证据往往不足以支持这些强势说法。这是对整个研究社区的方法论反思。

阅读原文 →

行业分析

Nemotron Parakeet ASR 印尼语准确率达 97.7%

7

当法律和监督依赖于转录内容时，70-80% 是不够的。 http：//Rafiqspace.ai 通过微调 Nemotron Parakeet ASR 达到了 97.7% 的印尼语准确率（2.3% WER）-- 优于全球工具，同时每小时成本降低高达 90%。⚖️

阅读原文 →

技术

Google Research 发布被动心率监测系统 PHRM

7

Google Research 开发了一种被动心率监测系统（PHRM），利用智能手机前置摄像头在日常使用中（人脸解锁后数秒内）捕捉面部视频，通过深度学习估算心率，平均绝对百分比误差（MAPE）低于10%（对比心电图金标准），满足各肤色人群的行业精度标准。

阅读原文 →

教程

「Reality: Final Eval」：Andon Labs 评估 Claude 全系列模型的方法论

7

Andon Labs 分享从零构建 Claude 模型评估体系的方法论，覆盖 Haiku 到 Mythos 全系列。这是 AI 评估领域的专业讨论，对开发者有参考价值。

阅读原文 →

共存与协同智能的终结

7

Ethan Mollick 在 One Useful Thing 博客中，以"共存与协同智能的终结"为题，并附带介绍了如何向 AI 推销一本书。

阅读原文 →

Boson AI 与 LMSYS 发布基于 SGLang-Omni 的 Higgs Audio v3 TTS 端到端服务

7

Boson AI 与 LMSYS 联合推出基于 SGLang-Omni 推理框架的 Higgs Audio v3 TTS 端到端服务。该模型约 4B 参数，基于 Qwen3-4B 骨干，支持 100 种语言（内部评测覆盖 111 种），在 Seed-TTS、CV3、MiniMax-Multiling…

阅读原文 →

📭今天可以忽略

这些被自动过滤了。给你看看原因，免得你担心错过：

脑部基础模型的预测困境：为什么线性模型击败亿级参数模型
→ 单源论文，缺普通读者价值
OckBench：衡量大模型推理的真实成本差异
→ 单源论文，缺普通读者价值
树状结构模型：人-AI 交互中的互补性形式化
→ 单源论文，缺普通读者价值
Muon 优化器的缩放规律：大模型训练的隐藏瓶颈
→ 单源论文，缺普通读者价值
LCSHBench：跨 15 种语言的高质量图书馆分类数据集
→ 单源论文，缺普通读者价值
QuBLAST：分块量化让大模型跑进嵌入式设备
→ 单源论文，缺普通读者价值
Isabelle/HOL 的自动化证明助手：Abduction Prover
→ 单源论文，缺普通读者价值
多列 RBF 神经网络：粒子群优化方法对比
→ 单源论文，缺普通读者价值

📎 长尾信息 (214) · 点击展开

学术论文：Dual Advantage Fields 强化学习新方法 5

核方法中连续属性的机器学习公平性投影 5

为你的 Go 应用赋能 Tigris 功能 5

IPv6 Zones 在 URL 中是个设计失误 5

EVA-Bench 2.0 发布：3 大领域、121 个工具、213 个场景 5

NVIDIA GeForce NOW 六月新增 18 款云游戏 5

在 Flax 中使用 Safetensors 5

在 Replit 上构建自定义 Shopify 店铺 5

共识不足：推理轨迹分歧作为知识表示信号 5

StepPRM-RTL：LLM芯片综合微调的流程奖励指导 5

人机协作证明形式化工作流的初期特征分析 5

自主智能体干预时机的饱和陷阱与失效分析 5

Trivium：因果记忆控制器的时间遗憾优化框架 5

SCI-PRM：科学推理验证的工具感知流程奖励模型 5

成本分割学习法在启发式搜索中的应用 5

ASP合规推理的规范中间表示方法 5

诺亚方舟知识索引 5

从具体到抽象：为普通公众解析人工智能 5

机器如何学习？AIcon2abs 方法评估 5

三维场景中无人水下航行器噪声谱预测的神经方法 5

布尔任务代数中任务组合的目标集表征 5

TPA-AD：轴承时间序列异常检测的两阶段伪异常引导方法 5

HighTide：开源 VLSI 芯片设计基准测试套件 5

智能交通不用神经网络：强化学习在地铁网络规划中的应用 5

MimeLens：位置无关的二进制文件类型检测工具 5

PerceptTwin：LLM 迭代规划的语义场景重建方案 5

支持性 Token 揭示：快速扩散语言模型解码优化 5

EReL@MIR 2025多模态文档检索挑战赛概览（赛道1） 5

从运动信号到洞察：体育课学生行为分析反馈统一框架 5

神经强化学习在连续环境中的动力学分析 5

损失函数之外：对比学习中的采样条件与归纳偏差 5

轻量级结构引导自回归模型的图生成规模化方案 5

衡量关键指标：概念瓶颈模型的合成基准测试 5

HYolo：基于超图学习的智能物联网目标检测系统 5

选择性耦合信息区域：ViT 数据无关量化的遮蔽注意力对齐 5

DSIRM：电商相关性建模的查询桥接离散语义标识符学习 5

TITAN-FedAnil+：资源受限企业的信任自适应区块链联邦学习 5

规模不变 Transformer 的低秩衰减 Grokking 频谱几何分析 5

Token 排序作为不可伪造的语言模型签名 5

ParetoPilot：无代理离线多目标优化的推理-扰动-引导扩散方案 5

自适应校准：公平高效的人脸识别系统 5

视觉文本生成中的推理保真度评估 5

黑暗中的智能推理：元认知枢纽追踪强化学习优化 5

将流量视为树：加密流量分析的语义保留层级图专家框架 5

QO-Bench：类型化事件元组检索的查询-算子保留诊断基准 5

轻量级边框预测器增强 MedSAM：医学图像分割优化 5

CoRe-MoE：对比重权专家混合实现多地形人形机器人运动自适应 5

不确定性感知神经网络处理器端到端协设计：从训练到流片 5

组合搜索的经验可行神经启发式学习 5

DiverAge：跨年龄身份关系引导的多样化人脸老化合成 5

M³Eval：基于认知视频任务的多模态记忆评估 5

GeM-NR：几何感知多视图非刚性场景编辑 5

MLLMs能否完成分子级结构解毒 5

约束自适应拒绝采样 5

BRAINCELL-AID：社区标注脑细胞类型资源 5

MedForge：基于伪造感知推理的可解释医疗Deepfake检测 5

Agent工具协议的形式化语义：过程演算方法 5

二值脉冲神经网络作为因果模型 5

CounterFace：人脸识别系统细粒度反事实评估数据集 5

LaVIDE：语言驱动卫星影像变化检测与地图对齐 5

模型保留自适应舍入 5

语音分离中尺度不变信号失真比研究 5

BioBlue：生物经济对齐AI安全基准中LLM的失控优化失败模式 5

方差门控分布的不确定性估计 5

ClustRecNet：聚类算法推荐的端到端深度学习框架 5

Platonic Transformers：等变性的坚实选择 5

单纯形嵌入提高Actor-Critic Agent采样效率 5

向量化在线POMDP规划 5

DVGT：自动驾驶视觉几何变换器 5

条件PED-ANOVA：分层动态搜索空间的超参重要性分析 5

L³大规模查询层 5

掩蔽扩散语言模型隐性正则化调优 5

SUSD：状态因式分解的无监督技能发现 5

高维离线多臂老虎机的对抗攻击方法 5

顺序重要吗：鲁棒性法则与泛化能力的连接 5

物理驱动神经引擎音频建模与脉冲列合成 5

量子纠缠在对抗游戏中的竞争优势 5

接触探索器：接触覆盖引导的机器人灵巧操作 5

GenSpan：生成校准的动作时间跨度用于视频检索 5

上下文多任务强化学习用于自主珊瑚礁监测 5

随机稀疏注意力在内存受限推理中的应用 5

合成数据重训练的理论研究：多元偏好视角 5

蛋白质基础模型的竞争性检索机制 5

专家感知的拒绝行为控制方法 5

ACAT：基于方面的情感数据标注协作平台 5

刻意进化：样本高效符号回归的大模型智能推理 5

DLLG：大模型专家的动态logit级门控 5

通过外部子图生成增强大模型的逐步推理能力 5

学习如何学习：小模型微调-强化学习的阶段特定数据集 5

SparDA：长上下文大模型推理的稀疏解耦注意力 5

大规模文档集的模块化KV缓存训练 5

多模态长对话中的细粒度片段检索 5

多视频总结中位置偏差的系统评估：多模态大模型视角 5

DuDi：跨语言双信号知识蒸馏方法 5

多语言长篇语音指令跟随：KIT在IWSLT 2026的参赛方案 5

优化Lean定理证明器的成本-质量权衡 5

快速准确的函数向量方法 5

听你所读：基于声学偏差的无参考假设评估 5

MusaCoder：摩尔线程 GPU 的原生内核生成与全栈训练 5

CARE-link：基于网络的糖尿病管理电子健康记录系统 5

基础模型研究的有效性威胁 5

上下文内图形推理 5

STRIDE：通过子集扰动稀疏恢复的训练数据归因 5

通过语义相似释义评估自动形式化的鲁棒性 5

SSA：通过特征空间对齐实现超稀疏注意力 5

分割、嵌入、对齐：字幕与手语的通用对齐方案 5

GroupTravelBench：LLM 智能体在多人旅行规划中的基准评测 5

扩展 AI Agent：在 GKE Autopilot 上部署 ADK 的完整指南 5

业界领袖分享：生成式媒体在创业中的新视角 5

Google 宣布在德州新建数据中心并进行能源投资 5

资讯速览：AI 生成诉讼与数据中心虚拟电厂 5

Jeff Bezos 资助脑科学探险：寻找大脑的「核心算法」 5

医学影像 AI 入门：以胸部 X 光为例的预处理完全指南 5

AI 驱动 macOS 原生应用开发的复兴 5

SHARP：长程非平稳时间序列识别的睡眠型分层加速重放 5

超越熵的极限：视觉锚定token选择优化推理 5

从图检索到模式实现：异构知识图谱上的反事实验证文本转 SPARQL 5

使用在线自然语言反馈高效对齐语言模型 5

图像转视频模型的参考帧优化 5

REFLECTOR：应对间接越狱的内部步式反思 5

图数据上的因果效应估计与网络分析 5

解剖锚定自监督学习：超声图像的视觉模型蒸馏 5

高等教育AI素养的五阶段发展框架 5

SkyShield：低空无人机自主系统的占有率安全接口 5

地毯制造质量控制AI的数据采集与训练方法 5

在 dstack 上实现 Kubernetes Pod 级远程认证 5

CR-Seg：注意力指导的思维链图像分割方法 5

PHASER：视觉-语言-动作模型的阶段感知经验回放 5

AnchorMoE：用锚点路由混合专家实现时间序列分类 5

相干性最大化促进多元对齐 5

无社会语言学标签的巴西葡萄牙语口音特征提取 5

信任区域策略上蒸馏 5

MuCO：AI 驱动的肽环化生成与多阶段结构优化 4

代数量子态层析法：低秩量子态的高效估计 4

v0.30.5 版本发布 4

物理约束机器学习在短期洪水预测中的应用 4

ADAPTOOD：心电图时间序列模型的不确定性感知微调 4

CTF4Science Lorenz 挑战赛指标感知混合预测方案 4

Instant-Fold：可变形物体操作的上下文内模仿学习 4

两层神经网络静止平台的几何特征化分析 4

期望 vs. 现实：条件不确定性下预测成本分析 4

差分进化与梯度下降的集成隐因子模型 4

ChessMimic：闪电战棋局人类走法预测的等级 Transformer 模型 4

SFMambaNet：谱频增强的选择性状态空间模型对应修剪 4

GeoMin：几何分布建模的数据高效半监督强化学习推理 4

光学引导神经塌陷：SAR 少样本类增量学习 4

展开级优先级经验回放：GRPO 强化学习优化 4

连续时间动态图长序列时空表示学习：状态空间模型方法 4

图引导宇宙学习：广义特征值邻近 SVM 阿尔茨海默病分类 4

曲率感知动态精度方法：物理信息神经网络优化 4

粗到精细层级架构：Sequential Mamba 脑影像重构 4

NoRA：视觉第一人称规范行为推理的合理性评估 4

OA-CutMix：修正 CutMix 标签偏差的图像增强方法 4

不变梯度对齐：鲁棒推理蒸馏方法 4

UniCAD：多模态多任务 CAD 的统一基准与通用模型 4

一次训练解决：可微分组学数据子集选择 4

空间转录组学作为图像的大规模预训练数据 4

噪声记忆编码解释了负极性错觉现象 4

SANE：生物数据的模式感知自然语言评估 4

GENEB：为什么基因组模型难以对比 4

LDARNet：具有可学习分词的DNA自适应表示网络 4

法语副词性多词表达标注语料库 4

物理约束神经网络模型用于GCL/SL复合衬垫的生物可降解污染物运输 4

幻觉即服务：AI 时代的数字欺骗 4

Apache Spark 托管服务新功能 4

Google Data Cloud 新动向 4

Google Search 新功能：帮创作者与出版商展示作品 4

Kevin O'Leary 同意缩小犹他州超大数据中心规模 4

我们需要过滤 AI 垃圾内容：出声或沉默 4

量子计算时刻已至：进入大众资本市场 4

VoidZero 加入 Cloudflare 4

DEFLECT：机器人动作执行的延迟鲁棒方法 4

q0：超超 Epoch 预训练的基础原语 4

细胞复形增量束上同调的几何特征化 3

Anycast 任播的性能影响分析 3

多粒度 3D 肾脏病变从 CT 扫描特征化分析 3

Archi：CMS 实验的智能体操作系统 3

当客户不再追随：认知概念图驱动的战略咨询框架 3

法律条款更新 3

版本 0.138.0-alpha.4 发布 3

版本 0.138.0-alpha.3 发布 3

版本 0.138.0-alpha.2 发布 3

版本 0.138.0-alpha.1 发布 3

版本 v0.30.6-rc0 发布 3

规划一座桥梁需要多长时间？ 3

StrictlyVC 洛杉矶峰会：防御科技、AI 与融资成焦点 3

请求的路径：现代网络架构之旅 3

Uber 用批处理加速账本：每秒单账户 30+ 更新 3

Netflix 演讲：数据删除的中央化平台架构 3

架构演变的实战工具：架构变更案例集 3

认识 Kameirah：2026 年 Doodle for Google 获奖者 3

Google：将安全数字身份与支付工具普及给更多用户 3

Dashlane 解密：黑客如何突破加密密码库 3

Alpha School 年费 6.5 万的纽约校区：其实不是学校 3

属性式访问控制：编写更优授权规则的艺术 3

后端挑战：重复支付处理的常见坑 3

Docker 完整教程 3

加固镜像解读：减少漏洞，缩小攻击面 3

我的 Emacs 包推荐（2026 年 6 月版） 3

Linux 的'拉丁'根源 3

gittuf：Git 参考的签名日志工具 3

马尔可夫链解码器克服Lipschitz生成模型的重尾局限 3

显式单位距离下界证书的优化 3

《星球大战》里也有人支持帝国 2

Lingon 和 Lingon Pro 10 2

还记得 Chrome 在 macOS 上的那些糟糕时光吗？ 2

Nick Bilton 又一力作：科技观察员的碎碎念 2

Nick Bilton 对电视产业的洞察 2

光滑周期函数的积分 2

AMD 486DX4 芯片于 1995 年 6 月 4 日发布 2

问题框架化内核 2

The Talk Show 将在 WWDC 2026 举办现场录制 2

分割与排列的数学研究 1