小互 AI 日报 — 2026-06-02

2026-06-02 · 周二生成 10:28:49

覆盖源

183

条目数

578

高分 8+

33

主题簇

0

🌟 今日头条

黑客简单询问 Meta AI 就成功获得高知名度 Instagram 账户控制权

安全研究人员发现 Meta AI 客服系统的严重漏洞：黑客只需简单要求 AI 将高知名度 Instagram 账户关联到新邮箱就能成功接管账户。问题在于 Meta 的 AI 系统缺乏对账户所有者的有效验证机制，多个来源已通过视频验证了该漏洞的真实性。

阅读原文 →

🔥今日要点

01

Simon Willison 5 月赞助者专享月刊

9/10 资讯

Simon Willison 发布 5 月赞助者月刊，内容涵盖 AI 成本上升、Anthropic 强劲表现、模型发布评析、行业会议播客、Datasette Agent 发布等。这是作者的赞助者专享内容。

阅读原文 →

02

Ollama 0.30.0 发布 - 性能和兼容性大幅提升

9/10 新产品

Ollama 0.30 利用 llama.cpp 改进兼容性和性能，扩展 Apple Silicon 上 MLX 引擎的硬件支持，新增 Hugging Face GGUF 模型和自定义微调模型支持，优化 NVIDIA GPU 性能，支持更多硬件和模型类型。

阅读原文 →

03

JetBrains 发布 Mellum2：12B 参数混合专家模型

9/10 新产品

JetBrains 推出 Mellum2，这是一个包含 120 亿参数的混合专家架构模型。标志着该公司从开发工具向开源语言模型领域的战略扩展，为其 AI 驱动的开发平台增加新能力。

阅读原文 →

04

Alphabet 计划融资 80 亿美元进行 AI 基础设施建设

9/10 资讯

"The company is experiencing strong demand for its AI solutions and services from enterprises and consumers, at levels that are exceeding the company’…

阅读原文 →

05

Nvidia 联手微软/戴尔/惠普进军 AI PC 市场

9/10 资讯

If Nvidia has cracked a way to bring AI agents easily, safely, and usefully to the masses, it could — and should — be big.

阅读原文 →

06

这家 AI 气象初创公司的预报精度超过政府机构

9/10 资讯

WindBorne benefits from its unique combination of model-building and data collection. The company now has about 400 balloons in flight gathering senso…

阅读原文 →

📖值得深入

🕐 约 3 分钟 · 教程 7/10

Sam Altman强调AI发展应以人为本

💡 可拆解成教程素材

Sam Altman在采访中表示，AI不应被设计为追求脱离人类需求的目标，人类必须始终处于AI发展的中心。他批判了行业内"AI将摧毁大量工作"等言论，认为人们担忧的并非AI带来的好处，而是自身在未来的角色、经济前景与自主权。他指出，AI行业的失败在于未能清晰解释人类如何在每一步保持对未来的控制权，以及如何在AI时代继续拥有充实、有意义的生活。

阅读原文 →

🕐 约 3 分钟 · 教程 7/10

Karpathy 分享学习方法论

💡 可拆解成教程素材

🎯 Andrej Karpathy 谈如何学习。

阅读原文 →

🕐 约 3 分钟 · 行业分析 7/10

Alphabet将通过发行股票筹集800亿美元用于AI支出计划

💡 行业趋势与动态分析

Alphabet正在通过发行股票等方式筹集800亿美元资金，其中包括与Berkshire Hathaway的投资协议，以资助其雄心勃勃的AI支出计划。

阅读原文 →

🕐 约 3 分钟 · 教程 7/10

Google AI 展示并行子智能体自动整理文件

💡 可拆解成教程素材

从杂乱到清晰。观看 @Antigravity 中的并行子智能体对数百个营销资产进行分类和重命名，消除手动文件管理。

阅读原文 →

🕐 约 3 分钟 · 观点/深度 6/10

利用非结构化数据增强金融市场制度转变检测研究

💡 观点与论证值得借鉴

该研究在金融市场制度转变检测中引入非结构化数据（政策公告、新闻文本），解决仅依赖时间序列无法可靠检测的问题。通过多模态融合，利用政策沟通文本提供的补充信号提高检测准确性，为金融市场监测提供新思路。

阅读原文 →

📂按类别浏览

新产品

NVIDIA JetPack 7.2支持内存优化的边缘智能体部署

9

NVIDIA JetPack 7.2发布，支持一键部署开源NVIDIA NemoClaw堆栈，该堆栈为OpenClaw添加了隐私与安全控制。同时引入NVIDIA agent skills for Jetson，为Jetson设备提供智能体技能。

阅读原文 →

ChatGPT 新增长文编辑与保存功能

9

长文写作需要更多空间。现在你可以在全屏模式下编辑更长的文章，并将其保存到你的资料库中，以便稍后继续。

阅读原文 →

Krea AI 开放 Krea 2 LoRAs 全员使用

9

Krea 2 LoRAs 现已向所有人开放。试试下面这个 👇

阅读原文 →

观点/深度

OpenAI 对 AI 政策和政治倡议的立场阐述

9

OpenAI 阐述了在 AI 政策和政治倡议中的立场，强调透明度、支持合理监管、优先考虑 AI 安全，澄清不代表任何外部政治组织。反映了该公司对 AI 治理和监管框架的立场。

阅读原文 →

BenHalluEval：孟加拉语大模型幻觉评估框架

6

该研究为孟加拉语大模型首次构建细粒度幻觉评估框架，覆盖生成式问答、混合代码问答、总结、推理四类任务，用 12,000 个幻觉样本实现全面评估。填补了孟加拉语（全球第六大语言）的 LLM 评估空白。

阅读原文 →

大语言模型何时可用于强化学习策略优化

6

该研究探索 LLM 作为强化学习策略优化器的可行性，提出提示策略优化（PromptPO）方法。通过 Python 描述状态空间、动作空间、奖励函数，让 LLM 迭代生成和优化可执行策略，可能用 LLM 替代传统 RL 算法。

阅读原文 →

行业分析

Anthropic 保密向 SEC 提交 S-1 草案

7

Anthropic， PBC 今日保密向美国证券交易委员会提交了 S-1 表格草案，计划进行普通股的首次公开发行。这使其在 SEC 完成审核后拥有上市的选择权。IPO 的具体发行股数和价格尚未确定，将取决于市场条件等因素。

阅读原文 →

全球 AI 环保监管格局：从推理成本到绿色 AI 权利

6

该研究调查 AI 系统的环保成本，特别是 2025 年大规模部署的生成式网页搜索和推理模型的环境影响远超前代技术。分析全球监管格局，提议建立 AI 环保透明度机制和'绿色 AI 权利'的政策框架。

阅读原文 →

LLM 基准评测错误检测：项目反应理论的应用

6

论文用项目反应理论检测了七个主流 LLM 基准测试中的标签错误，精度达 95%，发现问题源于机械标签启发式和上游标注错误，对基准数据质量评估有重要参考。

阅读原文 →

技术

Claude Opus 4.8支持中途修改系统指令而不损坏缓存

10

Anthropic为Claude Opus 4.8发布了一个重要更新，允许开发者在对话进行中添加或修改系统指令，而不会破坏prompt缓存。以前任何系统提示词的修改都会导致模型重新计算上下文，增加延迟和计算成本。新实现在保留已缓存token的同时，使更新的指令从插入点起生效。

阅读原文 →

教程

Anthropic 开发者分享 Claude Code「理解验证」工作流

7

Anthropic 核心开发者分享了一套用于 Claude Code 的「理解验证」工作流。该工作流将 AI 定位为"高效且睿智的教师"，成功标准不仅是完成任务，更是确保人类对问题、方案及影响有可复述、可辩护的掌握。

阅读原文 →

Gemini Omni支持创建个人数字分身

7

轻松将自己添加到Gemini的视频创作中。以下是如何使用Gemini Omni创建一个外观和声音都像你的数字分身。🧵

阅读原文 →

ImmigrationQA：美国移民法源根据数据集与小模型适配

6

研究团队构建了包含 17,058 问答对的 ImmigrationQA 数据集，覆盖美国移民法 13 个领域，使用参数高效的 LoRA 方法在 Llama 3.2 3B 上微调，创建专业移民法律 AI 助手。展示了小模型通过针对性数据集可有效适配专业领域知识。

阅读原文 →

📭今天可以忽略

这些被自动过滤了。给你看看原因，免得你担心错过：

ImmigrationQA：美国移民法源根据数据集与小模型适配
→ 单源论文，缺普通读者价值
BenHalluEval：孟加拉语大模型幻觉评估框架
→ 单源论文，缺普通读者价值
用验证反馈强化学习改进小模型代码生成能力
→ 单源论文，缺普通读者价值
大语言模型何时可用于强化学习策略优化
→ 单源论文，缺普通读者价值
通过代码演化学习求解组合优化问题
→ 单源论文，缺普通读者价值
DOA：用 SpeechLLM 实现无训练同步翻译策略
→ 单源论文，缺普通读者价值
贝叶斯采样如何增强成员推断攻击效能
→ 单源论文，缺普通读者价值
Gap-K%：通过Top-1预测差检测预训练数据的新方法
→ 单源论文，缺普通读者价值

📎 长尾信息 (238) · 点击展开

Ollama v0.30.0-rc32 发布：llama-server 修复和优化 5

线性循环神经网络为何在部分可观察强化学习中有效 5

台湾产业巨头与 NVIDIA 携手加速全球 AI 基础设施建设 5

版本 0.136.0 发布 5

PhyDrawGen：从自然语言生成物理约束图表 5

物理可行世界模型：查询条件化具身 AI 的案例分析 5

使用 Map-Elites 进行第一人称射击游戏地图程序生成 5

工具更新不等于工具收益：自我演化 LLM 智能体能力解耦 5

EHRBench：LLM 临床决策制定的自动化 EHR 基准 5

策略即代码搜索下的医疗机制与战略性提供者反应 5

为长时域任务学习智能体兼容的上下文管理 5

PReMISE：将策略评分标准作为 LLM 评判器的测量规范 5

以规划者为中心的深度研究强化学习与结构感知奖励 5

COMPASS：认知 MCTS 引导的安全搜索智能体过程对齐 5

为 Lean 定理证明蒸馏 LLM 反馈 5

BilliardPhys-Bench：多模态 LLM 的物理推理和视觉动态基准 5

跨模型本地等距一致性的向量关联 5

稀有事件因果路径的形式化与证伪 5

资源受限视觉 Agent 的共享状态协作失败模式诊断 5

HypoAgent：知识图谱上的交互式假设生成 Agent 框架 5

FAM-Bench：食物医学推理多模态测试集 5

LLM 奖励设计失败时的诊断驱动优化方法 5

Mental Damage：检索增强文本生成音乐系统的字幕投毒攻击 5

基于小波变换与谱流匹配的功能性 MRI 时间序列生成用于脑疾病识别 5

测试表面与故障表面的差异 5

重审填充 Transformer 的表达能力：哪些架构选择重要 5

工业视觉仿真到实际的先验可用性：CAD 引导与无 CAD 方案综述 5

机器学习不确定性量化方法在涡轮机燃气温度降解预测中的基准评测 5

科学机器学习在发动机健康管理和剩余使用寿命预测中的应用 5

从最优N选择偏好数据进行奖励学习：目标、权衡与设计原理 5

用于学习度量值轨迹的主动时间点选择 5

分数广播与去相关：广播类信用分配的通用框架 5

LARK：基于可学性的高效推理蒸馏轨迹选择 5

CobSeg：对话主题分割的相干边界建模 5

对软件逆向工程AI Agent的提示词注入攻击的检测与混淆研究 5

工具调用ReAct Agent中的深度依赖间接提示词注入研究 5

ConTrans：学习用于零样本时间动作定位的文本增强时空表示 5

先看后同意：多Agent共识与视觉证据的对齐 5

小模型是GRPO中策略级多样性的天然探索者 5

OpenSTBench：超越语义评估的语音翻译评测框架 5

MechVQA：多模态LLM在机械图纸理解上的基准测试与增强 5

大语言模型对齐的差分隐私偏好数据合成方法 5

超越一致性：生物医学实体候选评分用于策展人分类 5

轨迹中的捉迷藏：发现VLA运行监测的失败信号 5

战略Agent策略的安全均衡策略优化 5

DARTS：分布感知主动轨迹成形以加速LLM强化学习 5

Sophrosyne：关系型数据系统Agent式探索的节制需求 5

基于Gumbel-Softmax先验的联邦变分偏好对齐方法 5

语音理解的统一可复现实验框架 5

跨模态相似性表征的变分适配器 5

生理传感器网络异常检测的可解释性模型 5

多臂老虎机问题的退火软最大值贪心算法 5

脑电信号跨域解码的自适应子空间路由方法 5

STEP：时间序列的渐进式结构化嵌入学习 5

6G 非地面网络的无导频通道估计与预测 5

TARIC：户外视觉导航的可遍历性感知与记忆增强 5

神经包容性情绪调节的用户研究视角 5

数字健康的 AI 增强用户研究：尼日利亚 HIV 防护案例 5

用户研究方法论：生成式 AI 增强的人文中心设计框架 5

AI 增强的用户研究：紧急公共安全中的数字健康 5

MAECO-Lite：动态恶意软件分析的模块化本体 5

群体运动避碰行为的数据驱动模拟 5

在线决策树分割选择的即时有效推断纠正 5

心电图空间的心脏潜在表示学习 5

熵投影对齐：分布偏移下的模型性能估计与改进 5

超越少样本：少样本非常规布局到图像生成的解纠缠语义与原语 5

SAM 在荧光显微镜线粒体实例分割中的应用 5

激活控制潜空间解纠缠：符号音乐生成的可解释属性控制 5

制度奖惩下的社会福利优化 5

AI 中共情的适当性：信号成本视角 5

用最大团复形扩展高阶图学习的可扩展性 5

神经符号句法分析：用 CYK 算法塑造神经网络 5

扩展会话匈牙利语自动语音识别：BEA-Dialogue+ 语料库 5

通过 IO 感知层实现的图神经网络高效扩展 5

智能体强化学习中作为压缩的技能复用 5

区分秘密与占位符：混合 CNN-CodeBERT 的凭证泄露检测框架 5

特征优化视觉在自适应 3D 场景重建中的应用 5

RayDer：从真实视频进行可扩展自监督新视图合成 5

SPECTRA：带相关性预言机的合成信息检索测试集 5

语言模型学习构式语义：配对焦点构式理解研究 5

有状态在线监测捕捉分布式智能体攻击 5

Lumos-Nexus：用齐次潜空间高效频率桥接的统一视频模型 5

通过序列决策统一与优化数据价值选择 5

ProofWala：多语言证明数据合成与定理证明框架 5

神经符号预测过程监测 5

ReTabAD：表格异常检测中恢复语义语境的基准 5

SAC-Opt：优化建模中用于迭代校正的语义锚 5

后训练 LLM 作为决策智能体：遗憾最小化方法 5

DTop-p MoE：基础模型预训练的稀疏动态专家混合 5

基于遗憾的联邦因果发现：未知干预处理 5

非形式定理证明中的洞察推理学习 5

BoxLitE：基于凸优化的忠实知识库嵌入 5

Auto-Discovery-Bench：神谕引导发现的结构化状态追踪诊断 5

SHIELD：增量扩展学习的安全超网络防御 5

PictSure：预训练嵌入对上下文学习图像分类的重要性 5

机械可解释性作为统计估计：方差分析 5

PAC-贝叶斯强化学习的可泛化策略 5

边界引导策略优化：扩散 LLM 的内存高效强化学习 5

CaptionFormer：时空对象的统一分割、跟踪与标题生成 5

共形预测的条件覆盖诊断 5

流等变世界模型 5

重思多模态小样本3D点云分割 5

SKETCH：长期船舶轨迹预测的语义关键点建模 5

高斯头部OFL族：一次性联邦学习 5

Shapley值的奇数估计法 5

流匹配的动能视角 5

通过扩散采样反演数据变换 5

Softmax的信息几何：探测与引导 5

HistCAD：工业级参数化历史型CAD表示与基准 5

NGDBench：迈向神经图数据管理 5

秩分解隐式神经偏差：用FlashAttention扩展超分辨率Transformer 5

G-STAR：全局说话人跟踪属性识别 5

注意力的惊喜：时间序列异常检测的查询动态预测 5

图能量匹配：传输对齐的能量模型在图生成中的应用 5

电路启发的高阶神经网络：PDE求解和视觉感知的统一框架 5

超越静态不确定性：时间序列概率预测的动态不确定性建模 5

SVL：目标条件强化学习的生存学习视角 5

无人机实时桥梁裂纹检测轻量级方案 5

高效基准测试即特征选择加多元回归 5

优化 L2 韩语词级语法错误标注方案 5

用 AI 监测和分类研究文献中的数据使用 5

成对参考对齐作为模型级序数可观测量 5

增量 BPE 分词机制 5

EMBGuard：为具身智能体构建风险感知的安全防护 5

自回归变换器中的认知疲劳：形式化与测量 5

维基百科多语言和跨语言引用缺失检测：关注低资源语言 5

Mellum2 技术报告 5

风力发电机维护日志标注框架：LLM 驱动的数据修正和增强 5

Bundesrecht：德国法律文本处理的开放库和语料库 5

拉丁基础：语言模型如何表示和中介文字系统的选择 5

LLM 后训练中的奖励扰动整合 5

多语言临床叙述的可靠骨科决策支持系统 5

UniAudio-Token：用通用音频感知增强语义语音 tokenizer 5

偏好感知的个性化评估评分学习 5

我遗漏了什么？用问答进行隐状态探测 5

黑盒 LLM 蒸馏的有界行为无差异性 5

无社会语言学标签的巴西葡萄牙语口音特征提取 5

关注证据：多模态强化学习视觉推理的证据锚定空间注意力 5

通过多层级事件语义挖掘实现长视频事件预测 5

自然阅读中层级结构与统计信息的相对强度 5

我们在追虚幻吗？不可归因极化的量化与归因 5

单个音素中系统语义结构的证据 5

超越听觉：耳机生理学信息化 tokenization 的通用 ExG 表示学习 5

消除训练推理不匹配的张量并行确定性推理 5

从语言到视觉的反事实推理蒸馏：因果图引导的视频理解后训练 5

使用 Transformer 的上下文无关识别 5

从权重到代码：离散 Transformer 的可解释算法提取 5

序列模型中的归纳偏差研究 5

X-GS：基于 3D Gaussian Splatting 的感知与思维框架 5

AlloyDB Remote MCP Server 全托管版本正式可用 5

AI 测试自动化的生产力悖论：超越结构验证走向意图理解 5

AI 冲击音乐产业：格莱美应如何应对？ 5

系统启动时间优化：从数小时缩减到数分钟 5

构建智能 AI 支持代理：学会何时不回答 5

核反应堆控制的Agent物理AI系统 5

利用局部动力学规律在离线分层强化学习中构建可复用技能 5

零样本时间序列异常检测的基础模型研究 5

自回归视觉生成需要序言 5

PROWL：世界模型学习的优先级遗憾驱动优化 5

基于块的双解码器架构 5

德语法律代码的分块处理 5

通过重要性平滑高效学习深层状态空间模型 5

重参数化、权重衰减和自适应学习率的稀疏优化理论分析 5

Pocket-Dentist：高效多模态 LLM 的端侧牙科图像识别 5

Waymo 推出首款专属机器人出租车 Ojai，为老年人和家庭优化 4

Transformer 注意力头学习动态：位置编码与长度泛化分析 4

残差水库记忆网络：无需训练的新型循环神经网络 4

谱坍塌：揭示深度连续学习可塑性丧失的根因 4

对称性揭示 Transformer 分层动态：上下文分类机制解析 4

SAT 求解的 FTS 转换和编码：什么有效、什么失效 4

Levin 树搜索中的结构诱导信息 4

HADT：用于自主地球观测卫星集群的异构多智能体差分 Transformer 4

选择视角：上下文相关论证中的策略性视角激活 4

TRINE：多模态 AI 的 Token 感知自适应 FPGA 推理引擎 4

无梯度训练脉冲神经网络：低秩进化策略 4

XOResNet：异或元残差促进脉冲神经网络深度学习 4

哈密顿启发注意力机制在 RF 发射机身份识别中的应用 4

安全阈值作为神经元放电阈值的重新解读 4

人工神经网络中标准神经元模型的更新 4

储层学习与优化的进化算法 4

多尺度分层学习在工程规模飞行器三维全场预测中的应用 4

多目标优化中梯度聚合的统一框架 4

图条件专家混合模型在交通预测中的应用 4

全局上下文感知深度神经网络用于 MRI 脑肿瘤分割增强 4

基于直方图正则化扩散模型的可控肺结节合成 4

用于病例级病理概要报告生成的高效Token视觉语言模型 4

基于动量修正在线堆叠集成的蔬菜价格指数预测 4

GSAM：可泛化且安全的关节物体操控机器人框架 4

GaMi：基于跨模态减法分解的几何无关材料识别 4

AI-RAN 中的实用跨频段信道预测：物理引导深度展开方法 4

OLG++：义务逻辑图的语义扩展 4

SPM-Bench：扫描探针显微镜的 LLM 基准测试 4

将 AI 作为概率骰子：基于时序计算的可能性探索 4

基于关节角度的学习改进运动学人体姿态估计 4

观点：心电图表征评估必须改进 4

高阶归纳类型启发的函子神经架构 4

化学成分不同无机结构的增强编码填充方法 4

聆听市场声音 4

在 Amazon Bedrock AgentCore Identity 中引用 AWS Secrets Manager 密钥 4

Amazon Bedrock AgentCore Gateway 扩展 MCP 支持 4

用策略和 Lambda 拦截器保护 Amazon Bedrock AgentCore 中的 Agent 4

用 GPUDirect 加速 LLM 加载、扩展上下文窗口 4

Trustpilot 用 Gemma 构建实时数据丰富化架构 4

用 BigQuery Graph 建模食品供应链数字孪生 4

纽约专科医院用 AWS 改革患者支持和服务体验 4

Elastic Build 机器新增 OOM 构建保护机制 4

JetBrains IDE 插件现已支持 OAuth2 登录替代令牌粘贴 4

用 Qodana 修复常见 TypeScript 问题 4

自托管 MinIO 实现 S3 兼容存储：每月节省数百美元 4

Node.js 26.3.0 版本发布 4

代码代理恐怖故事：rm -rf ~/ 惨案 4

AppArmor 安全框架的实际应用现状评估 4

信息安全术语速查手册 4

在 Amazon Cognito 上构建可扩展用户搜索层 4

演讲：大规模主题系统——构建高度可定制的软件 4

从 Flutter 出发：用 Dart 和 Shelf 构建生产级 REST API 4

元宇宙的狂热梦幻 4

SpectralTrain：高光谱图像分类通用框架 4

选择偏差在因果效应识别中的整体理解 4

l∞ 范数下的改进分布估计 3

Pluralistic：Molly Crabapple 作品评论 3

水资源获取成为 SpaceX IPO 的风险因素 3

播客：架构师的需求分析讨论 3

Pride 月：LGBTQ+ 创作者和艺术家聚焦 3

北欧大西洋航空廉价机票的隐藏代价 3

什么是沙箱安全？ 3

Windows 8 的开发代称是 modern——科技历史趣闻 3

Unix 历史：su 命令如何取代 login 实现用户切换 3

周报更新第 506 期 3

周末小知识：进程内存的底层本质 3

职场反思：接下黑心工作就成了黑心雇主 3

评论：我们生活在皮诺曹的世界里 3

用 Zephyr OS 开发蓝牙应用：开发者手册 3

OpenAI Codex 0.136.0-alpha.2 发布 3

赞助：Mux——开发者视频服务平台 2

数学探讨：不仅仅是泰勒级数 2

电子邮件订阅提醒 2

Intel 8088 与非克隆处理器的硬件历史 2