小互 AI 日报 — 2026-05-10

2026-05-10 · 周日生成 22:26:15

覆盖源

175

条目数

498

高分 8+

6

主题簇

0

🌟 今日头条

菲尔兹奖得主：ChatGPT 5.5 Pro 两小时完成博士级数学研究

菲尔兹奖得主 Timothy Gowers 用 ChatGPT 5.5 Pro 解决数论开放问题，模型在一小时内将指数界改进为多项式界，核心思想被 MIT 研究者称为'完全原创'。首次证明 AI 可独立贡献前沿数学研究。

💬 编辑点评

真正的突破在于权威性转换——数学最高殿堂认可 AI 的独创思想，AI 从工具升级为研究者。这改变了整个学科对 AI 能力的定义。

阅读原文 →

🔥今日要点

01

Nvidia今年已承诺投入400亿美元用于股权AI交易

9/10 资讯

Nvidia continues to be a big investor in the AI ecosystem.

阅读原文 →

02

Google 开放 Fitbit Air 的全新 Health API

9/10 新产品

Google 随新款 Fitbit Air 发布了全新的 Health API 并向开发者开放。该 API 提供了涵盖运动、睡眠、心率、血氧等维度的 31 种健康数据点，支持 Webhooks 实时数据推送、精细的读写权限控制以及按时间范围查询和汇总数据。

阅读原文 →

03

帕累托代码：免费实验性编码路由工具

9/10 新产品

推出帕累托代码：一款全新、免费、实验性的编码路由工具在请求中设置 `min_coding_score`，即可路由至符合您标准且成本最低的编码模型，排名由 @ArtificialAnlys 提供。实时查看帕累托前沿的变化👇

阅读原文 →

04

HappyHorse上线阿里云，AI视频无需等待

9/10 新产品

基准测试排名第一。闪电速度。原生音视频同步。排队等待AI视频的时代结束了。HappyHorse现已在阿里云Model Studio上线。当别人还在渲染时，你已完成。立即构建：https：//int.alibabacloud.com/m/1000412167/

阅读原文 →

05

OncoAgent：一个用于隐私保护肿瘤临床决策支持的双层多智能体框架

7/10 技术

研究团队发布了开源肿瘤临床决策支持系统OncoAgent。该系统采用双层多智能体框架，结合LangGraph拓扑与四阶段Corrective RAG流程，检索超过70份权威临床指南。系统根据查询复杂度，将任务路由至9B参数的速度优化模型或27B参数的深度推理模型，两者均通过QLoRA在AMD MI3…

阅读原文 →

06

SpaceXAI 正式官宣了！

7/10 行业分析

商标申请文件显示，"SpaceXAI"已于2026年5月6日提交申请，目前状态为待审查。该日期与Elon Musk宣布将xAI并入SpaceX的时间点吻合，标志着xAI的AI能力将与SpaceX的航天业务进行品牌统一，旨在将打造多行星文明与发展超级智能两大目标合并于单一实体之下。

阅读原文 →

📖值得深入

🕐 约 3 分钟 · 教程 7/10

AI放大能动性差异，用户两极分化加剧

💡 可拆解成教程素材

主观能动性向来具有自我增强的特性，而AI正在放大这种效应。低能动性的AI使用者进一步丧失能动性，高能动性的AI使用者则进一步增强能动性。

阅读原文 →

🕐 约 3 分钟 · 教程 7/10

GPT-Realtime-2语音控制CRM集成方案

💡 可拆解成教程素材

以下介绍如何集成GPT-Realtime-2为CRM工作流添加语音控制功能。

阅读原文 →

📂按类别浏览

新产品

ZAYA1-8B：700M活跃参数的推理专用模型

6

Zyphra发布推理专用的ZAYA1-8B模型（混合专家架构，8B总参数但仅700M活跃）。该模型在数学和编码基准测试上与DeepSeek-R1相当甚至更优，且活跃参数不足10亿。

阅读原文 →

Claude Code v2.1.138 发布

4

Claude Code 发布 v2.1.138 版本，这是一次日常维护更新。本次更新不包含新的用户功能或重大改变，主要是修复了一些 bug 和进行内部优化，旨在提升 IDE 的整体稳定性和性能表现。使用 Claude Code 的开发者可以期待更流畅的工作体验。

阅读原文 →

Ollama v0.30.0-rc11 发布（Windows 编译器路径修复）

4

Ollama 发布 v0.30.0-rc11 修复候选版本，解决了 Windows 系统中编译器路径包含空格导致构建失败的问题。这是 Windows 开发者常见的问题，因为默认安装目录通常包含空格。该修复使得 Ollama 用户可以在 Windows 上顺利编译和运行本地语言模型。

阅读原文 →

观点/深度

DBMSolver：加速扩散图像转换的无需训练采样器

6

DBMSolver 是扩散桥接模型的无需训练采样器，通过指数积分器利用半线性结构，显著减少了图像转换所需的函数评估次数，实现更快的高保真生成。

阅读原文 →

地平线约束 Rashomon 集合：混沌系统预测多样性研究

6

提出地平线约束 Rashomon 集合，在混沌系统中随预测时间增加，模型多样性呈指数增长。与静态预测不同，为不确定性下的预测提供新洞见。

阅读原文 →

图自监督学习对真实噪声的鲁棒性研究

6

研究图自监督学习在真实噪声下的鲁棒性，特别是处理从文本自动提取的知识图谱。填补了以往假设数据清洁的空白，实现自然噪声条件下的 GSSL 评估。

阅读原文 →

行业分析

基于拍卖机制的人工智能监管框架

6

提出基于拍卖机制的 AI 监管数学框架，弥补当前监管方法空白。为 AI 安全、偏差与合规性提供严格结构化的监管方法，应对创新与监管失衡。

阅读原文 →

智能监控赋能城市设计：用 AI 评估行人安全干预的真实效果

5

利用现有 CCTV 监控和计算机视觉技术，实时测量城市设计干预措施（如临时行人庇护所、路边延伸）对车速和安全的实际影响。通过深度学习实现视角校正的速度估计，对比干预前后的驾驶行为变化。

阅读原文 →

教程

BioMedArena：开源生物医学研究代理工具包

6

BioMedArena 是开源工具包，通过统一评估框架和工具注册表简化生物医学研究代理的构建。减少不同论文间的重复工程工作，让研究者高效集成新模型。

阅读原文 →

MTL-MAD：多任务学习在医学异常检测中的应用

6

在混合专家框架下结合多个自监督和伪标签任务进行医学影像异常检测，无需训练时异常样本。通过整合多个代理任务达到最优性能。

阅读原文 →

边缘计算分散学习的高效耐鲁棒算法

6

开发适用于资源受限边缘设备的八卦算法，既通信高效又抵抗数据破坏。结合以往方法的优势，化解效率与鲁棒性之间的权衡。

阅读原文 →

📭今天可以忽略

这些被自动过滤了。给你看看原因，免得你担心错过：

DBMSolver：加速扩散图像转换的无需训练采样器
→ 单源论文，缺普通读者价值
OpenAI Codex 0.131.0-alpha.4 版本发布
→ 小版本号 alpha/beta/rc 发布，无新功能
OpenAI Codex Rust 0.131.0-alpha.3 版本发布
→ 小版本号 alpha/beta/rc 发布，无新功能
OpenAI Codex 0.131.0-alpha.2 版本发布
→ 小版本号 alpha/beta/rc 发布，无新功能
BioMedArena：开源生物医学研究代理工具包
→ 单源论文，缺普通读者价值
地平线约束 Rashomon 集合：混沌系统预测多样性研究
→ 单源论文，缺普通读者价值
图自监督学习对真实噪声的鲁棒性研究
→ 单源论文，缺普通读者价值
统一多模态模型中的视觉生成控制研究
→ 单源论文，缺普通读者价值

📎 长尾信息 (358) · 点击展开

广义线性多臂赌博机的最优臂识别研究 5

通过推理轨迹测量黑盒模型的置信度 5

证据深度学习中的不确定性度量与 OOD 检测 5

特征组合的结构不稳定性研究 5

GRALIS：线性归因方法的统一理论框架 5

LMO 优化加速：隐式梯度传输方法 5

傅里叶特征方法用于非线性因果发现 5

调整导数实现机器学习的因果公平性 5

权重Gram矩阵捕捉深度网络的特征线性化 5

连续强化学习的算子引导不变性学习 5

离散设施布局优化的混合 CDCL 和 CP-SAT 架构 5

CatNet：用 SHAP 和高斯镜像控制 LSTM 的假发现率 5

核方法中的分摊线性时间精确 Shapley 值计算 5

深度贝叶斯强化学习中的广义线性模型与可学习基函数 5

StableTTA：无训练测试时适配改进视觉模型性能 5

标注员安全政策的可解释性分析：揭示数据标注中的分歧根源 5

Partial Evidence Bench：企业 AI 代理的授权限制安全基准测试 5

智能监控赋能城市设计：用 AI 评估行人安全干预的真实效果 5

有意性是一种设计决策：可问责 AI 系统的功能意向测量 5

FoodCHA：多模态 LLM Agent 食品细粒度分析系统 5

Prober.ai：LLM 驱动的论证写作发展门控反馈系统 5

大型视觉语言模型在注意力中迷失方向 5

MAT-Cell：批级单细胞注释的多智能体树结构推理框架 5

膝骨关节炎严重程度分级：计算受限系统上的优化深度学习与 LLM 5

多模态事实级归因用于可验证推理 5

SANet：6G 跨层优化的语义感知 Agent 网络框架 5

PREFER：在线偏好学习的个性化评论摘要 5

意图构建与意义创造：人与AI辅导数学发现的交互 5

HaM-World：具有选择性记忆的哈密顿世界模型规划 5

启发式设计新开始：用LLM连接代码与知识 5

P-Guide：单遍CFG推理的参数高效先验方向 5

小图作为知识图谱基础模型的结构词汇构建块 5

无标注MLLM验证：视觉语言逻辑一致性指标 5

联合一致性：通过能量最小化的统一测试时聚合框架 5

带比较判断的主动实例导航用于歧义查询 5

短期和长期算法选择中的公平性成本 5

LLM行动决策控制器类选择的制度理论 5

预测与赋能：通过桥接界面的代理理论 5

SCRuB：基于评分标准的社交概念推理 5

通过视觉脚本特征的历史手稿概率年代测定 5

MedMamba：医学时间序列分类的 Mamba 架构重塑 5

布局感知表示学习用于开集身份欺诈发现 5

MidSteer：生成模型控制的最优仿射框架 5

Transformer 中的自适应计算深度：学习 Token 路由 5

MACS：多模态 MoE 推理的模态感知容量扩展 5

决策感知用户模拟 Agent 用于评估对话推荐系统 5

基于 AI 文档智能的自动化人群级审计保证 5

在固定预算下最大化推出信息量：工具使用 Agent 强化学习树搜索的子模视角 5

Open-SAT：卫星影像开放词汇对象检索的 LLM 引导查询嵌入细化 5

让 AI 草稿计数：音频描述工作流中的质量阈值 5

Tamaththul3D：从单目视频生成高保真沙特手语 3D 虚拟形象 5

SPADE：从稀疏数据学习加速药物发现 5

两步即可：使用一致性模型的高效 3D 点云异常检测 5

AstroAlertBench：多模态 LLM 天文分类能力评测 5

Irminsul：LLM Agent 推理的位置无关缓存系统 5

多Agent系统的联合提示词优化方法 5

自动研究：专家 Agent 发现有效训练方案 5

LCC-LLM：代码中心大语言模型用于恶意软件识别 5

CITE：LLM 自一致性推理中的统计推断方法 5

LLM 驱动的 FPGA 加速器设计空间探索 5

走向可靠的 LLM 评测：自适应基准中的赢家诅咒纠正 5

实时热感知视觉系统：蒸馏扩散模型方案 5

最优传输在 LLM 奖励模型中的应用 5

OBLIQ-Bench: 暴露现代检索器中被忽视的瓶颈 5

都能解释吗? 可解释性的元博弈 5

微调小型语言模型以解决 Windows 事件日志分析 5

TinyBayes: 边缘设备实时图像分类的闭形式贝叶斯推理 5

eX2L: 通过对比视觉解释对进行学习正则化 5

Sparkle：指令引导的视频背景替换新方法 5

异质小型无人机集群间的分离保证：多智能体强化学习方法 5

注意力汇聚的结构起源：方差偏差与超级神经元 5

多模态域泛化进展评估：综合基准研究 5

优化器模型一致性：完整微调遗忘更少的优化器选择 5

AI 安全控制游戏：AI 部署协议的安全评估模型 5

CORE：概念导向强化学习桥接数学推理定义应用差距 5

BioAgent Bench：生物信息学 AI Agent 评估套件 5

隐变量生成求解器：可泛化长期物理模拟 5

神经符号证明生成：系统软件验证的规模化 5

工程设计中的元认知协同调节 AI Agent 循环 5

大规模问题规约：计算难题的 Agent 整合 5

AEM：多轮 Agent 强化学习的自适应熵调制 5

观点文：Agent AI 编排应该是贝叶斯一致的 5

Zarankiewicz 数的新界：强化 LLM 进化搜索的应用 5

分段对齐策略优化：多模态推理 5

DeTrigger：梯度中心方法缓解联邦学习后门攻击 5

SoccerMaster：足球理解的视觉基础模型 5

感知类人机器人的动态运动链接 5

AI 智能体在社会模拟中的局限 5

PEPA：具有人格的自主体化智能体 5

AI 代理下的路径依赖 5

DC-DiT：通过动态分块实现视觉生成的自适应计算与弹性推理 5

可穿戴足部传感器数据中的无监督异常检测：糖尿病足溃疡预防可行性研究 5

ChArtist：统一空间与主体控制的图表生成 5

P^2O：策略与提示词联合优化 5

谱边动力学：神经网络训练相变的分析-经验研究 5

频率增强扩散模型：零样本骨骼动作识别的课程制导语义对齐 5

Mochi：通过元学习实现图基础模型预训练与推理的对齐 5

AgriKD：跨架构知识蒸馏实现高效叶病分类 5

Fonttrio发布：shadcn/ui的开源字体配对库 5

AWS改进Aurora Serverless：启动速度快45%，吞吐量提升30% 5

可破解的机器人割草机：解锁新的安全隐患 5

开源软件的误测：对开源现象的深度反思 5

BALAR：主动推理的贝叶斯智能体循环 5

按时按预算：智能体工作流的约束驱动在线资源分配 5

强化学习能否教LLM长时域推理？表达性是关键 5

迟到的一转：多轮对话中对隐藏恶意意图的应答感知防御 5

PersonaKit：全双工对话中多角色用户测试的即插即用平台 5

HNC：利用困难负样本标题改进细粒度视觉-语言理解能力 5

对数似然、辛普森悖论与机器生成文本的检测 5

测量开源LLM中的评估-上下文差异：对齐管道的异质性证据 5

LLM级联是否值得升级：决策论表征 5

无基准时的LLM安全评分验证：不依赖标签的比较方法 5

灵活的 Agent 对齐：从开放式对话中推断目标 5

ProAgent：为 LLM Agent 系统按需提供感觉上下文 5

Autogenesis：自进化的 Agent 协议 5

WaferSAGE：LLM 驱动的晶圆缺陷分析系统 5

通用推理基准GR-Ben用于评估过程奖励模型 5

小型 LLM 的零样本置信度估计：何时有监督基线不值得训练 5

LLM确定性计算的Prompt方法与执行方式评估 5

深度分析：AI 智能体的内存机制如何失效 5

正确还不够：用执行器反馈训练推理规划器 5

属性引导剪枝：小规模 LLM 中的电路发现与目标修正 5

MediEval：LLM医学推理的统一基准 5

非可验证学习的对话：通过元评估的LLM自进化 5

量化语言模型在医学教科书上的幻觉 5

MetaKE：知识编辑的元学习方法 5

多维度上下文奖励的强化学习框架 5

培养双语婴儿LM：小规模模型的多语言习得研究 5

医学序列模型中缺失模态的处理与解释 5

AI 智能体的信息聚合 5

统一的 4D 世界动作建模：基于视频先验的异步去噪 5

LLM 驱动的神经架构搜索的知识激活 5

Google TPU 上 LLM 推理加速：3 倍性能提升方案 5

Grafana Assistant 数据库可观测性集成快速问题诊断 5

Google「首选来源」功能：看似优化实则推卸责任 4

Claude Code v2.1.138 发布 4

Ollama v0.30.0-rc11 发布（Windows 编译器路径修复） 4

Ollama v0.30.0-rc10 发布（ARM64 交叉编译修复） 4

Ollama v0.30.0-rc9 发布（Windows 构建改进） 4

LaTA：符合 FERPA 的本地 LLM 自动批改系统 4

文本-图谱协同：RAG 双向验证与补全框架 4

随机因果表示学习在个性化医学中化解偏差精度悖论 4

HyperLens：用细粒度置信度轨迹量化 LLM 认知负荷 4

CircuitFormer：模拟电路拓扑自然语言设计语言模型 4

作为 Token 的表格：多表格电子表格理解的图增强表示 4

语言表示在自动竞价中的角色：发现与启示 4

Taklif.AI：基于兴趣的个性化大学作业 LLM 平台 4

AirQualityBench：全球空气质量预报现实评估基准 4

Agent 驱动的价值网络情境感知风险智能 4

Wisteria：DNA语言模型的多尺度特征学习框架 4

语义网中的低资源语言研究 4

时间平滑双鲁棒学习用于无偏知识追踪 4

异构联邦学习中的原型对齐方法研究 4

ReasonSTL：通过工具增强流程奖励学习桥接自然语言和信号时间逻辑 4

从 Token 列表到图结构：稀疏自编码器特征的 Weisfeiler-Lehman 分析 4

定价 Agent 的市场对齐风险：追踪诊断与隐藏对手状态下的强化学习 4

SpatialEpiBench：疫情预测中的空间信息与先验基准测试 4

流模型微调的改进技术：伴随匹配的确定性控制管线 4

TurboQuant 与 DRIVE/EDEN 系列工作的比较评注 4

平坦最小值是幻觉吗？ 4

物理信息神经网络：可学习损失平衡与迁移学习 4

量化卷积深度学习模型的进化微调 4

智能系统的受管制元编程：重新分类 Eval 为受控效应 4

图规范化：可微分最大权独立集的快速二值化动力学 4

特征饥荒作为稀疏自编码器的几何不稳定性 4

多重图可扩展路由的两阶段学习分解 4

创意机器人工具使用：反事实推理方法 4

语义损失微调方法防止因果推理中的模型崩溃 4

AI 错误的教学法：培养学生高阶思维 4

MOSAIC：科学时间序列的因果模块发现 4

高效注意力核心集算法研究 4

利用图片生成器解决训练数据稀缺：森林再生制图数据集 4

缺失的评估维度：10000 份学生作业揭示 AI 教师效果 4

EGA：向量搜索中的冻结编码器自适应方法 4

CFE-PPAR：隐私保护的视频 Transformer 动作识别加密方案 4

预算注意力分配：Transformer 高效计算的成本控制方法 4

CRAFT：持续学习中的遗忘感知干预适应 4

CoMemNet：对比采样实现持续交通流量预测 4

autoPET3 挑战赛：全身 PET/CT 病灶分割自动化 4

揭示 LLM 梯度噪声失衡：信噪比校准 Adam 优化器 4

Q-MMR: 递归加权与矩匹配的离策略评估 4

iPhoneBlur：消费级设备动态模糊去除难度分层基准 4

LicenseGPT：开源数据集许可证合规微调模型 4

T2I-VeRW：文本生成图像的车辆检索细粒度感知 4

随机 Hadamard 变换量化：从启发式到数学证明 4

量子核心用于音频深度伪造检测 4

因果强化学习在复杂卡牌游戏中的应用：万智牌基准 4

正规化架构天生支持 4 位量化 4

VISD: 通过结构化自蒸馏增强视频推理 4

超越自回归 RTG: 决策 Transformer 的序列外条件注入 4

动态思考: 事件流视觉跟踪的稀疏感知混合专家 Transformer 4

持续专家组装: 统一图像修复的实例条件低秩残差 4

BUILD-AND-FIND: AI Agent 管理代码库的评估协议 4

自回归视觉生成需要序言 4

列表级策略优化: 目标投影上的组基 RLVR 4

SymDrift: 对称性约束下的一次性生成建模 4

统一目标条件强化学习与无监督技能学习 4

熵正则化伴随匹配的离线强化学习 4

不可靠反馈下的背景黑盒优化 4

EA-WM: 事件感知的生成世界模型与结构化运动学-视觉动作字段 4

驯服熵悬崖: 自回归视觉生成的可变码本大小量化 4

FunctionalAgent: 迈向端到端函数式设计 4

何时信任想象: 世界模型的自适应动作执行 4

带高斯平滑的软确定性策略梯度 4

Band Together: 抵抗逃避性推广攻击的无目标对抗训练 4

前向前向网络中的累积善意搭便车问题 4

推理时优化缩小表格扩散的合成-真实差距 4

Pro-KLShampoo: 正交恢复白化的投影 KL-Shampoo 优化器 4

NavOne: 视觉语言导航在俯视图上的一步全局规划 4

MEFA: 内存高效的全梯度对抗攻击框架 4

任意辅助路径的流匹配 4

连续时间分布匹配的扩散蒸馏 4

MinMax 递归神经级联 4

非对称策略蒸馏: Token 级别的利用与模仿平衡 4

通过 Hilbert 丛和细胞层的一致几何深度学习 4

ORTHOBO: 正交贝叶斯超参数优化 4

3D MRI 医学影像的可控 2D 切片导航预训练方法 4

DINORANKCLIP：DINOv3 蒸馏用于视觉-语言预训练 4

视觉模型行为的概念化演绎和对比解释 4

BAMI：GUI 理解的无训练偏差缓解 4

多模态蒸馏：学习教师的模态级 Gram 矩阵 4

高效的仿生视觉目标导航方法 4

超越事实准确性：缓解推荐系统中的偏好不一致解释 4

通过上下文规约使 AI 评估部署更具相关性 4

解纠缠生成图表示学习 4

ReMAP：任意阶马尔可夫随机场的神经参数化 MAP 推断 4

自动驾驶中的多尺度高光谱分割 4

视频嵌入对齐与匹配方法 4

需求工程中的伦理档案建立 4

Kolmogorov-Arnold 网络实践指南 4

视觉语言动作模型的异步流匹配 4

视觉语言动作模型的技能知识演进 4

可解释性引导的精度与可解释性对齐 4

高保真神经音频编码的稀疏量化 4

PixelGen：感知监督改进像素扩散 4

视觉推理的分治思维方法 4

通过时间抽象的前向-反向表示中的谱对齐 4

Caracal：通过谱混合的因果架构 4

阅读清单 05/09/2026 4

用Python 3 LSP服务器处理Python 2代码（多少还是可行的） 4

LLM隐层中可解码却无法修正的失败模式 4

重新思考适配器位置：主导适配模块视角 4

OPSD压缩RLVR教学：推理模型的后强化学习压缩阶段 4

补丁效应图核方法在LLM可解释性中的应用 4

AI与人类评判批判性思维的反论证 4

从无查询摘要数据集生成查询聚焦摘要数据集 4

隐私保护联邦学习中LoRA组件的自适应选择 4

IRC-Bench：第一人称回忆中基于上下文线索的实体识别基准 4

极限情况下的对比识别与生成 4

TIDE：模型每一层都了解上下文中的令牌信息 4

低资源口语方言的语义分割方法 4

WavCube：通过语义-声学联合建模统一语音表示 4

E = T*H/(O+B)：专家混合生态的无量纲控制参数 4

消费级CPU上的Litespark推理：三元神经网络自定义SIMD优化 4

递归代理优化 4

MedMNIST 数据集无误差训练方法 4

从无监督视觉轨迹学习动作模型 4

经验驱动检索策略的 Agent RAG 技能框架 4

互联网规模化搜索困难基准 4

深呼吸：自步序列生成的自适应计算 4

DialectLLM：超越标准美式英语的方言感知对话生成框架 4

CAMEL：用于奖励建模的信心门控反思 4

自适应贪心帧选择：长视频理解优化方法 4

压缩 Transformer 的结构敏感性：相对误差传播与层移除 4

筛选就足够了 4

奖励分数匹配：流和扩散模型的统一微调法 4

离策强化学习中评论器学习的低秩自适应 4

低语言语音后处理增强说话人验证 4

多任务学习增强科学课堂话语分析的推理成分分类 4

模型应该多快提交到监督？Tsallis损失连续统中的推理模型训练 4

RSAT：结构化归因让小语言模型成为可靠的表格推理器 4

探针几何对齐：清除模型跨序列记忆化特征 4

预测性和规范性 AI 优化野火扑灭资源配置 4

LLM 系统的持续知识更新：多时间尺度记忆动力学 4

奇点不是技术，是友谊 3

多 Agent AI 系统中的授权传播：身份治理基础设施 3

Agent 驱动的交换相关密度泛函发现 3

LANTERN：LLM 增强的神经符号迁移和经验门控推理网络 3

住房潜力通用数据模型与城市数字孪生 3

BitCal-TTS：量化推理模型的位校准测试时间缩放 3

局部感知隐私类识别在极端标签偏移域适应中的应用 3

检索条件拓扑选择在多 Agent 代码生成中的预算守恒 3

Transformer 记忆的吸引子几何：从冲突仲裁到自信幻觉 3

GCCM：通过对比一致性模型增强生成图预测 3

知识图谱路径作为自进化搜索 Agent 的中间监督 3

SDFlow：时间序列生成的相似性驱动流匹配 3

安全关键 ATR 系统解释性评估：事后方法的局限与稳健 XAI 路径 3

置信度是关键：共形预测在可渗透肽生成设计中的应用 3

HEDP：域增量学习的混合能量-距离提示框架 3

Von Neumann 网络 3

长视野 Q-学习：通过 n 步不等式的精确价值学习 3

XDecomposer：多相 X 射线衍射集合分解先验学习 3

零空间约束对比视觉遗忘用于 MLLM 反学习 3

软机器人的拓扑驱动防缠结控制 3

PPO 基础的平流层高空平台基站动态定位 3

穿戴 IoT 设备中基于知识蒸馏的内存高效 EDA 降噪 3

Phenix 中冷冻电镜密度图分割的增强 3

走向信息的推论主义解读：基于证明论语义学 3

语义通信与排队论的交汇：跨层延迟优化 3

教师引导 VAE 中的常数崩溃可验证证书 3

VARS-FL：物联网非 IID 联邦学习中的客户端选择 3

Lipschitz 常数贝叶斯方法及其在 Vision Transformer 中的应用 3

强化学习中的选择性适用迹学习方法 3

CredibleDFGO: 带信度监督的可微因子图优化 3

通过 Wasserstein 梯度流学习离散自回归先验 3

超平面回归: 通过体积最小化的条件分位数 3

随机因果有向无环图的拓扑排序判别 3

研究工件的安全性分析 3

隐式奖励过拟合与 RLVR 中的低秩动力学 3

GONO 框架：方向一致性作为补充优化信号 3

神经图匹配的度量保真方法 3

目标驱动查询回答：一阶和二阶依赖与等式 3

精化 Gelfond 理性原则：答案集语义的基础 3

大模型代码理解的鲁棒性分析 3

基于队列的主动模态获取 3

随机赌博机的对抗攻击研究 3

可证明安全强化学习中的梯度应用 3

隐私保护推荐的联邦模型综述 3

共形预测的标准化残差方法 3

脑启发式循环网络平衡传播方法 3

摩擦强化学习算法 3

强化学习的优化动力学分析 3

反共谋机制在多智能体系统中的映射 3

组合图像检索的思维链增强方法 3

因果发现中的专家引导模型平均 3

分解式 LLM 服务的理论最优比率 3

任务漂移下的终身学习路由优化 3

遗忘幻觉：扩散模型的潜变量攻击 3

遗忘模型审计的成员推断方法 3

单细胞转录组分析的结构信息融合 3

自回归时间序列预测的优化方法 3

梯度下降如何适应网络任务容量 3

奇偶性、敏感性与 Transformer 架构 3

测试驱动代码生成的理论分析 3

动作流匹配方法 3

自适应课程强化学习工程优化 3

纵向临床预测的风险假设框架 3

语义通信的码率失真复杂性权衡 3

量子退火驱动的分子设计 AI 3

医学时间序列 Transformer 架构重思 3

多模态间的语义偏好差异 3

声门波形提取与病理评估管道 3

Pluralistic：特朗普徒劳的寻找目标之旅（2026年5月9日） 3

在非常规shell环境中使用GNU Emacs Tramp系统的笔记 3

SignSGD何时何故超越SGD：基于L1范数下界的理论研究 3

从专家演示通过逆强化学习学习推理奖励模型 3

Cataract-LMM：手术视频深度学习的大规模多任务评测基准 3

PulseLM：脉搏-文本学习的基础数据集与基准 3

从文档到跨度：LLM证据型ICD编码的可扩展监督 3

asRoBallet：欠驱动球体动态的摩擦感知强化学习仿真迁移 3

超线性回报：创业成功的数学逻辑 3

如何完成伟大工作：Paul Graham 的创业指南 3

获取新想法的秘诀：如何保持创意源源不断 3

使用自适应日志丢弃规则消除噪杂日志 3

OpenAI Codex 0.131.0-alpha.4 版本发布 2

OpenAI Codex Rust 0.131.0-alpha.3 版本发布 2

OpenAI Codex 0.131.0-alpha.2 版本发布 2

加速 AI：通过 GCSFS 和 Rapid Bucket 将 Google Colossus 引入 PyTorch 2