2026-05-20 · 周三 生成 19:22:14
覆盖源
211
条目数
654
高分 8+
53
主题簇
3
🌟 今日头条
谷歌推出 Gemini 3.5 Flash,4 倍速度领先竞品
谷歌在 I/O 2026 大会推出 Gemini 3.5 Flash,这是一款为多步推理和自主 agent 任务优化的突破性模型。最大特点是速度快——比竞争对手的前沿模型快 4 倍。在权威基准上,Flash 在 Terminal-Bench 2.1 得分 76.2%,在 MCP Atlas 得分 83.6%,都超过了 Gemini 3.1 Pro。定价极具竞争力:输入 token 每百万 1.5 美元,输出 token 每百万 9 美元。Flash 已成为 Gemini 应用和谷歌搜索 AI 模式的全球默认引擎。一个更强大的 Gemini 3.5 Pro 将在下月推出。对开发者来说,这意味着能用更低成本构建复杂的多步工作流;对企业来说,AI 应用的运营成本将显著下降;对自媒体创作者,可以围绕「AI 模型成本战升级」「速度与质量的新平衡」等角度写选题。这个发布直接挑战 OpenAI 和 Anthropic 的市场地位。
💬 编辑点评
速度即垄断——4倍竞速+破坏性低价,Flash不是升级,而是强行改写了整个LLM商业底线。对手要么跟价,要么出局。
阅读原文 → 产品动态
🔥今日要点
10/10 新产品
Google在I/O 2026推出Gemini Omni多模态模型,能接收文本、图像、音频或视频输入,直接生成高质量视频输出。Google内部昵称其为'视频领域的Nano Banana',在视频生成和编辑中展现了业界领先的性能和低延迟特性。
9/10 新产品
Stability AI 推出 Stability Audio 3.0 音频生成模型家族,包含四款不同规格模型,参数从45900万到27亿。小型模型专注设备端运行,可本地生成两分钟以内的音频;中型和大型模型支持创作超过6分20秒的完整音乐,
9/10 资讯
Katherine Blunt and Rolfe Winkler, reporting for The Wall Street Journal from Google I/O (gift link): Google is supercharging its Gemini artificial-in…
9/10 资讯
The next big thing for Nvidia will be CPUs for AI agents, $200 billion worth, CEO Jensen Huang predicts.
9/10 资讯
Nvidia announced another record revenue figure after market close on Wednesday, but forecasted that revenue growth would slow in the following quarter…
9/10 资讯
I n just a short time, we’ve seen AI transition from simple chat interfaces to autonomous agents capable of function calling, code execution, and pers…
📊今日主题热点
📌 Google Gemini I/O 浪潮
Google I/O 2026 期间 Gemini 系列的多个产品发布:从 3.5 Flash、Omni 模型到 Agent、Workspace 新功能
📌 大模型融资与商业巨变
Anthropic 百亿级融资、OpenAI IPO、SpaceX 与 AI 公司的算力合作大单,行业巨头商业动向集中爆发
📌 多模态生成技术突破
音视频图像生成领域的新模型和功能发布:从文生音乐、4K 视频生成到 AI 设计工具
📖值得深入
🕐 约 3 分钟 · 行业分析 8/10
LinkedIn开始打击AI生成内容:自动降低劣质、无新意的机器贴文推荐
💡 行业趋势与动态分析
LinkedIn宣布了一项内容审核举措,针对AI生成的贴文,特别是那些包含互动诱饵和明显AI痕迹的内容。平台将不再重点推荐那些仅是重复现有观点但无新意贡献的帖子。LinkedIn的工程和编辑团队会分析内容模式以识别问题AI生成物。值得注意的是,LinkedIn保留了帮助用户通过AI改进写作的工具,形成一个细微的政策:用AI辅助改进写作是允许的,但低质量、衍生性AI生成垃圾内容会被压低推荐。这反映了全行业在应对AI生成内容泛滥时的共同困境——既要保持平台质量,又要接纳AI。对内容创作者而言,这信号表明原创、经思考的AI辅助写作会获得更好分发,而懒惰式AI生成则无法获得曝光。这举措表明AI已成平台常态,但质量把控是必须。
阅读原文 →
🕐 约 3 分钟 · 行业分析 7/10
xAI去年亏损64亿美元--SpaceX的IPO文件揭示其支出远未停止的原因
💡 行业趋势与动态分析
SpaceX的IPO文件首次披露了xAI在2025年的财务状况,显示该AI公司去年亏损高达64亿美元。文件同时揭示了xAI计划对Grok进行大规模扩张的战略,解释了马斯克旗下AI业务持续高额支出的原因。这份公开文件为外界提供了观察马斯克AI产业投资规模与财务表现的罕见窗口。
阅读原文 →
🕐 约 3 分钟 · 行业分析 7/10
SpaceX拿下400亿美元Anthropic大单,正洽谈扩大AI计算服务
💡 行业趋势与动态分析
SpaceX正向人工智能公司Anthropic提供大规模AI计算服务,并正与其他公司洽谈类似业务。根据SpaceX向SEC提交的文件,Anthropic与xAI达成了一项为期五年的交易,每月支付12.5亿美元购买300兆瓦计算量,直至2029年5月,总额预计超过400亿美元。该合同允许双方在90天通知后终止。SpaceX表示,此举旨在将未使用的计算容量变现,并预计未来将签订更多此类服务合同。
阅读原文 →
🕐 约 3 分钟 · 行业分析 7/10
冲刺 9 月上市,OpenAI 最快本周五提交 IPO 招股书草案
💡 行业趋势与动态分析
据CNBC报道,OpenAI预计最快本周五递交首次公开募股(IPO)招股书草案,这标志着公司向资本市场迈出关键一步。首席执行官萨姆·奥尔特曼设定最早于2026年9月上市的目标。公司正与高盛和摩根士丹利合作,借助这两家投行的资源推动上市申报和承销安排。此前,埃隆·马斯克针对OpenAI的诉讼失利后,上市障碍消除,进程明显加速。OpenAI目前私募估值超过8500亿美元,若顺利推进,可能成为公开市场历史上规模最大的首发之一。此外,公司最早考虑在今年第四季度上市,内部治理和运作已开始向上市公司转型,准备工作持续进行。
阅读原文 →
🕐 约 3 分钟 · 行业分析 7/10
SpaceX与Anthropic合作提供大规模AI算力服务
💡 行业趋势与动态分析
正如最近与@AnthropicAI扩大合作所展示的,@SpaceX正在大规模提供AI算力服务。 我们正在与其他公司进行类似合作的讨论。 随着时间的推移,特别是通过轨道数据中心,我们预计将以极高的规模提供AI服务。
阅读原文 →
📂按类别浏览
新产品
GitHub开源的Spec Kit在GitHub上突破95,000个star,其核心价值在于强制执行一个规划优先的工作流:AI智能体在编写代码之前必须生成结构化的规范、需求和设计文档。这种规划优先的方式显著提升代码质量、降低bug率并增强代码可维护性——解决了一个常见问题,即AI生成的代码在语法上正…
谷歌宣布了其搜索引擎与AI技术融合的最新进展,标志着AI搜索进入新阶段。此次更新旨在将搜索引擎的广度与AI的深度理解能力相结合,目标是提供更智能、更直观的搜索体验,推动搜索技术的下一代演进。
5月22日,xAI宣布,其用户现可在开源个人助理OpenClaw中直接使用Grok模型。所有持有SuperGrok或X Premium订阅的用户均可使用该功能。OpenClaw是一个开源的、本地优先的智能助手,可在多种硬件上运行并保持跨会话记忆,同时能接入WhatsApp、Telegram等多款主流…
观点/深度
研究推出 ResearchArena 框架,让多个 AI 智能体独立完整执行科研流程:从选题、实验、写论文到自我润色。这项研究深入测试了当前大模型能否进行有意义的独立科学研究,而非仅做信息汇总。
研究用稀疏自编码器分析 Llama 3.1 和 Gemma 2 如何编码文学特征。发现了四类内部特征:影响词的命名门控、第一人称表达集群、风格调制器和组合特征。这些机制理解有助于提升模型可解释性。
研究将保角预测方法应用于 AI 智能体评估,为质量预测提供了无分布假设的可信度量。方法在 24 小时预测范围内校准误差低于 0.02,在智能体更新后能准确扩大置信区间 35%。还支持多智能体管道的组合不确定性估计。
行业分析
加州陪审团全票驳回埃隆·马斯克对 OpenAI 和 CEO 山姆·阿尔特曼的诉讼,理由是诉讼超过法律诉讼期限。值得注意的是,法院仅基于程序问题(时效过期)就驳回了案件,并未实质审查马斯克指控的有效性。马斯克的核心指控是:他在 OpenAI 早期捐赠了 3800 万美元,期望公司保持非营利使命造福人类…
Qwen Conference 2026:主题演讲议程 AI原生云、Agent原生云架构、推理的未来,以及多模态视觉技术发布。没有冗余内容,只有面向全球规模的工程蓝图。 注册:https://click.qwencloud.com/m/20000000190/
英伟达2027财年第一季度业绩创新高,营业总收入达816.15亿美元,同比增长85%。净利润为583.21亿美元,同比激增211%。数据中心业务是核心增长引擎,营收达752亿美元,同比大增92%。公司毛利率提升至74.9%,并宣布了800亿美元股票回购及提高季度股息。
技术
针对超大规模大模型推理,ZCube网络架构通过取消Spine层、将Leaf交换机分组并全互联等创新设计,有效解决了推理网络的拥塞问题。该架构在集群实测中,实现了交换机与光模块资本支出减少33%、GPU平均推理吞吐提升15%,同时将首token延迟的P99值大幅降低40.6%,在降低成本的同时显著提升…
OpenAI开发的人工智能模型成功解决了数学界悬而未决逾80年的"单元距离问题",并由此推翻了离散几何领域的一个核心猜想。这一突破被视作人工智能驱动数学研究的里程碑事件,标志着AI在基础科学理论探索中取得了实质性进展。
🚨我们的论文已在PNAS发表:我们发现经典的人类说服技巧以一种"类人"的方式对AI有效,使其同意不当请求(将顺从率从35%提高到51%) 该技巧对一系列主流大语言模型有效,尽管较新的模型抵抗力更强 https://www.pnas.org/doi/10.1073/pnas.2535868123
教程
OpenAI Codex SDK 0.132.0 新增 Python 一级认证(API 密钥、浏览器登录、设备登录流),改进纯文本工作流 API,增强 TurnResult 返回信息。
Anthropic美国中端市场业务负责人Travis Bryant利用Claude Cowork自动化销售管理工作。该工具帮助他高效完成客户倾向性评分、每日客户简报准备及每周销售预测报告生成,每晚自动处理4000个账户数据,替代了以往跨部门团队需数百小时完成的工作。
提示💡 你无需担心自动路由(以及所有单独模型)的缓存未命中问题 OpenRouter会将你的会话固定在一个模型/提供商上,直到缓存过期
📭今天可以忽略

这些被自动过滤了。给你看看原因,免得你担心错过:

📎 长尾信息 (230) · 点击展开
大学生在毕业典礼上嘘声反对 AI 赞美演讲 5
AI 助力电信 CFO 优化网络资本支出决策 5
Learn-by-Wire 训练控制治理:压力下的自主训练稳定性优化 5
KAN-MLP-Mixer:Kolmogorov-Arnold 网络在 IMU 动作识别中的应用研究 5
干扰感知的多任务遗忘 5
学习工作流移交:接口约束下的收敛学习 5
可发现的代理知识:知识图谱能力框架 5
理解不同的不确定性:波动、随机、探索 5
模态冲突幻觉中的注意力头不平衡 5
MOCHA:代理技能优化的多目标切比雪夫退火 5
高效收集集体分歧的方法 5
生成式评估一致性:LLM 自适应评估的有效性标准 5
SceneCode:可编辑室内场景的可执行世界程序 5
多模型 LLM 调度器:卸载和抢占的经验研究 5
表格基础模型与战略表格数据的对齐方法研究 5
超越理性幻觉:行为现实主义的战略分类方法 5
潜在强化学习动作投影:可泛化可扩展的图组合优化 5
记忆增强强化学习 Agent 在 CAD 生成中的应用 5
CogScale:序列处理可扩展基准测试 5
GroupAffect-4:四人协作交互的多模态数据集 5
概率微型递归模型 5
技能何时无法帮助:工具型 Agent 在网络安全中的程序知识研究 5
神经符号学习在推理时论证中的应用 5
Aristotle API 在 Lean 4 AI 辅助定理证明中的应用:草蜢问题形式化案例研究 5
并非每个评分规则都一样有效:RLVR 的策略感知评分奖励 5
HaorFloodAlert:孟加拉国豪尔湿地 72 小时洪水预报的去季节化机器学习集成 5
查询条件化图检索:个性化可穿戴设备数据中的上下文 LLM 推理 5
社区设施管理中的去中心化自治组织与区块链激励框架 5
Mask-to-Correct+:利用检索器多样性进行事实纠正 5
PO4ISR 可重现性分析:诊断和缓解 LLM 推荐系统中的语义漂移 5
特征有生命周期,我们应该关注 5
维度均衡改进大规模时空预测性能 5
通过完全循环 Transformer 稳定回路 5
ReCrit:用于科学评论推理的转移感知强化学习 5
PROWL:世界模型学习的优先级遗憾驱动优化 5
RecoAtlas:LLM 推荐代理的语义合理性到集合级效用 5
基于块的双解码器架构 5
度量梯度投影用于稳定多智能体策略学习 5
扩散世界模型中的记忆专家组合 5
神经流体代理中的对称性与等变性 5
前沿叠加的出现:莫比乌斯吸引子与级联监督 5
注意力机制的路由与过滤结构 5
通过卡尔曼滤波的精度追踪 Transformer 5
VCR:为不完整可穿戴信号学习有效的上下文表示 5
急诊科等待时间综合预测原型 5
图驱动跨行业框架用于供应链反洗钱检测 5
翻译中的丢失与发现:神经码本通道的变分诊断 5
超资源受限可穿戴设备上的隐私保护心电监测 5
SAGE:LLM 强化学习中的锚点形成与引导探索 5
FLUIDSPLAT:从稀疏传感器重建物理场 5
极值栈的科尔莫戈罗夫复杂性表征 5
轻量化动态模型融合 5
轻量快速的后门模型检测方法 5
CounterFlow:反事实视频音效生成的两阶段推理采样 5
OEP:通过局部正确但不可转移经验的LLM自进化代理中毒 5
HypergraphFormer:从LLM学习超图用于可编辑户型生成 5
预训练的形成:合成任务分布如何决定表格基础模型质量 5
利用自监督特征实现艺术作品分类 5
应对未知威胁:多轮多模态攻击的预测防御 5
RLFTSim:基于强化学习微调的逼真可控多智能体交通仿真 5
AI驱动的劳动力政策计算测试台 5
何时不预测:自监督学习与弃权策略在糖尿病视网膜病变筛查中的应用 5
COBALT:基于云端遥操作的机器人学习众包平台 5
Flash PD-SSM:内存优化的结构化稀疏状态空间模型 5
Bridge:城市配送需求的检索增强时空建模 5
用于床旁肺炎诊断的端侧持续学习与动态损失 5
低资源医疗环境中医学影像的量化机器学习模型 5
AI时代的语言无障碍服务与翻译员价值 5
ExECG:可解释的心电图AI诊断框架 5
ContextFlow:长时任务智能体的层级对齐 5
草稿模型的前置安全防护机制 5
RE-VLM:事件增强的场景理解模型 5
IMLJD:印度婚姻诉讼分析数据集 5
3D动画的自适应运动迁移技术 5
多尺度生成模型的热耗散流匹配方法 5
持续模型合并:ODE视角的新理解 5
时间序列模型的预训练收益对比研究 5
基于采样的安全强化学习方法 5
ARC-RL:强化学习实验游乐场 5
EgoCoT-Bench:多模态模型操作推理基准 5
AffectAI-Capture:小组会议研究的可重复多模态协议 5
德国法律代码的文本分块处理方法 5
光滑分段切割:神经算子处理不连续性与尖锐转换的方法 5
块球向量量化方法 5
评论者分歧:RIS 辅助无线控制系统的自适应奖励毒化攻击 5
更少草稿,更多检索:推测解码的混合树构建 5
超越 JEPA 的各向同性:哈密顿几何与辛预测 5
超越预测准确率:模型-脑对齐的目标空间恢复分析 5
思维原子:微状态的通用脑电图表示学习 5
IR-Agent:红外光谱结构分析的专家启发型 LLM 代理 5
LLM 空间构建的 2.5-D 分解方法 5
回忆不够:个性化语言系统的承诺边界 5
CBT-Audio:认知行为疗法患者痛苦程度的音频语言模型评估 5
基于 MFCC 的乐器识别深度神经网络 5
GraphPINE:可解释药物反应预测的图重要度传播 5
数字生存之声:社交媒体披露到家暴受害者支持 5
邻近扩散神经采样器 5
WARC-Bench:网络存档GUI任务执行基准 5
PlantTraitNet:全球植物特征推断多模态框架 5
HarmonicAttack:自适应音频水印移除攻击 5
开放集领域适应:背景分布漂移下的高效解决方案 5
皮肤癌检测多模态系统 5
WIND:零样本大气建模的逆向扩散方法 5
在普通CPU上实现实时肠镜息肉分割 5
蛋白质自回归建模:多尺度结构生成 5
脑机接口合成数据生成:综述与基准 5
IMPACT:开放集时间序列异常检测的影响建模 5
DSPR:工业时间序列可信预测的双流物理残差网络 5
R³L:从相对空间关系推理3D布局 5
嵌套时空时间序列预测 5
不平衡学习的双层优化知识蒸馏平衡方法 5
随机惩罚壁垒法在约束机器学习中的应用 5
缓速 fMRI 微调改进快速 ECoG 预测 5
LLM 阿拉伯语金融情感分析:沙特市场证据 5
社交互动 Agent 的信任校准与性别多模态行为 5
重新思考 LLM 智能体的记忆机制:超越原子事实的终身学习 5
FlexDraft:灵活推理解码的注意调优与奖励指导校准 5
奖励信念而非行为:长期智能体的一致性引导学分分配 5
CEPO:对比证据策略优化的强化学习自蒸馏 5
Gemma 4 31B 冻结模型的交叉分布头重要性指纹 5
Google 搜索 AI 升级:更多广告集成 5
NanoClaw 创始人拒 2000 万美元收购,自融 1200 万美元 5
Strands Evals 推出多模态评估器:MLLM-as-a-judge 5
用 AI Edge Portal 优化本地 LLM 性能 5
AI Gateway:跨分布式团队的集中推理扩展方案 5
认识 Ask Advisor:AI 驱动的协作助手 5
Vibe 编程即将登陆你的手机 5
本周热点:人造鸡蛋与 Musk 失利 5
Kotlin 真的能提升效率吗?数据这样说 5
何时重新承诺:长期视觉语言推理的时间抽象发现 5
ChromaFlow:工具增强 Agent 评估中的编排开销烧蚀研究 5
符号世界模型上的双层策略学习:长时域规划 5
闭环系统的架构极限与人类-LLM系统的设计困境 5
HeadRank:无解码偏好对齐注意力的段落重排方法 5
SAM3 在病理图像分割中的应用评估 5
技能新词:面向基于技能的持续学习 5
HoReN:大规模顺序模型编辑的规范化 Hopfield 检索 5
协议驱动开发:通过不变量和证据管理生成软件 5
超越困惑度:低秩预训练的几何与谱分析 5
IoT传感器数据处理的新方法 5
极低数据下细粒度视觉分类的预训练目标研究 5
LLM 论证重建系统 5
Cubit:核岭回归Token混合器 5
增量势能接触模型的高效多重网格预条件非线性共轭梯度法 4
可穿戴 PPG 心血管稳定性的非线性复杂度指标 4
基于理论语言学专家标准的数据驱动习语研究 4
我们宣布在密苏里州的新社区投资 4
Lakebase:无缝经济的营销活动管理工具 4
Databricks 与 Virtue 基金会合作在 72 国家连接医疗志愿者 4
约束程序到本地搜索的转换方法 4
多项式逻辑 MDP 的最小最大最优方差感知遗憾界 4
可解释污水数字孪生:自适应上下文条件化结构模拟器 4
通过 CNN 模式识别的流线化约束推理 4
KG-ASG:碰撞知识引导的闭环对抗场景生成 4
防止Bandit反馈偏离持续LLM推荐系统更新目标 4
SCAFDS:基于边缘特征图注意力的银行间欺诈检测 4
MoCo-EA:利用对抗模式连通性的高效进化攻击 4
SynGR:跨模态协同在生成式推荐中的应用 4
LiFT:从2D生成器提升的层间特征轨迹用于3D图像生成 4
通过多时间尺度预测学习光伏功率输出的长期时间依赖关系 4
CRAFT:多模态视频问答的评论家优化自适应关键帧选择 4
MANGO:在线持续学习的元自适应网络梯度优化 4
反事实似然检验:私密推理通道中的间接影响分析 4
GOAL:动态多目标优化的图基础扩散求解器 4
GRASP:交互图中的确定性论证排名 4
林冠下森林环境的强化学习四旋翼巡检行为 4
基于局部距离的数据嵌入算法 4
自愈Web应用的容错与恢复架构 4
EviTrack:延迟消歧的优化采样方法 4
DEFLECT:机器人动作执行的延迟鲁棒方法 4
游戏场景中的视觉语言模型脑部对齐研究 4
样本高效学习中的动态梯度控制 4
强化学习干预时机的最优窗口 4
目标对抗性攻击的下游无关方法 4
机器人导盲犬的无障碍导航交互系统 4
TORQ:新一代模型量化加速方法 4
镜头隐私保护的动作识别基准 4
隐式动作分块的机器人控制方案 4
模型特征解释的频谱梯度方法 4
卫星遥感图像的风格迁移与数据增强 4
FLUXtrapolation:生态系统通量外推基准 4
基于答案集编程的长期电网规划 4
农作物预测的混合建模框架:动态参数校准与多任务学习 4
折扣 MDP 中的递归熵风险优化:样本复杂度界 4
考古遗址发现的半监督伪标签方法 4
数据驱动的模型预测控制加速方法 4
NORi:海洋边界层参数化的机器学习增强方法 4
更长时间上下文如何增强多模态叙事视频脑部处理 4
ViroGym:病毒蛋白评估的现实大规模基准 4
One-Block Transformer:脑电认知工作负荷评估 4
EfficientTDMPC:样本高效连续控制的改进目标 4
VAE恒定坍缩的单纯形证人证书 4
日语形态生成中的书写感知错误分析 4
Rust 0.133.0-alpha.4 版本发布 4
Rust 0.133.0-alpha.3 版本发布 4
Rust 0.133.0-alpha.2 版本发布 4
Rust 0.133.0-alpha.1 版本发布 4
Urban Outfitters 迁移至 AlloyDB 实现重大成本节省 4
AWS 网络韧性指南:勒索软件和破坏性事件的恢复方案 4
Pip 26.1 发布依赖冷却与实验性锁文件,增强供应链安全 4
YouTube Demand Gen:助力内容增长的新广告工具 4
Google 新增通用商业协议与 AI 工具助力零售商增长 4
绿钢初创 Boston Metal 加码关键矿物领域 4
我给 OpenClaw 智能体安装了物理身体 4
Go 语言性能分析实践指南 4
Kubernetes 流量加密:cert-manager 与 Let's Encrypt 实战指南 4
从 ASP.NET Framework 迁移到 ASP.NET Core 4
Node.js 26.2.0 发布 4
假设会削弱属性 4
脑功能连接的自监督学习:网络感知标记化方法 4
Q-learning 伴随匹配方法 4
Google与Warby Parker合作推出'Intelligent Eyewear'智能眼镜 3
Moda设计Agent:学习品牌风格,自动生成符合调性的设计资产 3
版本 v2.1.146 发布 3
基于多尺度交叉注意力Transformer的头皮脑电跨主体脑内活动重建 3
状态空间模型神经算子的稳定性与离散化误差 3
马尔可夫链解码器克服Lipschitz生成模型的重尾局限 3
满秩相关矩阵上的黎曼网络 3
肌腱驱动连续体机器人设计空间代理建模的神经算子 3
规划器可行的图PDE值扩展用于稀疏目标条件规划 3
带预测的分布式共识协议 3
没有人注定伟大 3
TechCrunch Startup Battlefield 200:报名截止 5 月 27 日 3
三个新的静态代码分析传感器 3
Google Marketing Live 2026 营销大会 3
随 JetBrains 搬迁:你需要知道什么 3
Python email 包读取邮件的注意事项 3
阅读 Cindy Cohn 新著《隐私卫士:我对数字监控的 30 年抗争》 3
你不需要豪华装备,也不需要学位,也能靠这个赚钱当饭碗 3
脑活动疼痛识别的轻量级 Transformer 3