🌟 今日头条
Anthropic发布Fable/Mythos 5:百万token上下文,性能翻倍
Anthropic推出两个新旗舰模型Claude Fable 5和Mythos 5。两者共享同一底层架构,区别在安全策略:Fable 5配备安全分类器可拒绝特定请求,Mythos 5无此限制但仅限Project Glasswing项目内授权组织使用。核心突破是百万token上下文窗口(默认100万),最高支持128K输出token——远超Opus 4.8。定价为输入token每百万$10、输出每百万$50,是Opus的双倍。智能推理(Adaptive Thinking)默认开启、不可禁用,支持调整推理深度。独特之处是强制30天数据保留政策(Anthropic首次)和自动降级重试机制——拒绝请求自动转向其他Claude模型,避免重复计费。现已上线Claude API、AWS/Google/Microsoft等云平台。
💬 编辑点评
百万 token 和双倍价格是同比增长,但关键是 Adaptive Thinking 能否真正提升推理质量。对需要长上下文的专业用户有吸引力,普通创作者实际应用场景有限。
01
苹果WWDC发布全新Siri AI:深度整合个人上下文和跨应用操作
10/10
新产品
苹果在WWDC 2026发布全新设计的Siri AI,称为有史以来最智能、最博学版本。新Siri深度整合iPhone、iPad、Mac、Apple Watch和Vision Pro,核心能力包括:根据用户消息、邮件、相册抽取个人上下文;跨应用执行操作;理解屏幕内容并解答问题;获取实时网络信息。
9/10
教程
Pyodide 314.0 现在支持将为其构建的 Python 包直接发布到 PyPI,基于 PyEmscripten 平台标准(PEP 783)。这简化了与网络 Python 运行时兼容的包的分发流程,让开发者更便捷地共享和安装跨平台 Python 包。
9/10
新产品
Google Research 基于 Gemini 3.1 Pro 开发的 Gemini-SQL2,在 BIRD 文本转 SQL 基准测试中达到 80.04% 准确率,大幅超越 OpenAI 和 Anthropic 的方案。
9/10
教程
微软与三所中国大学联合开发的 SkillOpt,通过优化 AI 代理的指令文档来提升性能。该方法只需训练格式化的 Markdown 文件,就能增强 GPT-5.5 的能力。这是一种简洁而有效的代理优化方案,对构建更强的 AI 系统有参考价值。
9/10
新产品
Anthropic 的 Claude Fable 5 在 FrontierMath 最难难度级别上达到 88% 准确率,相比 Opus 4.5(2026 年初不足 10%)有巨大提升,超过 GPT-5.5 的 75%。
9/10
新产品
月之暗面 Moonshot AI 发布的 Kimi K2.7 Code 是一个万亿参数的开源模型,专为编程任务设计。虽然在编码基准测试上落后于 GPT-5.5 和 Claude Opus 4.8,但成本仅为前者的 1/12。这为成本敏感的开发者和企业提供了经济的 AI 编程方案选择。