🌟 本日のヘッドライン
Google、最速フロンティアAIモデル「Gemini 3.5 Flash」をローンチ
Googleは2026年のI/Oカンファレンスで、マルチステップ推論と自律エージェント実行向けに特別に設計されたブレークスルーモデル「Gemini 3.5 Flash」を発表しました。ライバルのフロンティアモデルより4倍高速で、Terminal-Bench 2.1で76.2%、MCP Atlasで83.6%を達成し、Gemini 3.1 Proを上回ります。入力トークンあたり100万トークンで$1.50、出力で$9という競争力のある価格で、現在GeminiアプリおよびGoogle Search AI Modeのデフォルトエンジンとして世界中で利用可能です。より高度なタスク向けのより大規模なGemini 3.5 Proバリアントは来月ローンチされます。エージェントベースのワークフローを構築する開発者、推論コストを最適化するチーム、本番グレードの推論が必要な研究者にとって、これは品質を維持しながら高速かつ低コストのフロンティアモデルへのシフトを表しています。Googleの製品全体での即座の利用可能性は、OpenAIとAnthropicに対する攻撃的なマーケットポジショニングを示しています。
💬 編集コメント
スピード=新しい護堀。4倍の速度と破壊的価格で、Flash は競争を一変させる。対手は値下げするか市場から脱落するか、二者択一を迫られる。クリエイターの効率単価は次元が変わった。
10/10
新製品
Googleは2026年のI/Oで、テキスト、画像、音声、またはビデオを入力として受け取り、ビデオ出力を生成するマルチモーダルモデル「Gemini Omni」を発表しました。内部的には「Nano Banana for…
9/10
新製品
Stability AI 推出 Stability Audio 3.0 音频生成模型家族,包含四款不同规格模型,参数从45900万到27亿。小型模型专注设备端运行,可本地生成两分钟以内的音频;中型和大型模型支持创作超过6分20秒的完整音乐,
9/10
ニュース
Katherine BluntとRolfe WinklerがWall Street JournalにGoogle I/Oからレポートしています(ギフトリンク):Googleは、Gemini人工知能モデルをスーパーチャージしており、エージェント型AI時代での競争力を高めています。同社はGemini Sparkと呼ばれるパーソナルエージェントの展開を開始しました。
9/10
ニュース
NvidiaのCEO・Jensen Huangは、Nvidia向けの次の大きなチャンスはAIエージェント向けのCPUであり、2000億ドル相当だと予測しています。
9/10
ニュース
Nvidiaは水曜日の市場終了後に別の記録的な収益数字を発表しましたが、翌四半期の収益成長が鈍化することを予測しました。
9/10
ニュース
短時間のうちに、AIはシンプルなチャットインターフェースから、関数呼び出し、コード実行、永続的なターミナル使用が可能な自律エージェントへと転換したのを目撃してきました。しかし、これらの機能を安全に調整するには、エージェントは単なる知能以上のものが必要です。それは堅牢で、超スケーラブルで、セキュアな基盤を必要とします。
オピニオン
Researchers introduce ResearchArena, a framework that tests whether off-the-shelf AI agents (Claude with Opus 4.6, GPT-5.4, and K2.5) can execute full research workflows from ideation through paper writing and self-refinement. The study measures whether current frontier models can conduct genuinely novel research independent of human oversight.
This paper analyzes how literary features (self-representation, style, affect) are encoded in instruction-tuned LLMs like Llama 3.1 8B and Gemma 2 9B. Using sparse autoencoders, researchers discover four feature classes: naming gates for affect tokens, first-person register clusters, stylistic modulators, and compositional features. Understanding these internals may improve model interpretability.
This paper adapts split conformal prediction and adaptive conformal inference (ACI) to AI agent evaluation, providing distribution-free coverage guarantees for quality scores. The method achieves calibration errors below 0.02 at 24h horizons and correctly widens intervals by 35% following agent releases. It extends to multi-agent pipelines through compositional uncertainty bounds.