Anthropicは2026年6月9日、最上位モデル「Claude Fable 5」(モデルID: claude-fable-5)を一般公開しました。SWE-bench Verified 95.0%(Opus 4.8は88.6%・llm-stats集計)と長時間タスクで大きく先行する一方、API価格はOpus 4.8の2倍(入力$10/出力$50・100万トークンあたり)。高リスク領域は自動的にOpus 4.8へフォールバックする新しい安全設計を採用しています(出典:Anthropic公式 2026-06-09)。
本記事では、Claude Fable 5で何が変わったのか、Opus 4.8とどう使い分けるべきかを、中小企業の実務目線で最速整理します。
Claude Fable 5とは
Claude Fable 5とは、Anthropicが社内最上位「Mythosクラス」として開発してきたフロンティアモデルの、初の一般公開版です。これまで一部の承認パートナーのみに提供されていたMythos系の能力を、セーフガード(安全装置)を組み込んだうえで誰でも使える形にしたのがFable 5です(出典:Anthropic公式 2026-06-09、TechCrunch 2026-06-09)。
- 公開日: 2026年6月9日
- モデルID:
claude-fable-5 - 提供: Claude API(即日)、claude.ai の各サブスクリプションプラン
- 兄弟モデル: セーフガードを解除した「Claude Mythos 5」は、Project Glasswing等の承認組織のみに提供
Opus 4.8から何が変わったのか(5つのポイント)
1. 「長く・難しい」タスクほど差が開く
Anthropicは「タスクが長く複雑になるほどFable 5のリードが大きくなる」と説明しています。主要ベンチマークの比較は次のとおりです。
| ベンチマーク | Fable 5 | Opus 4.8 | 差分 |
|---|---|---|---|
| SWE-bench Verified(コード修正) | 95.0% | 88.6% | +6.4 |
| SWE-bench Pro(高難度コード) | 80.0% | 69.2% | +10.8 |
| FrontierCode Diamond(最先端開発) | 29.3% | 13.4% | +15.9 |
| OSWorld-Verified(PC操作) | 85.0% | 83.4% | +1.6 |
| Blueprint-Bench 2(設計図理解) | 38.6% | 14.5% | +24.1 |
(出典:llm-stats.com 集計 2026年6月。FrontierCodeで「フロンティアモデル中最高スコア」はAnthropic公式も明言)
単発の短いタスクでは差が小さく(OSWorld +1.6)、高難度・長時間のタスクで差が跳ね上がる(Blueprint-Bench +24.1)のが特徴です。
2. メモリ活用が3倍効く=「続きから働ける」AIへ
Anthropic公式によると、ファイルベースの永続メモリを与えた長期タスク検証(ゲーム「Slay the Spire」攻略)で、メモリによる性能向上幅がOpus 4.8の3倍以上でした。これは「セッションをまたいで学習・改善しながら働き続けるAIエージェント」への大きな一歩です。
3. 価格は2倍。「全部Fable 5」は悪手
| 項目 | Fable 5 | Opus 4.8 |
|---|---|---|
| API入力(100万トークン) | $10 | $5 |
| API出力(100万トークン) | $50 | $25 |
| コンテキスト/最大出力 | 1M/128K | 1M/128K |
| Extended Thinking | 対応 | 対応 |
| サブスクでの利用 | 6/22まで追加料金なし、6/23以降クレジット | 通常利用 |
(出典:Anthropic公式 2026-06-09、llm-stats.com)
価格がちょうど2倍のため、すべての業務をFable 5に置き換えるのはコスト的に非合理です。後述の使い分けが重要になります。
4. 新しい安全設計:高リスク領域はOpus 4.8へ自動フォールバック
Fable 5の最大の設計上の特徴は、サイバー攻撃・生物・化学・モデル蒸留などの高リスク領域を検知すると、応答を自動的にOpus 4.8へ切り替える多層セーフガードです(出典:Anthropic公式)。
- 公式初期データではセッションの95%以上はフォールバックなしでFable 5が応答
- 1,000時間超のテストで汎用ジェイルブレイクは未発見(出典:TechCrunch 2026-06-09)
- 全トラフィックに30日間のデータ保持ポリシーを適用
通常のビジネス利用で影響する場面は限定的ですが、「2倍の料金を払ってもOpus 4.8の回答が返るケースがありうる」点は把握しておくべきです。
5. 実務系ベンチマークでの初記録
- 金融AI企業Hebbiaの社内ベンチマークで全モデル中最高スコア
- 分析プラットフォームHexの複雑分析タスク評価で初めて90%を突破
- スプレッドシート作業はOpus 4.8比で25〜30%高速化
(出典:Anthropic公式 2026-06-09)
実務での使い分け:どの業務をFable 5に任せるか
中小企業の現場では、次の振り分けが費用対効果の面で合理的です。
| 業務 | 推奨モデル | 理由 |
|---|---|---|
| メール・SNS・資料の作成 | Opus 4.8 | 性能差が小さく、半額 |
| 議事録要約・定型レポート | Opus 4.8 | 同上 |
| 大規模コードの改修・新規開発 | Fable 5 | SWE-bench Pro +10.8ポイントの差が品質に直結 |
| 数時間動かす自律エージェント | Fable 5 | 長時間タスクほど差が拡大、メモリ活用3倍 |
| 複雑なデータ分析・市場リサーチ | Fable 5 | Hex評価90%超の分析力 |
| 競合調査など長文の読み込み | まずOpus 4.8 | 1Mコンテキストは両者同じ。不足ならFable 5 |
ポイントは「まずOpus 4.8、効かない高難度タスクだけFable 5」のハイブリッド運用です。サブスクリプションプランなら6月22日まで追加料金なしで試せるため、いまのうちに自社業務での性能差を実測しておくことを推奨します。
これからどう変わるのか(経営目線の展望)
- 「AIに丸ごと任せる」業務範囲が広がる — 長時間の自律動作とメモリ改善は、これまで人が分割・監督していた一連の業務(調査→分析→資料化→修正)をAIが通しで担う方向への進化です。
- モデルの使い分けがコスト管理スキルになる — 価格差2倍の最上位モデルの登場で、「どの業務にどのモデルを割り当てるか」が、そのままAI経費と成果を左右します。
- 安全性と能力の分離提供が標準になる — 能力全開版(Mythos 5)は承認組織のみ、一般には安全装置つき(Fable 5)という二層提供は、今後の業界標準になる可能性があります。AnthropicはAIの急速な進歩(再帰的自己改善の可能性)への警告と同時にこのモデルを公開しており(出典:TechCrunch 2026-06-09)、企業側にも利用ガイドラインの整備がいっそう求められます。
なお、従来モデルの詳細はClaude Opus 4.8 の使い方・料金、開発業務での活用はClaude Code 完全ガイド、3大AIの使い分けはChatGPT・Claude・Gemini業務別使い分けで解説しています。
中小企業がいま着手すべき3ステップ
- 6月22日までに無償枠で実測する — 自社の代表業務3つ(例:提案書作成・データ分析・コード修正)でOpus 4.8と出力を比較し、差が出る業務を特定する。
- モデル割り当てルールを決める — 「日常業務はOpus 4.8、高難度タスクのみFable 5」を社内ルール化し、API利用ならコスト上限を設定する。
- 社内ガイドラインを更新する — データ保持30日ポリシーやフォールバック仕様を踏まえ、機密情報の取り扱い基準を見直す(参考:生成AI社内ガイドラインの作り方)。
「自社のどの業務をFable 5に任せるべきか」「モデル使い分けの社内ルールをどう作るか」を最短で整備したい場合は、当社のAI研修(150,000円〜/人・税抜)で、Fable 5を含む最新モデル構成に合わせた業務別カリキュラムを提供しています。無料相談も承っています。
