Anthropicが新フラッグシップ「Claude Opus 4.8」を2026年5月29日に公開しました。Android Authorityは、Opus 4.7をほぼすべてのベンチマークで上回り、Fast modeの料金が従来よりかなり安くなった(considerably cheaper)と報じています。あわせて「Effort」コントロールや数百のサブエージェントを並列実行する「Dynamic workflows」(研究プレビュー)も同時に導入されたと伝えられています。
Opus 4.8の改善点——「より正直」と自称、コード欠陥の未報告が4分の1に
Android Authorityの報道によると、AnthropicはOpus 4.8について「prosocial traits(向社会的特性)の指標で過去最高に達した」と表明しているとされています。ユーザーの自律性を尊重し、ユーザーの最善の利益にそって動くよう改善されたとしており、欺瞞的な振る舞いや悪用への協力をする確率も大きく下がったと伝えられています。
「より正直になった」点も強調されているとされます。確証がないときに結論へ飛びついたり未検証の主張をしたりせず、自分の不確実性を明示しやすくなった、というのがAnthropic側の説明だと報じられています。さらに、コードを書いた際に欠陥を報告しない確率(=見落とし)が従来比で4分の1に減ったとされています。
なお、これらの数値や評価はAnthropic自身が公表したベンチマーク・社内評価に基づくものであり、第三者による独立検証は現時点では示されていません。
Fast modeが大幅値下げ——軽い問い合わせにも使いやすく
コスト面では、Opus 4.8の「Fast mode」(応答を速く返すモード)が、これまでよりもかなり安く使えるようになったと報じられています。Android Authorityの記事内では3倍安価になったと伝えられており、AI利用コストの上昇を懸念するユーザーにとって朗報になる、と評価されています。
つまり、これまでは重い処理向きと位置づけられがちだったOpus系を、軽めの問い合わせにも投入しやすくなったということです。Android Authorityは、トークン消費を過度に気にせず単純なクエリにも使えるようになった、という趣旨で評価しているとされます。
新機能「Effort」——Low/Medium/High/Maxの4段階で思考量を調整
モデルセレクタに新しく「Effort」オプションが追加され、Claudeがタスクにどれだけ労力(思考時間)を割くかを4段階から選べるようになったと報じられています。
| Effort設定 | 想定される挙動 |
|---|---|
| Low | より速い応答。思考時間は短め |
| Medium | バランス型 |
| High | より長く考え、詳細な回答 |
| Max | 最大限の思考。最難関タスク向け |
ただし、Effortを高く設定するほどトークン消費は急速に増えるとされています。Anthropicは「Max」モードについて、最も難しいタスクに限定して使うことを推奨していると伝えられています。普段使いでLow〜Mediumに留めるか、ここぞというときだけHigh/Maxを呼び出すか、という判断が必要になりそうです。
「Dynamic workflows」が研究プレビューに——数百のサブエージェントを並列実行
もう一つの新機能が、Claude Codeで利用できる「Dynamic workflows」です。現時点ではリサーチプレビュー段階での提供と報じられています。
仕組みとしては、ユーザーが大きな課題を投げると、Claude側がそれを自動で計画立案し、数百のサブエージェントを同時に走らせて解いていく、というものだとされます。さらに、出力をユーザーに見せる前にClaude自身が検証する工程も含まれると伝えられています。
大規模なリファクタリングや複数ファイルにまたがる調査・移行など、これまで1つのコンテキストでは抱えきれなかった作業を分割して並列処理する用途を想定したものと読み取れます。リサーチプレビュー段階であるため、安定版の挙動とは異なる可能性もある点には留意が必要です。
今後の予定——Mythos-classモデルが控える
Claude Opus 4.8は2026年5月29日から各環境で利用可能になっています。Anthropicは加えて、今後数週間以内に新しい「Mythos-class」モデル群をリリースする予定であることも明らかにしたと報じられています。
今回のOpus 4.8で「より正直さ」「Fast modeの値下げ」「Effort」「Dynamic workflows」を一気に揃えてきた格好で、Mythos-classが何を狙うのかは現時点では公表されていません。続報が出るまで、Effort設定やFast modeの実利用感を確かめながら、コスト最適なモデル選びを再点検しておくのが妥当です。
Fast modeの料金引き下げとベンチマーク——1Mトークン対応も標準化
Fast modeの値下げ幅を具体的な数字で見ると、Opus 4.7時代の入力$30/出力$150(100万トークンあたり)から、Opus 4.8では入力$10/出力$50へと引き下げられ、約2.5倍の速度でトークンを生成します。
ベンチマーク面でのスコアは次の通りです。
| 評価項目 | Opus 4.8のスコア |
|---|---|
| SWE-bench Verified | 88.6% |
| SWE-bench Pro | 69.2% |
| Terminal-Bench 2.1 | 74.6% |
| Online-Mind2Web | 84% |
Online-Mind2Webの84%はOpus 4.7とGPT-5.5を上回るスコアとして公表されています。API面ではClaude API、Amazon Bedrock、Vertex AIで1Mトークンのコンテキストウィンドウがデフォルト対応となり、最大出力は128kトークンに設定されています。なお、Effortパラメータは全環境でHighがデフォルト値として設定されているため、軽量用途で消費を抑えたい場面では明示的に下位の設定へ切り替える運用判断が必要になります。
Dynamic Workflowsの実例と適性——75万行移植やKlarnaのデッドコード調査
Dynamic Workflowsの実運用イメージは、Anthropicが公表した事例から具体化できます。75万行規模のZigからRustへの移植や、Klarnaにおけるデッドコードの発見といった大規模ワークロードでの活用例が示されています。
仕組みの特徴は単なる並列化に留まらない点にあります。
エージェントは独立した角度から問題に取り組み、別のエージェントが見つけた内容に対して反証を試み、答えが収束するまで反復実行を続ける
この敵対的検証ループによって、単一セッション内で数十〜数百のサブエージェントを動かせる規模を実現しています。適性のあるユースケースとしては、コードベース全体のバグハント、セキュリティ監査、数千ファイルにまたがる大規模マイグレーションが挙げられます。なお運用面では、デフォルトモードではサブエージェントの各アクションごとに承認プロンプトが出て並列性が止まってしまうため、Auto Modeとの併用が推奨されています。
Q&A
Q. Claude Opus 4.8はいつから使えますか? 2026年5月29日から各環境で提供が始まっているとされています。Claudeを利用できる環境で順次展開されていると報じられています。
Q. Fast modeはどのくらい安くなったのですか? Android Authorityはheadlineで「considerably cheaper(かなり安い)」と表現し、本文では従来比で3倍安価になったと報じています。具体的なドル単位の改定額や元の料金はこの報道内では明示されていません。
Q. Dynamic workflowsは誰でもすぐに使えますか? Dynamic workflowsはClaude Code向けの機能で、現時点では「リサーチプレビュー」段階での提供と報じられています。正式提供ではないため、挙動が今後変わる可能性がある点に留意が必要です。
出典
- Android Authority — Claude Opus 4.8 is more honest, less deceptive, and considerably cheaper
- VentureBeat — Anthropic's Claude Opus 4.8 is here with 3X cheaper fast mode and near-Mythos level alignment
- Anthropic — Claude Opus 4.8