AIエージェント運用コスト計算機

ステップごとのモデル選択とオーバーヘッド乗数を使用して、マルチステップAIエージェントワークフローのコストをモデル化します

~/agent-cost

プリセット：

$0.02

モデル

入力トークン

出力トークン

コール/実行

オーバーヘッド

ツールコールオーバーヘッド

リトライ率

メモリ/RAG（ステップごと）

+トークン

実行あたりのコスト

$0.02

実行/日：

日次： $1.07

月次見積もり

$32.05

ステップ	モデル	コール	コスト	%
Step 1	Claude 4.5 Opus	1	$0.02	100.0%

AIエージェントコスト計算ツールとは？

AIエージェントコスト計算ツールは、1回の実行で複数のLLM呼び出しを行うAIエージェントワークフローの総運用コストを見積もるツールです。単一リクエストの価格を計算するシンプルなAPIコスト計算ツールとは異なり、このツールはマルチステップエージェントの累積コスト — リトライ、ツール呼び出しのオーバーヘッド、メモリ取得トークンを含む — をモデル化します。

現代のAIエージェントは1回のLLM呼び出しだけでは完結しません。コードレビューエージェントは、分類器、コードアナライザー、レビュアー、修正ツールを順に呼び出し、各ステップで異なるモデルを最適に使用します。サポートエージェントは、意図の分類、コンテキストの取得、応答の生成、インタラクションの要約を行います。各ステップが総コストに加算されます。

この計算ツールでは、エージェントの各ステップを定義し、ステップごとにモデルを選択し、オーバーヘッド乗数を設定し、1回あたり、日次、月次の総コストを確認できます。一般的なパターン（RAG、コードエージェント、サポートボット）のプリセットにより、すぐに使い始められます。

このツールの使い方

数ステップでエージェントのコストをモデル化できます：

プリセット（Simple RAG、Code Agent、またはSupport Agent）から始めるか、ゼロから独自のワークフローを構築します。
各ステップに名前を設定し、モデルを選択し、平均入力/出力トークン数と1回あたりの呼び出し回数を設定します。
並べ替え矢印を使用して、ステップを実行順に配置します。必要に応じてステップを追加・削除できます。
オーバーヘッド乗数を設定します：ツール呼び出しオーバーヘッドはトークンにパーセンテージを追加（Function Callingのフォーマッティング用）、リトライ率は再試行が必要な失敗した呼び出しを考慮、メモリ/RAGトークンはコンテキスト取得のためにステップごとに固定量を追加します。
1日あたりの実行回数を設定して、日次・月次のコスト予測を確認します。
ステップごとのコストと割合を示す内訳テーブルを確認します。内訳またはJSON設定をコピーしてドキュメントに活用できます。

エージェントコスト乗数の理解

LLM呼び出しの基本コストは出発点に過ぎません。実運用のエージェントには、ベースコストを増加させるオーバーヘッドがあります：

ツール呼び出しオーバーヘッド

エージェントがFunction CallingやTool Useを使用する場合、ツールの定義とスキーマがプロンプトに含まれます。これにより通常、入力トークンが5〜15%増加します。詳細なスキーマを持つ複雑なツールではさらに増加する場合があります。デフォルトの10%は、ほとんどのエージェントにとって妥当な中間値です。

リトライ率

本番環境のエージェントは、レート制限、不正な出力、バリデーションエラーなどの障害に遭遇します。5%のリトライ率は20回に1回の呼び出しがリトライされることを意味し、実質的に総コストに5%が加算されます。厳密な出力パースを行う高信頼性エージェントでは、リトライ率が10〜20%になることもあります。

メモリとRAG取得

RAG（検索拡張生成）や永続メモリを使用するエージェントは、各プロンプトに追加のコンテキストを注入します。一般的なRAG取得では、ステップあたり200〜500トークンのコンテキストが追加されます。これはパーセンテージではなく、ステップあたりの入力トークンへの固定加算としてモデル化されています。

コスト最適化戦略

計算ツールを使用して、以下の最適化アプローチをモデル化できます：

モデルルーティング — 分類やルーティングには安価なモデル（GPT-5 Nano、Gemini Flash）を使用し、高価なモデルは生成ステップに限定
プロンプト圧縮 — 高価なモデルに渡す前にコンテキストを要約して入力トークンを削減
キャッシング — 一般的な応答をキャッシュして冗長なLLM呼び出しを回避（ここではモデル化されていませんが、実質的な実行回数/日を削減）
バッチ処理 — 一部のプロバイダーは、レイテンシ要件を緩和したバッチAPI呼び出しに50%の割引を提供
出力長制御 — 厳格なmax_tokensを設定して、予想外に長い応答によるコスト増加を防止

よくある質問

AI APIコスト計算ツールとの違いは何ですか？

AI APIコスト計算ツールは、単一のLLM呼び出し（1つのモデル、1セットの入力/出力トークン）の価格を計算します。このエージェントコスト計算ツールは、それぞれ異なるモデルを使用する可能性のある複数ステップのワークフロー全体をモデル化し、設定可能なオーバーヘッド乗数を含みます。単一呼び出しの料金にはAPIコスト計算ツールを、マルチステップエージェントワークフローにはこのツールをご利用ください。

料金データは最新ですか？

この計算ツールは、AI APIコスト計算ツールと同じ料金データを使用しており、定期的に更新されています。OpenAI、Anthropic、Google、Mistral、xAI、DeepSeek、Cohere、Qwenなど主要プロバイダーのすべてのアクティブモデルの料金データが含まれています。予算の意思決定を行う前に、必ずプロバイダーの料金ページで重要なコスト見積もりをご確認ください。

エージェントに条件分岐ステップがある場合はどうすればよいですか？

この計算ツールは、すべてのステップが毎回実行されるリニアフローをモデル化します。条件分岐（例：エスカレーションが20%の確率でのみ発生する場合）がある場合は、呼び出し回数/実行を調整して平均ケースをモデル化できます。条件付きステップのトークン数を比例的に調整して、割合を設定してください（例：0.2回/実行相当）。

各ステップの入力・出力トークン数をどのように見積もればよいですか？

エージェントを数回実行し、APIレスポンスからトークン数をログに記録してください。ほとんどのプロバイダーはレスポンスメタデータにトークン使用量を返します。新しいエージェントを計画している場合の目安：短い分類プロンプトは入力200〜500、出力50〜100、生成ステップは入力1,000〜3,000、出力500〜2,000、要約は入力1,000〜2,000、出力200〜500です。

エージェント設定を保存・共有できますか？

はい。「JSON設定をコピー」ボタンを使用して、エージェント設定全体（ステップ、モデル、オーバーヘッド、実行回数/日）をJSONとしてエクスポートできます。チームと共有したり、将来の参照用に保存できます。JSONフォーマットは人間が読める形式で、プログラムによるコスト追跡の起点としても使用できます。

AIエージェント運用コスト計算機

AIエージェントコスト計算ツールとは？

このツールの使い方

エージェントコスト乗数の理解

ツール呼び出しオーバーヘッド

リトライ率

メモリとRAG取得

コスト最適化戦略

よくある質問

関連ツール

関連ツール

AI APIコスト計算ツール

AIモデル選択ウィザード

プロンプトチェーンプランナー