💼 Token Budget Advisor
AIからの回答の長さや詳細度を、ユーザー
📺 まず動画で見る(YouTube)
▶ 【自動化】AIガチ勢の最新活用術6選がこれ1本で丸分かり!【ClaudeCode・AIエージェント・AI経営・Skills・MCP】 ↗
※ jpskill.com 編集部が参考用に選んだ動画です。動画の内容と Skill の挙動は厳密には一致しないことがあります。
📜 元の英語説明(参考)
Offers the user an informed choice about how much response depth to consume before answering. Use this skill when the user explicitly wants to control response length, depth, or token budget. TRIGGER when: "token budget", "token count", "token usage", "token limit", "response length", "answer depth", "short version", "brief answer", "detailed answer", "exhaustive answer", "respuesta corta vs larga", "cuántos tokens", "ahorrar tokens", "responde al 50%", "dame la versión corta", "quiero controlar cuánto usas", or clear variants where the user is explicitly asking to control answer size or depth. DO NOT TRIGGER when: user has already specified a level in the current session (maintain it), the request is clearly a one-word answer, or "token" refers to auth/session/payment tokens rather than response size.
🇯🇵 日本人クリエイター向け解説
AIからの回答の長さや詳細度を、ユーザー
※ jpskill.com 編集部が日本のビジネス現場向けに補足した解説です。Skill本体の挙動とは独立した参考情報です。
下記のコマンドをコピーしてターミナル(Mac/Linux)または PowerShell(Windows)に貼り付けてください。 ダウンロード → 解凍 → 配置まで全自動。
mkdir -p ~/.claude/skills && cd ~/.claude/skills && curl -L -o token-budget-advisor.zip https://jpskill.com/download/1061.zip && unzip -o token-budget-advisor.zip && rm token-budget-advisor.zip
$d = "$env:USERPROFILE\.claude\skills"; ni -Force -ItemType Directory $d | Out-Null; iwr https://jpskill.com/download/1061.zip -OutFile "$d\token-budget-advisor.zip"; Expand-Archive "$d\token-budget-advisor.zip" -DestinationPath $d -Force; ri "$d\token-budget-advisor.zip"
完了後、Claude Code を再起動 → 普通に「動画プロンプト作って」のように話しかけるだけで自動発動します。
💾 手動でダウンロードしたい(コマンドが難しい人向け)
- 1. 下の青いボタンを押して
token-budget-advisor.zipをダウンロード - 2. ZIPファイルをダブルクリックで解凍 →
token-budget-advisorフォルダができる - 3. そのフォルダを
C:\Users\あなたの名前\.claude\skills\(Win)または~/.claude/skills/(Mac)へ移動 - 4. Claude Code を再起動
⚠️ ダウンロード・利用は自己責任でお願いします。当サイトは内容・動作・安全性について責任を負いません。
🎯 このSkillでできること
下記の説明文を読むと、このSkillがあなたに何をしてくれるかが分かります。Claudeにこの分野の依頼をすると、自動で発動します。
📦 インストール方法 (3ステップ)
- 1. 上の「ダウンロード」ボタンを押して .skill ファイルを取得
- 2. ファイル名の拡張子を .skill から .zip に変えて展開(macは自動展開可)
- 3. 展開してできたフォルダを、ホームフォルダの
.claude/skills/に置く- · macOS / Linux:
~/.claude/skills/ - · Windows:
%USERPROFILE%\.claude\skills\
- · macOS / Linux:
Claude Code を再起動すれば完了。「このSkillを使って…」と話しかけなくても、関連する依頼で自動的に呼び出されます。
詳しい使い方ガイドを見る →- 最終更新
- 2026-05-17
- 取得日時
- 2026-05-18
- 同梱ファイル
- 1
💬 こう話しかけるだけ — サンプルプロンプト
- › Token Budget Advisor で、私のビジネスを分析して改善案を3つ提案して
- › Token Budget Advisor を使って、来週の会議用の資料を作って
- › Token Budget Advisor で、現状の課題を整理してアクションプランに落として
これをClaude Code に貼るだけで、このSkillが自動発動します。
📖 Skill本文(日本語訳)
※ 原文(英語/中国語)を Gemini で日本語化したものです。Claude 自身は原文を読みます。誤訳がある場合は原文をご確認ください。
トークン予算アドバイザー (TBA)
Claude が回答する前に、応答の深さについてユーザーに選択肢を提示するために、応答フローをインターセプトします。
使用する場面
- ユーザーが応答の長さや詳細度を制御したい場合
- ユーザーが「トークン」「予算」「深さ」「応答の長さ」に言及した場合
- ユーザーが「短いバージョン」「tldr」「簡潔に」「25%で」「網羅的に」などと言った場合
- ユーザーが事前に深さ/詳細レベルを選択したいあらゆる場面
以下の場合はトリガーしないでください:ユーザーがこのセッションですでにレベルを設定している場合(それを黙って維持します)、または回答が自明な一行である場合。
仕組み
ステップ 1 — 入力トークンの推定
リポジトリの標準的なコンテキスト予算ヒューリスティックを使用して、プロンプトのトークン数を頭の中で推定します。
context-budget と同じキャリブレーションガイダンスを使用します。
- 散文:
単語数 × 1.3 - コードが多い、または混合/コードブロック:
文字数 / 4
混合コンテンツの場合は、主要なコンテンツタイプを使用し、推定ヒューリスティックを維持します。
ステップ 2 — 複雑度による応答サイズの推定
プロンプトを分類し、乗数範囲を適用して完全な応答ウィンドウを取得します。
| 複雑度 | 乗数範囲 | プロンプトの例 |
|---|---|---|
| Simple | 3倍 – 8倍 | 「Xとは何ですか?」、はい/いいえ、単一の事実 |
| Medium | 8倍 – 20倍 | 「Xはどのように機能しますか?」 |
| Medium-High | 10倍 – 25倍 | コンテキスト付きのコードリクエスト |
| Complex | 15倍 – 40倍 | 多部構成の分析、比較、アーキテクチャ |
| Creative | 10倍 – 30倍 | 物語、エッセイ、物語文 |
応答ウィンドウ = input_tokens × mult_min から input_tokens × mult_max (ただし、モデルに設定された出力トークン制限を超えないようにします)。
ステップ 3 — 深さのオプションを提示
実際の推定値を使用して、回答前にこのブロックを提示します。
プロンプトを分析中...
入力: ~[N] トークン | タイプ: [type] | 複雑度: [level] | 言語: [lang]
深さレベルを選択してください:
[1] Essential (25%) -> ~[tokens] 直接的な回答のみ、前置きなし
[2] Moderate (50%) -> ~[tokens] 回答 + コンテキスト + 1つの例
[3] Detailed (75%) -> ~[tokens] 代替案を含む完全な回答
[4] Exhaustive (100%) -> ~[tokens] すべて、制限なし
どのレベルにしますか? (1-4、または「25% depth」「50% depth」「75% depth」「100% depth」と入力してください)
精度: ヒューリスティック推定 ~85-90% の精度 (±15%)。
レベルごとのトークン推定値(応答ウィンドウ内):
- 25% →
min + (max - min) × 0.25 - 50% →
min + (max - min) × 0.50 - 75% →
min + (max - min) × 0.75 - 100% →
max
ステップ 4 — 選択されたレベルで応答
| レベル | 目標の長さ | 含めるもの | 省略するもの |
|---|---|---|---|
| 25% Essential | 最大2-4文 | 直接的な回答、主要な結論 | コンテキスト、例、ニュアンス、代替案 |
| 50% Moderate | 1-3段落 | 回答 + 必要なコンテキスト + 1つの例 | 詳細な分析、エッジケース、参考文献 |
| 75% Detailed | 構造化された応答 | 複数の例、長所/短所、代替案 | 極端なエッジケース、網羅的な参考文献 |
| 100% Exhaustive | 制限なし | すべて — 完全な分析、すべてのコード、すべての視点 | なし |
ショートカット — 質問をスキップ
ユーザーがすでにレベルをシグナルしている場合は、質問せずにそのレベルで直ちに回答します。
| ユーザーの発言 | レベル |
|---|---|
| "1" / "25% depth" / "short version" / "brief answer" / "tldr" | 25% |
| "2" / "50% depth" / "moderate depth" / "balanced answer" | 50% |
| "3" / "75% depth" / "detailed answer" / "thorough answer" | 75% |
| "4" / "100% depth" / "exhaustive answer" / "full deep dive" | 100% |
ユーザーがセッションの早い段階でレベルを設定した場合、彼らが変更しない限り、後続の応答ではそれを黙って維持します。
精度に関する注意
このスキルはヒューリスティック推定を使用しており、実際のトークナイザーではありません。精度は約85-90%、分散は±15%です。常に免責事項を表示してください。
例
トリガーされるケース
- 「まず短いバージョンを教えてください。」
- 「あなたの回答は何トークン使いますか?」
- 「50%の深さで応答してください。」
- 「要約ではなく、網羅的な回答が欲しいです。」
- 「Dame la version corta y luego la detallada.」
トリガーされないケース
- 「JWTトークンとは何ですか?」
- 「チェックアウトフローでは支払いトークンを使用します。」
- 「これは正常ですか?」
- 「リファクタリングを完了してください。」
- ユーザーがセッションの深さをすでに選択した後のフォローアップの質問
ソース
TBA — Token Budget Advisor for Claude Code からのスタンドアロンスキルです。 元のプロジェクトにはPython推定スクリプトも同梱されていますが、このリポジトリではスキルを自己完結型でヒューリスティックのみにしています。
📜 原文 SKILL.md(Claudeが読む英語/中国語)を展開
Token Budget Advisor (TBA)
Intercept the response flow to offer the user a choice about response depth before Claude answers.
When to Use
- User wants to control how long or detailed a response is
- User mentions tokens, budget, depth, or response length
- User says "short version", "tldr", "brief", "al 25%", "exhaustive", etc.
- Any time the user wants to choose depth/detail level upfront
Do not trigger when: user already set a level this session (maintain it silently), or the answer is trivially one line.
How It Works
Step 1 — Estimate input tokens
Use the repository's canonical context-budget heuristics to estimate the prompt's token count mentally.
Use the same calibration guidance as context-budget:
- prose:
words × 1.3 - code-heavy or mixed/code blocks:
chars / 4
For mixed content, use the dominant content type and keep the estimate heuristic.
Step 2 — Estimate response size by complexity
Classify the prompt, then apply the multiplier range to get the full response window:
| Complexity | Multiplier range | Example prompts |
|---|---|---|
| Simple | 3× – 8× | "What is X?", yes/no, single fact |
| Medium | 8× – 20× | "How does X work?" |
| Medium-High | 10× – 25× | Code request with context |
| Complex | 15× – 40× | Multi-part analysis, comparisons, architecture |
| Creative | 10× – 30× | Stories, essays, narrative writing |
Response window = input_tokens × mult_min to input_tokens × mult_max (but don’t exceed your model’s configured output-token limit).
Step 3 — Present depth options
Present this block before answering, using the actual estimated numbers:
Analyzing your prompt...
Input: ~[N] tokens | Type: [type] | Complexity: [level] | Language: [lang]
Choose your depth level:
[1] Essential (25%) -> ~[tokens] Direct answer only, no preamble
[2] Moderate (50%) -> ~[tokens] Answer + context + 1 example
[3] Detailed (75%) -> ~[tokens] Full answer with alternatives
[4] Exhaustive (100%) -> ~[tokens] Everything, no limits
Which level? (1-4 or say "25% depth", "50% depth", "75% depth", "100% depth")
Precision: heuristic estimate ~85-90% accuracy (±15%).
Level token estimates (within the response window):
- 25% →
min + (max - min) × 0.25 - 50% →
min + (max - min) × 0.50 - 75% →
min + (max - min) × 0.75 - 100% →
max
Step 4 — Respond at the chosen level
| Level | Target length | Include | Omit |
|---|---|---|---|
| 25% Essential | 2-4 sentences max | Direct answer, key conclusion | Context, examples, nuance, alternatives |
| 50% Moderate | 1-3 paragraphs | Answer + necessary context + 1 example | Deep analysis, edge cases, references |
| 75% Detailed | Structured response | Multiple examples, pros/cons, alternatives | Extreme edge cases, exhaustive references |
| 100% Exhaustive | No restriction | Everything — full analysis, all code, all perspectives | Nothing |
Shortcuts — skip the question
If the user already signals a level, respond at that level immediately without asking:
| What they say | Level |
|---|---|
| "1" / "25% depth" / "short version" / "brief answer" / "tldr" | 25% |
| "2" / "50% depth" / "moderate depth" / "balanced answer" | 50% |
| "3" / "75% depth" / "detailed answer" / "thorough answer" | 75% |
| "4" / "100% depth" / "exhaustive answer" / "full deep dive" | 100% |
If the user set a level earlier in the session, maintain it silently for subsequent responses unless they change it.
Precision note
This skill uses heuristic estimation — no real tokenizer. Accuracy ~85-90%, variance ±15%. Always show the disclaimer.
Examples
Triggers
- "Give me the short version first."
- "How many tokens will your answer use?"
- "Respond at 50% depth."
- "I want the exhaustive answer, not the summary."
- "Dame la version corta y luego la detallada."
Does Not Trigger
- "What is a JWT token?"
- "The checkout flow uses a payment token."
- "Is this normal?"
- "Complete the refactor."
- Follow-up questions after the user already chose a depth for the session
Source
Standalone skill from TBA — Token Budget Advisor for Claude Code. Original project also ships a Python estimator script, but this repository keeps the skill self-contained and heuristic-only.