jpskill.com
💼 ビジネス コミュニティ 🟡 少し慣れが必要 👤 経営者・事業責任者・マーケ

💼 Cost Trend

cost-trend

実行結果の記録を読み込み、勝率

⏱ 提案書ドラフト 2日 → 半日

📺 まず動画で見る(YouTube)

▶ 【自動化】AIガチ勢の最新活用術6選がこれ1本で丸分かり!【ClaudeCode・AIエージェント・AI経営・Skills・MCP】 ↗

※ jpskill.com 編集部が参考用に選んだ動画です。動画の内容と Skill の挙動は厳密には一致しないことがあります。

📜 元の英語説明(参考)

Read every docs/benchmarks/runs/*.json and surface drift in win rate, latency, escalation rate, and LLM-baseline cost over time

🇯🇵 日本人クリエイター向け解説

一言でいうと

実行結果の記録を読み込み、勝率

※ jpskill.com 編集部が日本のビジネス現場向けに補足した解説です。Skill本体の挙動とは独立した参考情報です。

⚡ おすすめ: コマンド1行でインストール(60秒)

下記のコマンドをコピーしてターミナル(Mac/Linux)または PowerShell(Windows)に貼り付けてください。 ダウンロード → 解凍 → 配置まで全自動。

🍎 Mac / 🐧 Linux
mkdir -p ~/.claude/skills && cd ~/.claude/skills && curl -L -o cost-trend.zip https://jpskill.com/download/2233.zip && unzip -o cost-trend.zip && rm cost-trend.zip
🪟 Windows (PowerShell)
$d = "$env:USERPROFILE\.claude\skills"; ni -Force -ItemType Directory $d | Out-Null; iwr https://jpskill.com/download/2233.zip -OutFile "$d\cost-trend.zip"; Expand-Archive "$d\cost-trend.zip" -DestinationPath $d -Force; ri "$d\cost-trend.zip"

完了後、Claude Code を再起動 → 普通に「動画プロンプト作って」のように話しかけるだけで自動発動します。

💾 手動でダウンロードしたい(コマンドが難しい人向け)
  1. 1. 下の青いボタンを押して cost-trend.zip をダウンロード
  2. 2. ZIPファイルをダブルクリックで解凍 → cost-trend フォルダができる
  3. 3. そのフォルダを C:\Users\あなたの名前\.claude\skills\(Win)または ~/.claude/skills/(Mac)へ移動
  4. 4. Claude Code を再起動

⚠️ ダウンロード・利用は自己責任でお願いします。当サイトは内容・動作・安全性について責任を負いません。

🎯 このSkillでできること

下記の説明文を読むと、このSkillがあなたに何をしてくれるかが分かります。Claudeにこの分野の依頼をすると、自動で発動します。

📦 インストール方法 (3ステップ)

  1. 1. 上の「ダウンロード」ボタンを押して .skill ファイルを取得
  2. 2. ファイル名の拡張子を .skill から .zip に変えて展開(macは自動展開可)
  3. 3. 展開してできたフォルダを、ホームフォルダの .claude/skills/ に置く
    • · macOS / Linux: ~/.claude/skills/
    • · Windows: %USERPROFILE%\.claude\skills\

Claude Code を再起動すれば完了。「このSkillを使って…」と話しかけなくても、関連する依頼で自動的に呼び出されます。

詳しい使い方ガイドを見る →
最終更新
2026-05-17
取得日時
2026-05-17
同梱ファイル
1

💬 こう話しかけるだけ — サンプルプロンプト

  • Cost Trend で、私のビジネスを分析して改善案を3つ提案して
  • Cost Trend を使って、来週の会議用の資料を作って
  • Cost Trend で、現状の課題を整理してアクションプランに落として

これをClaude Code に貼るだけで、このSkillが自動発動します。

📖 Skill本文(日本語訳)

※ 原文(英語/中国語)を Gemini で日本語化したものです。Claude 自身は原文を読みます。誤訳がある場合は原文をご確認ください。

コストトレンド

スモークゲートはバイナリです(winRate ≥ 0.80 → 合格/不合格)。時系列で取得されたコーパスベンチマークは曲線を描き、この曲線はゲートが見逃す回帰を捉えます(勝率が100%から85%にゆっくりと低下しても、スモークでは「まだ合格」ですが、実際には劣化です)。

このスキルは、docs/benchmarks/runs/*.json に永続化されたすべての実行を読み込み、最初から最後までの差分と実行ごとの系列を報告し、勝率またはレイテンシの回帰にフラグを立てます。

使用するタイミング

  • リリース前 — スピードアップがずれていないか確認します。
  • コーパス拡張後 — 古い実行が、新しいコーパスで反映されたものと同じ勝率をまだ達成しているか検証します。
  • agent-booster アップグレード後 — レイテンシ/戦略の変更を明らかにします。

手順

  1. プロジェクトルートからトレンドスクリプトを実行します

    node plugins/ruflo-cost-tracker/scripts/trend.mjs

    オプションの環境変数:

    • TREND_FORMAT=json — Markdown の代わりに JSON を出力します。
    • TREND_LIMIT=10 — 最新の N 回の実行のみを考慮します。
  2. ドリフトの概要を検査します — 勝率、平均レイテンシ、p99、エスカレーション率、Gemini との比較でのスピードアップについて、最初と最後を比較します。

  3. 実行ごとの系列を検査します — 実行ごとに1行で、Sonnet 4.6 + Opus 4.7 のベースラインレイテンシ(実行時に BENCH_ANTHROPIC=1 が有効だった場合)を含みます。

  4. 回帰フラグ — スクリプトは、以下の条件で > ⚠ Regression の吹き出しを出力します。

    • 勝率が最初と最後の実行の間で低下した場合
    • 平均レイテンシが最初の実行から1.5倍以上上昇した場合

相互参照

  • cost-benchmark — このスキルが消費する実行 JSON を生成するプロデューサー
  • bench/booster-corpus.json — コーパスバージョンは各実行に記録されるため、コーパスバージョン間のトレンドは解釈可能です。
  • docs/benchmarks/runs/latest.json — 最新の実行。スモークステップ23は、このファイルの winRate ≥ 0.80 に基づいてゲートします。
📜 原文 SKILL.md(Claudeが読む英語/中国語)を展開

Cost Trend

The smoke gate is binary (winRate ≥ 0.80 → pass/fail). The corpus benchmarks captured over time form a curve — and curves catch regressions the gate misses (win rate slowly creeping from 100% to 85% is "still passing" by smoke but a real degradation).

This skill reads every persisted run in docs/benchmarks/runs/*.json and reports first→last deltas plus a per-run series, flagging regressions in win rate or latency.

When to use

  • Before a release — check that the speedup hasn't drifted.
  • After expanding the corpus — verify older runs still hit the same win rate on the new corpus they reflected.
  • After upgrading agent-booster — surface latency / strategy changes.

Steps

  1. Run the trend script from the project root:

    node plugins/ruflo-cost-tracker/scripts/trend.mjs

    Optional env:

    • TREND_FORMAT=json — emit JSON instead of markdown
    • TREND_LIMIT=10 — consider only the most recent N runs
  2. Inspect the drift summary — first vs last on win rate, avg latency, p99, escalation rate, speedup vs Gemini.

  3. Inspect the per-run series — one row per run, including Sonnet 4.6 + Opus 4.7 baseline latencies if those were enabled (BENCH_ANTHROPIC=1 at run time).

  4. Regression flags — the script emits > ⚠ Regression callouts when:

    • Win rate dropped between first and last run
    • Avg latency rose ≥ 1.5× from first run

Cross-references

  • cost-benchmark — the producer of the run JSONs this skill consumes
  • bench/booster-corpus.json — the corpus version is recorded in each run, so trends across corpus versions remain interpretable
  • docs/benchmarks/runs/latest.json — the most-recent run; smoke step 23 gates on winRate ≥ 0.80 from this file