error-coordinator
マルチエージェントシステムにおけるループや幻覚、障害を検知し、自己修復ワークフローで堅牢なシステムを構築するSkill。
📜 元の英語説明(参考)
Expert in making multi-agent systems resilient. Specializes in detecting loops, hallucinations, and failures, and implementing self-healing workflows. Use when designing error handling for agent systems, implementing retry strategies, or building resilient AI workflows.
🇯🇵 日本人クリエイター向け解説
マルチエージェントシステムにおけるループや幻覚、障害を検知し、自己修復ワークフローで堅牢なシステムを構築するSkill。
※ jpskill.com 編集部が日本のビジネス現場向けに補足した解説です。Skill本体の挙動とは独立した参考情報です。
下記のコマンドをコピーしてターミナル(Mac/Linux)または PowerShell(Windows)に貼り付けてください。 ダウンロード → 解凍 → 配置まで全自動。
mkdir -p ~/.claude/skills && cd ~/.claude/skills && curl -L -o error-coordinator.zip https://jpskill.com/download/6659.zip && unzip -o error-coordinator.zip && rm error-coordinator.zip
$d = "$env:USERPROFILE\.claude\skills"; ni -Force -ItemType Directory $d | Out-Null; iwr https://jpskill.com/download/6659.zip -OutFile "$d\error-coordinator.zip"; Expand-Archive "$d\error-coordinator.zip" -DestinationPath $d -Force; ri "$d\error-coordinator.zip"
完了後、Claude Code を再起動 → 普通に「動画プロンプト作って」のように話しかけるだけで自動発動します。
💾 手動でダウンロードしたい(コマンドが難しい人向け)
- 1. 下の青いボタンを押して
error-coordinator.zipをダウンロード - 2. ZIPファイルをダブルクリックで解凍 →
error-coordinatorフォルダができる - 3. そのフォルダを
C:\Users\あなたの名前\.claude\skills\(Win)または~/.claude/skills/(Mac)へ移動 - 4. Claude Code を再起動
⚠️ ダウンロード・利用は自己責任でお願いします。当サイトは内容・動作・安全性について責任を負いません。
🎯 このSkillでできること
下記の説明文を読むと、このSkillがあなたに何をしてくれるかが分かります。Claudeにこの分野の依頼をすると、自動で発動します。
📦 インストール方法 (3ステップ)
- 1. 上の「ダウンロード」ボタンを押して .skill ファイルを取得
- 2. ファイル名の拡張子を .skill から .zip に変えて展開(macは自動展開可)
- 3. 展開してできたフォルダを、ホームフォルダの
.claude/skills/に置く- · macOS / Linux:
~/.claude/skills/ - · Windows:
%USERPROFILE%\.claude\skills\
- · macOS / Linux:
Claude Code を再起動すれば完了。「このSkillを使って…」と話しかけなくても、関連する依頼で自動的に呼び出されます。
詳しい使い方ガイドを見る →- 最終更新
- 2026-05-17
- 取得日時
- 2026-05-17
- 同梱ファイル
- 1
📖 Skill本文(日本語訳)
※ 原文(英語/中国語)を Gemini で日本語化したものです。Claude 自身は原文を読みます。誤訳がある場合は原文をご確認ください。
[Skill 名] error-coordinator
エラーコーディネーター
目的
堅牢なエラー処理、障害検出、回復メカニズムを備えた、回復力のあるマルチエージェントシステムの構築に関する専門知識を提供します。ループ検出、ハルシネーション軽減、自己修復エージェントワークフローをカバーします。
使用する状況
- エージェントシステムのエラー処理を設計する場合
- リトライおよび回復戦略を実装する場合
- 自己修復AIワークフローを構築する場合
- エージェントのループと無限再帰を検出する場合
- エージェントの出力におけるハルシネーションを軽減する場合
- エージェントのサーキットブレーカーを実装する場合
- エージェント間の障害回復を調整する場合
クイックスタート
このスキルを呼び出す状況:
- エージェントシステムのエラー処理を設計する場合
- リトライおよび回復戦略を実装する場合
- 自己修復AIワークフローを構築する場合
- エージェントのループと無限再帰を検出する場合
- エージェント間の障害回復を調整する場合
呼び出さない状況:
- エージェントチームを編成する場合 (agent-organizer を使用してください)
- アプリケーションエラーをデバッグする場合 (debugger を使用してください)
- 本番環境のインシデントを処理する場合 (incident-responder を使用してください)
- コードのエラーパターンを検出する場合 (error-detective を使用してください)
意思決定フレームワーク
Error Type Handling:
├── Transient failure → Retry with backoff
├── Rate limiting → Backoff + queue
├── Invalid output → Validation + retry with feedback
├── Loop detected → Break + escalate
├── Hallucination → Ground with context, retry
├── Agent timeout → Cancel + fallback
└── Cascading failure → Circuit breaker
Recovery Strategy:
├── Idempotent operation → Simple retry
├── Stateful operation → Checkpoint + resume
├── Critical path → Fallback agent
└── Best effort → Log + continue
コアワークフロー
1. ループ検出システム
- エージェントの呼び出し履歴を追跡します
- 繰り返される状態パターンを検出します
- 最大反復回数制限を設定します
- エスケープハッチトリガーを実装します
- 分析のためにループの発生をログに記録します
- スーパーバイザーまたは人間にエスカレートします
2. ハルシネーション軽減
- ソースデータで応答を根拠付けます
- 出力検証を実装します
- 検索結果と相互参照します
- 信頼度スコアリングを追加します
- 信頼度の低い出力にフラグを立てます
- リトライのためのフィードバックを提供します
3. サーキットブレーカーの実装
- エージェントごとの障害発生率を追跡します
- 障害しきい値を定義します
- しきい値を超えたら回路を開きます
- フォールバック動作を提供します
- テストのためにハーフオープン状態を実装します
- 回復したら回路を閉じます
- ブレーカーの状態を監視し、アラートを発します
ベストプラクティス
- すべてのエージェント呼び出しにタイムアウトを実装します
- ジッター付き指数バックオフを使用します
- すべての障害を完全なコンテキストでログに記録します
- 優雅な劣化を考慮して設計します
- 障害シナリオを明示的にテストします
- エラー率とパターンを監視します
アンチパターン
| アンチパターン | 問題 | 正しいアプローチ |
|---|---|---|
| 無限リトライ | リソース枯渇 | 最大リトライ回数制限 |
| サイレント障害 | 隠れた問題 | ログ記録とアラート |
| タイムアウトなし | ハングしたプロセス | 常にタイムアウトを設定 |
| 同じリトライ間隔 | サンダリング・ハーディング | 指数バックオフ |
| フォールバックなし | 完全な障害 | 優雅な劣化 |
📜 原文 SKILL.md(Claudeが読む英語/中国語)を展開
Error Coordinator
Purpose
Provides expertise in building resilient multi-agent systems with robust error handling, failure detection, and recovery mechanisms. Covers loop detection, hallucination mitigation, and self-healing agent workflows.
When to Use
- Designing error handling for agent systems
- Implementing retry and recovery strategies
- Building self-healing AI workflows
- Detecting agent loops and infinite recursion
- Mitigating hallucinations in agent outputs
- Implementing circuit breakers for agents
- Coordinating failure recovery across agents
Quick Start
Invoke this skill when:
- Designing error handling for agent systems
- Implementing retry and recovery strategies
- Building self-healing AI workflows
- Detecting agent loops and infinite recursion
- Coordinating failure recovery across agents
Do NOT invoke when:
- Organizing agent teams (use agent-organizer)
- Debugging application errors (use debugger)
- Handling production incidents (use incident-responder)
- Detecting code error patterns (use error-detective)
Decision Framework
Error Type Handling:
├── Transient failure → Retry with backoff
├── Rate limiting → Backoff + queue
├── Invalid output → Validation + retry with feedback
├── Loop detected → Break + escalate
├── Hallucination → Ground with context, retry
├── Agent timeout → Cancel + fallback
└── Cascading failure → Circuit breaker
Recovery Strategy:
├── Idempotent operation → Simple retry
├── Stateful operation → Checkpoint + resume
├── Critical path → Fallback agent
└── Best effort → Log + continue
Core Workflows
1. Loop Detection System
- Track agent invocation history
- Detect repeated state patterns
- Set maximum iteration limits
- Implement escape hatch triggers
- Log loop occurrences for analysis
- Escalate to supervisor or human
2. Hallucination Mitigation
- Ground responses with source data
- Implement output validation
- Cross-check with retrieval
- Add confidence scoring
- Flag low-confidence outputs
- Provide feedback for retry
3. Circuit Breaker Implementation
- Track failure rates per agent
- Define failure threshold
- Open circuit on threshold breach
- Provide fallback behavior
- Implement half-open state for testing
- Close circuit on recovery
- Monitor and alert on breaker state
Best Practices
- Implement timeouts for all agent calls
- Use exponential backoff with jitter
- Log all failures with full context
- Design for graceful degradation
- Test failure scenarios explicitly
- Monitor error rates and patterns
Anti-Patterns
| Anti-Pattern | Problem | Correct Approach |
|---|---|---|
| Infinite retries | Resource exhaustion | Max retry limits |
| Silent failures | Hidden problems | Log and alert |
| No timeouts | Hung processes | Always set timeouts |
| Same retry interval | Thundering herd | Exponential backoff |
| No fallbacks | Complete failure | Graceful degradation |