jpskill.com
🛠️ 開発・MCP コミュニティ 🔴 エンジニア向け 👤 エンジニア・AI開発者

🛠️ セットアップ

setup

新しい自動分析の実験を始める際に、分析対象

⏱ RAG構築 1週間 → 1日

📺 まず動画で見る(YouTube)

▶ 【衝撃】最強のAIエージェント「Claude Code」の最新機能・使い方・プログラミングをAIで効率化する超実践術を解説! ↗

※ jpskill.com 編集部が参考用に選んだ動画です。動画の内容と Skill の挙動は厳密には一致しないことがあります。

📜 元の英語説明(参考)

Set up a new autoresearch experiment interactively. Collects domain, target file, eval command, metric, direction, and evaluator.

🇯🇵 日本人クリエイター向け解説

一言でいうと

新しい自動分析の実験を始める際に、分析対象

※ jpskill.com 編集部が日本のビジネス現場向けに補足した解説です。Skill本体の挙動とは独立した参考情報です。

⚡ おすすめ: コマンド1行でインストール(60秒)

下記のコマンドをコピーしてターミナル(Mac/Linux)または PowerShell(Windows)に貼り付けてください。 ダウンロード → 解凍 → 配置まで全自動。

🍎 Mac / 🐧 Linux
mkdir -p ~/.claude/skills && cd ~/.claude/skills && curl -L -o setup.zip https://jpskill.com/download/4416.zip && unzip -o setup.zip && rm setup.zip
🪟 Windows (PowerShell)
$d = "$env:USERPROFILE\.claude\skills"; ni -Force -ItemType Directory $d | Out-Null; iwr https://jpskill.com/download/4416.zip -OutFile "$d\setup.zip"; Expand-Archive "$d\setup.zip" -DestinationPath $d -Force; ri "$d\setup.zip"

完了後、Claude Code を再起動 → 普通に「動画プロンプト作って」のように話しかけるだけで自動発動します。

💾 手動でダウンロードしたい(コマンドが難しい人向け)
  1. 1. 下の青いボタンを押して setup.zip をダウンロード
  2. 2. ZIPファイルをダブルクリックで解凍 → setup フォルダができる
  3. 3. そのフォルダを C:\Users\あなたの名前\.claude\skills\(Win)または ~/.claude/skills/(Mac)へ移動
  4. 4. Claude Code を再起動

⚠️ ダウンロード・利用は自己責任でお願いします。当サイトは内容・動作・安全性について責任を負いません。

🎯 このSkillでできること

下記の説明文を読むと、このSkillがあなたに何をしてくれるかが分かります。Claudeにこの分野の依頼をすると、自動で発動します。

📦 インストール方法 (3ステップ)

  1. 1. 上の「ダウンロード」ボタンを押して .skill ファイルを取得
  2. 2. ファイル名の拡張子を .skill から .zip に変えて展開(macは自動展開可)
  3. 3. 展開してできたフォルダを、ホームフォルダの .claude/skills/ に置く
    • · macOS / Linux: ~/.claude/skills/
    • · Windows: %USERPROFILE%\.claude\skills\

Claude Code を再起動すれば完了。「このSkillを使って…」と話しかけなくても、関連する依頼で自動的に呼び出されます。

詳しい使い方ガイドを見る →
最終更新
2026-05-17
取得日時
2026-05-18
同梱ファイル
1

💬 こう話しかけるだけ — サンプルプロンプト

  • Setup を使って、最小構成のサンプルコードを示して
  • Setup の主な使い方と注意点を教えて
  • Setup を既存プロジェクトに組み込む方法を教えて

これをClaude Code に貼るだけで、このSkillが自動発動します。

📖 Skill本文(日本語訳)

※ 原文(英語/中国語)を Gemini で日本語化したものです。Claude 自身は原文を読みます。誤訳がある場合は原文をご確認ください。

[スキル名] セットアップ

/ar:setup — 新しい実験の作成

必要な設定をすべて備えた新しい自動リサーチ実験をセットアップします。

使用方法

/ar:setup                                    # 対話モード
/ar:setup engineering api-speed src/api.py "pytest bench.py" p50_ms lower
/ar:setup --list                             # 既存の実験を表示
/ar:setup --list-evaluators                  # 利用可能な評価器を表示

動作内容

引数が指定された場合

引数をセットアップスクリプトに直接渡します。

python {skill_path}/scripts/setup_experiment.py \
  --domain {domain} --name {name} \
  --target {target} --eval "{eval_cmd}" \
  --metric {metric} --direction {direction} \
  [--evaluator {evaluator}] [--scope {scope}]

引数がない場合(対話モード)

各パラメータを1つずつ収集します。

  1. ドメイン — 質問: 「どのドメインですか? (engineering, marketing, content, prompts, custom)」
  2. 名前 — 質問: 「実験名は何ですか? (例: api-speed, blog-titles)」
  3. ターゲットファイル — 質問: 「最適化するファイルはどれですか?」存在することを確認します。
  4. 評価コマンド — 質問: 「どのように測定しますか? (例: pytest bench.py, python evaluate.py)」
  5. メトリック — 質問: 「評価出力のメトリックは何ですか? (例: p50_ms, ctr_score)」
  6. 方向 — 質問: 「低い方が良いですか、高い方が良いですか?」
  7. 評価器 (オプション) — 組み込みの評価器を表示します。質問: 「組み込みの評価器を使用しますか、それとも独自の評価器を使用しますか?」
  8. スコープ — 質問: 「プロジェクト (.autoresearch/) に保存しますか、それともユーザー (~/.autoresearch/) に保存しますか?」

その後、収集されたパラメータで setup_experiment.py を実行します。

リスト表示

# 既存の実験を表示
python {skill_path}/scripts/setup_experiment.py --list

# 利用可能な評価器を表示
python {skill_path}/scripts/setup_experiment.py --list-evaluators

組み込み評価器

名前 メトリック ユースケース
benchmark_speed p50_ms (低い方が良い) 関数/API実行時間
benchmark_size size_bytes (低い方が良い) ファイル、バンドル、Dockerイメージサイズ
test_pass_rate pass_rate (高い方が良い) テストスイートの合格率
build_speed build_seconds (低い方が良い) ビルド/コンパイル/Dockerビルド時間
memory_usage peak_mb (低い方が良い) 実行中のピークメモリ
llm_judge_content ctr_score (高い方が良い) 見出し、タイトル、説明
llm_judge_prompt quality_score (高い方が良い) システムプロンプト、エージェント指示
llm_judge_copy engagement_score (高い方が良い) ソーシャル投稿、広告コピー、メール

セットアップ後

ユーザーに報告します。

  • 実験パスとブランチ名
  • 評価コマンドが機能したかどうか、およびベースラインメトリック
  • 提案: 「/ar:run {domain}/{name} を実行して反復を開始するか、/ar:loop {domain}/{name} を実行して自律モードを開始してください。」
📜 原文 SKILL.md(Claudeが読む英語/中国語)を展開

/ar:setup — Create New Experiment

Set up a new autoresearch experiment with all required configuration.

Usage

/ar:setup                                    # Interactive mode
/ar:setup engineering api-speed src/api.py "pytest bench.py" p50_ms lower
/ar:setup --list                             # Show existing experiments
/ar:setup --list-evaluators                  # Show available evaluators

What It Does

If arguments provided

Pass them directly to the setup script:

python {skill_path}/scripts/setup_experiment.py \
  --domain {domain} --name {name} \
  --target {target} --eval "{eval_cmd}" \
  --metric {metric} --direction {direction} \
  [--evaluator {evaluator}] [--scope {scope}]

If no arguments (interactive mode)

Collect each parameter one at a time:

  1. Domain — Ask: "What domain? (engineering, marketing, content, prompts, custom)"
  2. Name — Ask: "Experiment name? (e.g., api-speed, blog-titles)"
  3. Target file — Ask: "Which file to optimize?" Verify it exists.
  4. Eval command — Ask: "How to measure it? (e.g., pytest bench.py, python evaluate.py)"
  5. Metric — Ask: "What metric does the eval output? (e.g., p50_ms, ctr_score)"
  6. Direction — Ask: "Is lower or higher better?"
  7. Evaluator (optional) — Show built-in evaluators. Ask: "Use a built-in evaluator, or your own?"
  8. Scope — Ask: "Store in project (.autoresearch/) or user (~/.autoresearch/)?"

Then run setup_experiment.py with the collected parameters.

Listing

# Show existing experiments
python {skill_path}/scripts/setup_experiment.py --list

# Show available evaluators
python {skill_path}/scripts/setup_experiment.py --list-evaluators

Built-in Evaluators

Name Metric Use Case
benchmark_speed p50_ms (lower) Function/API execution time
benchmark_size size_bytes (lower) File, bundle, Docker image size
test_pass_rate pass_rate (higher) Test suite pass percentage
build_speed build_seconds (lower) Build/compile/Docker build time
memory_usage peak_mb (lower) Peak memory during execution
llm_judge_content ctr_score (higher) Headlines, titles, descriptions
llm_judge_prompt quality_score (higher) System prompts, agent instructions
llm_judge_copy engagement_score (higher) Social posts, ad copy, emails

After Setup

Report to the user:

  • Experiment path and branch name
  • Whether the eval command worked and the baseline metric
  • Suggest: "Run /ar:run {domain}/{name} to start iterating, or /ar:loop {domain}/{name} for autonomous mode."