🛠️ セットアップ
新しい自動分析の実験を始める際に、分析対象
📺 まず動画で見る(YouTube)
▶ 【衝撃】最強のAIエージェント「Claude Code」の最新機能・使い方・プログラミングをAIで効率化する超実践術を解説! ↗
※ jpskill.com 編集部が参考用に選んだ動画です。動画の内容と Skill の挙動は厳密には一致しないことがあります。
📜 元の英語説明(参考)
Set up a new autoresearch experiment interactively. Collects domain, target file, eval command, metric, direction, and evaluator.
🇯🇵 日本人クリエイター向け解説
新しい自動分析の実験を始める際に、分析対象
※ jpskill.com 編集部が日本のビジネス現場向けに補足した解説です。Skill本体の挙動とは独立した参考情報です。
下記のコマンドをコピーしてターミナル(Mac/Linux)または PowerShell(Windows)に貼り付けてください。 ダウンロード → 解凍 → 配置まで全自動。
mkdir -p ~/.claude/skills && cd ~/.claude/skills && curl -L -o setup.zip https://jpskill.com/download/4416.zip && unzip -o setup.zip && rm setup.zip
$d = "$env:USERPROFILE\.claude\skills"; ni -Force -ItemType Directory $d | Out-Null; iwr https://jpskill.com/download/4416.zip -OutFile "$d\setup.zip"; Expand-Archive "$d\setup.zip" -DestinationPath $d -Force; ri "$d\setup.zip"
完了後、Claude Code を再起動 → 普通に「動画プロンプト作って」のように話しかけるだけで自動発動します。
💾 手動でダウンロードしたい(コマンドが難しい人向け)
- 1. 下の青いボタンを押して
setup.zipをダウンロード - 2. ZIPファイルをダブルクリックで解凍 →
setupフォルダができる - 3. そのフォルダを
C:\Users\あなたの名前\.claude\skills\(Win)または~/.claude/skills/(Mac)へ移動 - 4. Claude Code を再起動
⚠️ ダウンロード・利用は自己責任でお願いします。当サイトは内容・動作・安全性について責任を負いません。
🎯 このSkillでできること
下記の説明文を読むと、このSkillがあなたに何をしてくれるかが分かります。Claudeにこの分野の依頼をすると、自動で発動します。
📦 インストール方法 (3ステップ)
- 1. 上の「ダウンロード」ボタンを押して .skill ファイルを取得
- 2. ファイル名の拡張子を .skill から .zip に変えて展開(macは自動展開可)
- 3. 展開してできたフォルダを、ホームフォルダの
.claude/skills/に置く- · macOS / Linux:
~/.claude/skills/ - · Windows:
%USERPROFILE%\.claude\skills\
- · macOS / Linux:
Claude Code を再起動すれば完了。「このSkillを使って…」と話しかけなくても、関連する依頼で自動的に呼び出されます。
詳しい使い方ガイドを見る →- 最終更新
- 2026-05-17
- 取得日時
- 2026-05-18
- 同梱ファイル
- 1
💬 こう話しかけるだけ — サンプルプロンプト
- › Setup を使って、最小構成のサンプルコードを示して
- › Setup の主な使い方と注意点を教えて
- › Setup を既存プロジェクトに組み込む方法を教えて
これをClaude Code に貼るだけで、このSkillが自動発動します。
📖 Skill本文(日本語訳)
※ 原文(英語/中国語)を Gemini で日本語化したものです。Claude 自身は原文を読みます。誤訳がある場合は原文をご確認ください。
[スキル名] セットアップ
/ar:setup — 新しい実験の作成
必要な設定をすべて備えた新しい自動リサーチ実験をセットアップします。
使用方法
/ar:setup # 対話モード
/ar:setup engineering api-speed src/api.py "pytest bench.py" p50_ms lower
/ar:setup --list # 既存の実験を表示
/ar:setup --list-evaluators # 利用可能な評価器を表示
動作内容
引数が指定された場合
引数をセットアップスクリプトに直接渡します。
python {skill_path}/scripts/setup_experiment.py \
--domain {domain} --name {name} \
--target {target} --eval "{eval_cmd}" \
--metric {metric} --direction {direction} \
[--evaluator {evaluator}] [--scope {scope}]
引数がない場合(対話モード)
各パラメータを1つずつ収集します。
- ドメイン — 質問: 「どのドメインですか? (engineering, marketing, content, prompts, custom)」
- 名前 — 質問: 「実験名は何ですか? (例: api-speed, blog-titles)」
- ターゲットファイル — 質問: 「最適化するファイルはどれですか?」存在することを確認します。
- 評価コマンド — 質問: 「どのように測定しますか? (例: pytest bench.py, python evaluate.py)」
- メトリック — 質問: 「評価出力のメトリックは何ですか? (例: p50_ms, ctr_score)」
- 方向 — 質問: 「低い方が良いですか、高い方が良いですか?」
- 評価器 (オプション) — 組み込みの評価器を表示します。質問: 「組み込みの評価器を使用しますか、それとも独自の評価器を使用しますか?」
- スコープ — 質問: 「プロジェクト (.autoresearch/) に保存しますか、それともユーザー (~/.autoresearch/) に保存しますか?」
その後、収集されたパラメータで setup_experiment.py を実行します。
リスト表示
# 既存の実験を表示
python {skill_path}/scripts/setup_experiment.py --list
# 利用可能な評価器を表示
python {skill_path}/scripts/setup_experiment.py --list-evaluators
組み込み評価器
| 名前 | メトリック | ユースケース |
|---|---|---|
benchmark_speed |
p50_ms (低い方が良い) |
関数/API実行時間 |
benchmark_size |
size_bytes (低い方が良い) |
ファイル、バンドル、Dockerイメージサイズ |
test_pass_rate |
pass_rate (高い方が良い) |
テストスイートの合格率 |
build_speed |
build_seconds (低い方が良い) |
ビルド/コンパイル/Dockerビルド時間 |
memory_usage |
peak_mb (低い方が良い) |
実行中のピークメモリ |
llm_judge_content |
ctr_score (高い方が良い) |
見出し、タイトル、説明 |
llm_judge_prompt |
quality_score (高い方が良い) |
システムプロンプト、エージェント指示 |
llm_judge_copy |
engagement_score (高い方が良い) |
ソーシャル投稿、広告コピー、メール |
セットアップ後
ユーザーに報告します。
- 実験パスとブランチ名
- 評価コマンドが機能したかどうか、およびベースラインメトリック
- 提案: 「
/ar:run {domain}/{name}を実行して反復を開始するか、/ar:loop {domain}/{name}を実行して自律モードを開始してください。」
📜 原文 SKILL.md(Claudeが読む英語/中国語)を展開
/ar:setup — Create New Experiment
Set up a new autoresearch experiment with all required configuration.
Usage
/ar:setup # Interactive mode
/ar:setup engineering api-speed src/api.py "pytest bench.py" p50_ms lower
/ar:setup --list # Show existing experiments
/ar:setup --list-evaluators # Show available evaluators
What It Does
If arguments provided
Pass them directly to the setup script:
python {skill_path}/scripts/setup_experiment.py \
--domain {domain} --name {name} \
--target {target} --eval "{eval_cmd}" \
--metric {metric} --direction {direction} \
[--evaluator {evaluator}] [--scope {scope}]
If no arguments (interactive mode)
Collect each parameter one at a time:
- Domain — Ask: "What domain? (engineering, marketing, content, prompts, custom)"
- Name — Ask: "Experiment name? (e.g., api-speed, blog-titles)"
- Target file — Ask: "Which file to optimize?" Verify it exists.
- Eval command — Ask: "How to measure it? (e.g., pytest bench.py, python evaluate.py)"
- Metric — Ask: "What metric does the eval output? (e.g., p50_ms, ctr_score)"
- Direction — Ask: "Is lower or higher better?"
- Evaluator (optional) — Show built-in evaluators. Ask: "Use a built-in evaluator, or your own?"
- Scope — Ask: "Store in project (.autoresearch/) or user (~/.autoresearch/)?"
Then run setup_experiment.py with the collected parameters.
Listing
# Show existing experiments
python {skill_path}/scripts/setup_experiment.py --list
# Show available evaluators
python {skill_path}/scripts/setup_experiment.py --list-evaluators
Built-in Evaluators
| Name | Metric | Use Case |
|---|---|---|
benchmark_speed |
p50_ms (lower) |
Function/API execution time |
benchmark_size |
size_bytes (lower) |
File, bundle, Docker image size |
test_pass_rate |
pass_rate (higher) |
Test suite pass percentage |
build_speed |
build_seconds (lower) |
Build/compile/Docker build time |
memory_usage |
peak_mb (lower) |
Peak memory during execution |
llm_judge_content |
ctr_score (higher) |
Headlines, titles, descriptions |
llm_judge_prompt |
quality_score (higher) |
System prompts, agent instructions |
llm_judge_copy |
engagement_score (higher) |
Social posts, ad copy, emails |
After Setup
Report to the user:
- Experiment path and branch name
- Whether the eval command worked and the baseline metric
- Suggest: "Run
/ar:run {domain}/{name}to start iterating, or/ar:loop {domain}/{name}for autonomous mode."