jpskill.com
💼 ビジネス コミュニティ

広告A/Bテスト設計

ads-test

広告のA/Bテスト設計や効果測定に必要な仮説構築、統計的な有意差の計算、テスト期間やサンプルサイズの算出、Meta、Google、LinkedInでの実験設定ガイドを提供し、広告効果を改善するSkill。

📜 元の英語説明(参考)

A/B test design and experiment planning for paid advertising. Structured hypothesis framework, statistical significance calculator, test duration estimator, sample size calculator, and platform-specific experiment setup guides (Meta Experiments, Google Experiments, LinkedIn A/B). Use when user says A/B test, split test, experiment design, test hypothesis, statistical significance, sample size, or test duration.

🇯🇵 日本人クリエイター向け解説

一言でいうと

広告のA/Bテスト設計や効果測定に必要な仮説構築、統計的な有意差の計算、テスト期間やサンプルサイズの算出、Meta、Google、LinkedInでの実験設定ガイドを提供し、広告効果を改善するSkill。

※ jpskill.com 編集部が日本のビジネス現場向けに補足した解説です。Skill本体の挙動とは独立した参考情報です。

⚡ おすすめ: コマンド1行でインストール(60秒)

下記のコマンドをコピーしてターミナル(Mac/Linux)または PowerShell(Windows)に貼り付けてください。 ダウンロード → 解凍 → 配置まで全自動。

🍎 Mac / 🐧 Linux
mkdir -p ~/.claude/skills && cd ~/.claude/skills && curl -L -o ads-test.zip https://jpskill.com/download/10506.zip && unzip -o ads-test.zip && rm ads-test.zip
🪟 Windows (PowerShell)
$d = "$env:USERPROFILE\.claude\skills"; ni -Force -ItemType Directory $d | Out-Null; iwr https://jpskill.com/download/10506.zip -OutFile "$d\ads-test.zip"; Expand-Archive "$d\ads-test.zip" -DestinationPath $d -Force; ri "$d\ads-test.zip"

完了後、Claude Code を再起動 → 普通に「動画プロンプト作って」のように話しかけるだけで自動発動します。

💾 手動でダウンロードしたい(コマンドが難しい人向け)
  1. 1. 下の青いボタンを押して ads-test.zip をダウンロード
  2. 2. ZIPファイルをダブルクリックで解凍 → ads-test フォルダができる
  3. 3. そのフォルダを C:\Users\あなたの名前\.claude\skills\(Win)または ~/.claude/skills/(Mac)へ移動
  4. 4. Claude Code を再起動

⚠️ ダウンロード・利用は自己責任でお願いします。当サイトは内容・動作・安全性について責任を負いません。

🎯 このSkillでできること

下記の説明文を読むと、このSkillがあなたに何をしてくれるかが分かります。Claudeにこの分野の依頼をすると、自動で発動します。

📦 インストール方法 (3ステップ)

  1. 1. 上の「ダウンロード」ボタンを押して .skill ファイルを取得
  2. 2. ファイル名の拡張子を .skill から .zip に変えて展開(macは自動展開可)
  3. 3. 展開してできたフォルダを、ホームフォルダの .claude/skills/ に置く
    • · macOS / Linux: ~/.claude/skills/
    • · Windows: %USERPROFILE%\.claude\skills\

Claude Code を再起動すれば完了。「このSkillを使って…」と話しかけなくても、関連する依頼で自動的に呼び出されます。

詳しい使い方ガイドを見る →
最終更新
2026-05-18
取得日時
2026-05-18
同梱ファイル
1

📖 Skill本文(日本語訳)

※ 原文(英語/中国語)を Gemini で日本語化したものです。Claude 自身は原文を読みます。誤訳がある場合は原文をご確認ください。

A/Bテストの設計と実験計画

<!-- 作成日: 2026-04-13 | v1.5 --> <!-- ソース: OpenClaudia/openclaudia-skills (ab-test-setup concept) -->

プロセス

  1. ユーザーが何をテストしたいのかを理解する(クリエイティブ、オーディエンス、入札、ランディングページ)
  2. 下記のフレームワークを使用して、構造化された仮説を構築する
  3. 必要なサンプルサイズと推定期間を計算する
  4. プラットフォーム固有のテスト設定を推奨する
  5. 成功基準と測定計画を定義する

仮説フレームワーク

すべてのテストは、構造化された仮説から始める必要があります。

もし私たちが [変更/アクション] を行うならば
そうすれば [指標] は [増加/減少] し、[推定%] だけ変化するだろう
なぜならば [データまたは洞察に基づいた推論]

例:
もし私たちが洗練された製品写真を UGC クリエイターの動画に置き換えるならば
そうすれば Meta CTR は 25-40% 増加するだろう
なぜならば Andromeda は多様なクリエイティブフォーマットを優先し、UGC は 2025-2026 年のベンチマークで一貫して洗練されたものを上回っているから

仮説品質チェックリスト

  • [ ] テスト対象の変数が単一であること(変更を分離する)
  • [ ] 具体的な指標が定義されていること(「パフォーマンス」ではない)
  • [ ] 推定効果量が明記されていること(サンプルサイズの計算に必要)
  • [ ] 期間が定義されていること
  • [ ] 開始前に成功/失敗の基準が明確であること

統計的有意性計算ツール

必要なサンプルサイズ(バリアントごと):

n = (Z_alpha + Z_beta)^2 × 2 × p × (1-p) / MDE^2

ここで:
- Z_alpha = 1.96 (95%信頼度の場合)
- Z_beta = 0.84 (80%検出力の場合)
- p = ベースラインのコンバージョン率
- MDE = 最小検出可能効果(相対%)

簡易ルックアップ:
ベースライン CVR 5% MDE 10% MDE 20% MDE 30% MDE
1% 612,000 153,000 38,300 17,000
2% 302,400 75,600 18,900 8,400
5% 116,800 29,200 7,300 3,200
10% 55,200 13,800 3,450 1,530
20% 24,600 6,150 1,540 680

バリアントごと、95%信頼度、80%検出力

テスト期間推定ツール

期間 = 必要なサンプルサイズ / バリアントごとの1日のトラフィック

最小期間:7日間(週ごとのパターンを捉える)
推奨最大期間:28日間(季節的な変動を避ける)
学習期間:Google 7-14日間、Meta 3-7日間、LinkedIn 7-14日間

必要な入力:
- 1日のインプレッション数またはクリック数
- バリアント数(2 = A/B、3+ = 多変量)
- ベースラインのコンバージョン率
- 望ましい最小検出可能効果

期間のクイック見積もり

1日のクリック数 2% CVR, 20% MDE 5% CVR, 20% MDE 10% CVR, 20% MDE
100 189 日間 73 日間 35 日間
500 38 日間 15 日間 7 日間
1,000 19 日間 7 日間 4 日間*
5,000 4 日間* 2 日間* 1 日間*

*サンプルが十分に足りている場合でも、最低7日間を推奨

プラットフォーム固有のテスト設定

Meta Experiments

  • 広告マネージャ > 実験タブを使用(手動での広告セットの複製ではない)
  • 自動オーディエンス分割により、重複がないことを保証
  • サポートされているテストタイプ:A/B(クリエイティブ、オーディエンス、配置)、ホールドアウト、ブランド調査
  • Meta の Incremental Attribution (2025年4月) は、AI を活用したホールドアウトテストを提供し、真の因果関係を測定
  • 予算:バリアント間で均等に分割。バリアントごとに最低 $100/日を推奨
  • 期間:通常 7-14 日間。Meta は 95% の信頼度で勝者を自動的に決定

Google Experiments

  • キャンペーン実験(カスタム実験)または広告バリエーション
  • 既存のキャンペーンから実験を作成 > 実験タイプを選択
  • トラフィック分割:最速の結果を得るには 50/50 を推奨
  • サポートされているもの:入札戦略、広告コピー、ランディングページ、オーディエンス
  • 指標:開始前に主要な指標(コンバージョン、CPA、ROAS)を選択
  • 期間:14-30 日間を推奨。入札テストの場合は最低 2 週間

LinkedIn A/B Testing

  • スポンサードコンテンツのキャンペーンマネージャに組み込まれている
  • 単一の変数を変更して広告セットを複製
  • ターゲット:自動ローテーションによる同じオーディエンスセグメント
  • 最小予算:バリアントごとに $50/日
  • 主要な指標:CTR(>0.44% ベンチマーク)、CPL、リードフォーム CVR(13% ベンチマーク)
  • 期間:14-21 日間(LinkedIn の 1 日あたりのボリュームが少ないため、より長いテストが必要)

TikTok Split Testing

  • TikTok 広告マネージャ > A/Bテストの作成 で利用可能
  • テストタイプ:ターゲティング、入札、クリエイティブ
  • 汚染を避けるためにオーディエンスを自動分割
  • 最小 7 日間、推奨 14 日間
  • 予算:広告グループごとに最低 $20/日
  • クリエイティブテスト:フック(最初の 2-3 秒)を主要な変数として分離
  • TikTok の拡張されたスプリットテストは、2025 年以降、Smart+ を介してモジュール式のテスト変数(ターゲティング、クリエイティブ、予算、配置)をサポート

テスト対象(優先順位)

高インパクト(最初にテスト)

  1. クリエイティブコンセプト(単なる色の変更ではなく、異なるメッセージングの角度)
  2. フック/最初の 3 秒(Meta、TikTok、YouTube での動画の冒頭)
  3. オファー構造(価格設定、割引タイプ、無料トライアル期間)
  4. ランディングページ(見出し、CTA、フォームの長さ)
  5. 入札戦略(tCPA vs tROAS vs コンバージョン数の最大化)

中インパクト

  1. オーディエンスターゲティング(インタレスト vs 類似 vs 広範)
  2. 広告フォーマット(静止画 vs 動画 vs カルーセル)
  3. CTA ボタン(詳細はこちら vs サインアップ vs 今すぐ購入)
  4. キャンペーン構造(CBO vs ABO、統合 vs セグメント化)

低インパクト(最後にテスト)

  1. 広告スケジュール(時間帯、曜日)
  2. デバイスターゲティング(モバイル vs デスクトップ)
  3. 軽微なコピーのバリエーション(コンセプトの変更なしに単語を置き換える)

避けるべき一般的なテストの誤り

  • 一度に多くの変数をテストする(明確な勝者の特定ができない)
  • テストを早期に終了する(統計的有意性の前に)
  • 非典型的な期間中にテストする(祝日、ローンチ、インシデント)
  • 等しくない期間を比較する
  • 学習内容を文書化しない(組織的な知識を構築する)
  • 大きな変更が必要な場合に小さな変更をテストする(最適化 vs 革新)
  • 自動化されたプラットフォームでの学習期間を無視する

出力形式


## A/Bテスト計画

### 仮説
もし [変更] を行うならば
そうすれば [指標] は [方向] に [量] だけ変化するだろう
なぜならば [推論]

### テスト設計
| パラメータ | 値 |
|-----------|-------|
| プラットフォーム | [プラットフォーム] |
| テストタイプ | [A/B / 多変量] |
| 変数 | [変更されるもの]

(原文はここで切り詰められています)
📜 原文 SKILL.md(Claudeが読む英語/中国語)を展開

A/B Test Design & Experiment Planning

<!-- Created: 2026-04-13 | v1.5 --> <!-- Source: OpenClaudia/openclaudia-skills (ab-test-setup concept) -->

Process

  1. Understand what the user wants to test (creative, audience, bidding, landing page)
  2. Build structured hypothesis using the framework below
  3. Calculate required sample size and estimated duration
  4. Recommend platform-specific test setup
  5. Define success criteria and measurement plan

Hypothesis Framework

Every test must start with a structured hypothesis:

IF we [change/action]
THEN [metric] will [increase/decrease] by [estimated %]
BECAUSE [reasoning based on data or insight]

Example:
IF we replace polished product shots with UGC creator videos
THEN Meta CTR will increase by 25-40%
BECAUSE Andromeda prioritizes diverse creative formats and UGC consistently outperforms polished in 2025-2026 benchmarks

Hypothesis Quality Checklist

  • [ ] Single variable being tested (isolate the change)
  • [ ] Specific metric defined (not "performance")
  • [ ] Estimated effect size stated (needed for sample size calculation)
  • [ ] Timeframe defined
  • [ ] Success/failure criteria clear before launch

Statistical Significance Calculator

Required Sample Size (per variant):

n = (Z_alpha + Z_beta)^2 × 2 × p × (1-p) / MDE^2

Where:
- Z_alpha = 1.96 (for 95% confidence)
- Z_beta = 0.84 (for 80% power)
- p = baseline conversion rate
- MDE = minimum detectable effect (relative %)

Simplified lookup:
Baseline CVR 5% MDE 10% MDE 20% MDE 30% MDE
1% 612,000 153,000 38,300 17,000
2% 302,400 75,600 18,900 8,400
5% 116,800 29,200 7,300 3,200
10% 55,200 13,800 3,450 1,530
20% 24,600 6,150 1,540 680

Per variant, 95% confidence, 80% power

Test Duration Estimator

Duration = Required Sample Size / Daily Traffic per Variant

Minimum duration: 7 days (capture weekly patterns)
Maximum recommended: 28 days (avoid seasonal drift)
Learning phase: Google 7-14 days, Meta 3-7 days, LinkedIn 7-14 days

Inputs needed:
- Daily impressions or clicks
- Number of variants (2 = A/B, 3+ = multivariate)
- Baseline conversion rate
- Minimum detectable effect desired

Duration Quick Estimates

Daily Clicks 2% CVR, 20% MDE 5% CVR, 20% MDE 10% CVR, 20% MDE
100 189 days 73 days 35 days
500 38 days 15 days 7 days
1,000 19 days 7 days 4 days*
5,000 4 days* 2 days* 1 day*

*Minimum 7 days recommended regardless of sample sufficiency

Platform-Specific Test Setup

Meta Experiments

  • Use Ads Manager > Experiments tab (not manual ad set duplication)
  • Automatic audience splitting ensures no overlap
  • Supported test types: A/B (creative, audience, placement), Holdout, Brand Survey
  • Meta's Incremental Attribution (April 2025) provides AI-powered holdout testing for measuring real causal impact
  • Budget: split evenly across variants; minimum $100/day per variant recommended
  • Duration: 7-14 days typical; Meta auto-determines winner at 95% confidence

Google Experiments

  • Campaign Experiments (custom experiments) or Ad Variations
  • Create experiment from existing campaign > select experiment type
  • Traffic split: 50/50 recommended for fastest results
  • Supported: bidding strategy, ad copy, landing page, audience
  • Metrics: choose primary metric (conversions, CPA, ROAS) before launch
  • Duration: 14-30 days recommended; minimum 2 weeks for bidding tests

LinkedIn A/B Testing

  • Built into Campaign Manager for Sponsored Content
  • Duplicate ad set with single variable change
  • Target: same audience segment with automatic rotation
  • Minimum budget: $50/day per variant
  • Key metrics: CTR (>0.44% benchmark), CPL, Lead Form CVR (13% benchmark)
  • Duration: 14-21 days (LinkedIn's smaller daily volumes require longer tests)

TikTok Split Testing

  • Available in TikTok Ads Manager > Create A/B Test
  • Test types: targeting, bidding, creative
  • Auto-splits audience to avoid contamination
  • Minimum 7 days, recommended 14 days
  • Budget: minimum $20/day per ad group
  • Creative tests: isolate hook (first 2-3 seconds) as the primary variable
  • TikTok's enhanced split testing supports modular test variables (targeting, creative, budget, placement) via Smart+ since 2025

What to Test (Priority Order)

High Impact (test first)

  1. Creative concept (different messaging angles, not just color changes)
  2. Hook/first 3 seconds (video opening on Meta, TikTok, YouTube)
  3. Offer structure (pricing, discount type, free trial length)
  4. Landing page (headline, CTA, form length)
  5. Bidding strategy (tCPA vs tROAS vs Maximize Conversions)

Medium Impact

  1. Audience targeting (interest vs lookalike vs broad)
  2. Ad format (static vs video vs carousel)
  3. CTA button (Learn More vs Sign Up vs Shop Now)
  4. Campaign structure (CBO vs ABO, consolidated vs segmented)

Low Impact (test last)

  1. Ad scheduling (time of day, day of week)
  2. Device targeting (mobile vs desktop)
  3. Minor copy variations (word substitutions without concept change)

Common Testing Mistakes to Avoid

  • Testing too many variables at once (no clear winner attribution)
  • Ending tests too early (before statistical significance)
  • Testing during atypical periods (holidays, launches, incidents)
  • Comparing unequal time periods
  • Not documenting learnings (build institutional knowledge)
  • Testing small changes when big changes are needed (optimize vs innovate)
  • Ignoring learning phase on automated platforms

Output Format

## A/B Test Plan

### Hypothesis
IF [change]
THEN [metric] will [direction] by [amount]
BECAUSE [reasoning]

### Test Design
| Parameter | Value |
|-----------|-------|
| Platform | [platform] |
| Test Type | [A/B / Multivariate] |
| Variable | [what's being changed] |
| Control | [current state] |
| Variant | [proposed change] |
| Primary Metric | [KPI] |
| Traffic Split | [50/50 / other] |

### Sample Size & Duration
| Metric | Value |
|--------|-------|
| Baseline CVR | [X%] |
| MDE | [X%] |
| Required Sample | [N per variant] |
| Daily Traffic | [N clicks/day] |
| Est. Duration | [X days] |
| Min Duration | 7 days |

### Success Criteria
- Winner declared at 95% confidence
- [Primary metric] improvement of [X%]+ sustained over [Y] days
- No negative impact on [secondary metric]

### Setup Instructions
[Platform-specific step-by-step]