広告A/Bテスト設計
広告のA/Bテスト設計や効果測定に必要な仮説構築、統計的な有意差の計算、テスト期間やサンプルサイズの算出、Meta、Google、LinkedInでの実験設定ガイドを提供し、広告効果を改善するSkill。
📜 元の英語説明(参考)
A/B test design and experiment planning for paid advertising. Structured hypothesis framework, statistical significance calculator, test duration estimator, sample size calculator, and platform-specific experiment setup guides (Meta Experiments, Google Experiments, LinkedIn A/B). Use when user says A/B test, split test, experiment design, test hypothesis, statistical significance, sample size, or test duration.
🇯🇵 日本人クリエイター向け解説
広告のA/Bテスト設計や効果測定に必要な仮説構築、統計的な有意差の計算、テスト期間やサンプルサイズの算出、Meta、Google、LinkedInでの実験設定ガイドを提供し、広告効果を改善するSkill。
※ jpskill.com 編集部が日本のビジネス現場向けに補足した解説です。Skill本体の挙動とは独立した参考情報です。
下記のコマンドをコピーしてターミナル(Mac/Linux)または PowerShell(Windows)に貼り付けてください。 ダウンロード → 解凍 → 配置まで全自動。
mkdir -p ~/.claude/skills && cd ~/.claude/skills && curl -L -o ads-test.zip https://jpskill.com/download/10506.zip && unzip -o ads-test.zip && rm ads-test.zip
$d = "$env:USERPROFILE\.claude\skills"; ni -Force -ItemType Directory $d | Out-Null; iwr https://jpskill.com/download/10506.zip -OutFile "$d\ads-test.zip"; Expand-Archive "$d\ads-test.zip" -DestinationPath $d -Force; ri "$d\ads-test.zip"
完了後、Claude Code を再起動 → 普通に「動画プロンプト作って」のように話しかけるだけで自動発動します。
💾 手動でダウンロードしたい(コマンドが難しい人向け)
- 1. 下の青いボタンを押して
ads-test.zipをダウンロード - 2. ZIPファイルをダブルクリックで解凍 →
ads-testフォルダができる - 3. そのフォルダを
C:\Users\あなたの名前\.claude\skills\(Win)または~/.claude/skills/(Mac)へ移動 - 4. Claude Code を再起動
⚠️ ダウンロード・利用は自己責任でお願いします。当サイトは内容・動作・安全性について責任を負いません。
🎯 このSkillでできること
下記の説明文を読むと、このSkillがあなたに何をしてくれるかが分かります。Claudeにこの分野の依頼をすると、自動で発動します。
📦 インストール方法 (3ステップ)
- 1. 上の「ダウンロード」ボタンを押して .skill ファイルを取得
- 2. ファイル名の拡張子を .skill から .zip に変えて展開(macは自動展開可)
- 3. 展開してできたフォルダを、ホームフォルダの
.claude/skills/に置く- · macOS / Linux:
~/.claude/skills/ - · Windows:
%USERPROFILE%\.claude\skills\
- · macOS / Linux:
Claude Code を再起動すれば完了。「このSkillを使って…」と話しかけなくても、関連する依頼で自動的に呼び出されます。
詳しい使い方ガイドを見る →- 最終更新
- 2026-05-18
- 取得日時
- 2026-05-18
- 同梱ファイル
- 1
📖 Skill本文(日本語訳)
※ 原文(英語/中国語)を Gemini で日本語化したものです。Claude 自身は原文を読みます。誤訳がある場合は原文をご確認ください。
A/Bテストの設計と実験計画
<!-- 作成日: 2026-04-13 | v1.5 --> <!-- ソース: OpenClaudia/openclaudia-skills (ab-test-setup concept) -->
プロセス
- ユーザーが何をテストしたいのかを理解する(クリエイティブ、オーディエンス、入札、ランディングページ)
- 下記のフレームワークを使用して、構造化された仮説を構築する
- 必要なサンプルサイズと推定期間を計算する
- プラットフォーム固有のテスト設定を推奨する
- 成功基準と測定計画を定義する
仮説フレームワーク
すべてのテストは、構造化された仮説から始める必要があります。
もし私たちが [変更/アクション] を行うならば
そうすれば [指標] は [増加/減少] し、[推定%] だけ変化するだろう
なぜならば [データまたは洞察に基づいた推論]
例:
もし私たちが洗練された製品写真を UGC クリエイターの動画に置き換えるならば
そうすれば Meta CTR は 25-40% 増加するだろう
なぜならば Andromeda は多様なクリエイティブフォーマットを優先し、UGC は 2025-2026 年のベンチマークで一貫して洗練されたものを上回っているから
仮説品質チェックリスト
- [ ] テスト対象の変数が単一であること(変更を分離する)
- [ ] 具体的な指標が定義されていること(「パフォーマンス」ではない)
- [ ] 推定効果量が明記されていること(サンプルサイズの計算に必要)
- [ ] 期間が定義されていること
- [ ] 開始前に成功/失敗の基準が明確であること
統計的有意性計算ツール
必要なサンプルサイズ(バリアントごと):
n = (Z_alpha + Z_beta)^2 × 2 × p × (1-p) / MDE^2
ここで:
- Z_alpha = 1.96 (95%信頼度の場合)
- Z_beta = 0.84 (80%検出力の場合)
- p = ベースラインのコンバージョン率
- MDE = 最小検出可能効果(相対%)
簡易ルックアップ:
| ベースライン CVR | 5% MDE | 10% MDE | 20% MDE | 30% MDE |
|---|---|---|---|---|
| 1% | 612,000 | 153,000 | 38,300 | 17,000 |
| 2% | 302,400 | 75,600 | 18,900 | 8,400 |
| 5% | 116,800 | 29,200 | 7,300 | 3,200 |
| 10% | 55,200 | 13,800 | 3,450 | 1,530 |
| 20% | 24,600 | 6,150 | 1,540 | 680 |
バリアントごと、95%信頼度、80%検出力
テスト期間推定ツール
期間 = 必要なサンプルサイズ / バリアントごとの1日のトラフィック
最小期間:7日間(週ごとのパターンを捉える)
推奨最大期間:28日間(季節的な変動を避ける)
学習期間:Google 7-14日間、Meta 3-7日間、LinkedIn 7-14日間
必要な入力:
- 1日のインプレッション数またはクリック数
- バリアント数(2 = A/B、3+ = 多変量)
- ベースラインのコンバージョン率
- 望ましい最小検出可能効果
期間のクイック見積もり
| 1日のクリック数 | 2% CVR, 20% MDE | 5% CVR, 20% MDE | 10% CVR, 20% MDE |
|---|---|---|---|
| 100 | 189 日間 | 73 日間 | 35 日間 |
| 500 | 38 日間 | 15 日間 | 7 日間 |
| 1,000 | 19 日間 | 7 日間 | 4 日間* |
| 5,000 | 4 日間* | 2 日間* | 1 日間* |
*サンプルが十分に足りている場合でも、最低7日間を推奨
プラットフォーム固有のテスト設定
Meta Experiments
- 広告マネージャ > 実験タブを使用(手動での広告セットの複製ではない)
- 自動オーディエンス分割により、重複がないことを保証
- サポートされているテストタイプ:A/B(クリエイティブ、オーディエンス、配置)、ホールドアウト、ブランド調査
- Meta の Incremental Attribution (2025年4月) は、AI を活用したホールドアウトテストを提供し、真の因果関係を測定
- 予算:バリアント間で均等に分割。バリアントごとに最低 $100/日を推奨
- 期間:通常 7-14 日間。Meta は 95% の信頼度で勝者を自動的に決定
Google Experiments
- キャンペーン実験(カスタム実験)または広告バリエーション
- 既存のキャンペーンから実験を作成 > 実験タイプを選択
- トラフィック分割:最速の結果を得るには 50/50 を推奨
- サポートされているもの:入札戦略、広告コピー、ランディングページ、オーディエンス
- 指標:開始前に主要な指標(コンバージョン、CPA、ROAS)を選択
- 期間:14-30 日間を推奨。入札テストの場合は最低 2 週間
LinkedIn A/B Testing
- スポンサードコンテンツのキャンペーンマネージャに組み込まれている
- 単一の変数を変更して広告セットを複製
- ターゲット:自動ローテーションによる同じオーディエンスセグメント
- 最小予算:バリアントごとに $50/日
- 主要な指標:CTR(>0.44% ベンチマーク)、CPL、リードフォーム CVR(13% ベンチマーク)
- 期間:14-21 日間(LinkedIn の 1 日あたりのボリュームが少ないため、より長いテストが必要)
TikTok Split Testing
- TikTok 広告マネージャ > A/Bテストの作成 で利用可能
- テストタイプ:ターゲティング、入札、クリエイティブ
- 汚染を避けるためにオーディエンスを自動分割
- 最小 7 日間、推奨 14 日間
- 予算:広告グループごとに最低 $20/日
- クリエイティブテスト:フック(最初の 2-3 秒)を主要な変数として分離
- TikTok の拡張されたスプリットテストは、2025 年以降、Smart+ を介してモジュール式のテスト変数(ターゲティング、クリエイティブ、予算、配置)をサポート
テスト対象(優先順位)
高インパクト(最初にテスト)
- クリエイティブコンセプト(単なる色の変更ではなく、異なるメッセージングの角度)
- フック/最初の 3 秒(Meta、TikTok、YouTube での動画の冒頭)
- オファー構造(価格設定、割引タイプ、無料トライアル期間)
- ランディングページ(見出し、CTA、フォームの長さ)
- 入札戦略(tCPA vs tROAS vs コンバージョン数の最大化)
中インパクト
- オーディエンスターゲティング(インタレスト vs 類似 vs 広範)
- 広告フォーマット(静止画 vs 動画 vs カルーセル)
- CTA ボタン(詳細はこちら vs サインアップ vs 今すぐ購入)
- キャンペーン構造(CBO vs ABO、統合 vs セグメント化)
低インパクト(最後にテスト)
- 広告スケジュール(時間帯、曜日)
- デバイスターゲティング(モバイル vs デスクトップ)
- 軽微なコピーのバリエーション(コンセプトの変更なしに単語を置き換える)
避けるべき一般的なテストの誤り
- 一度に多くの変数をテストする(明確な勝者の特定ができない)
- テストを早期に終了する(統計的有意性の前に)
- 非典型的な期間中にテストする(祝日、ローンチ、インシデント)
- 等しくない期間を比較する
- 学習内容を文書化しない(組織的な知識を構築する)
- 大きな変更が必要な場合に小さな変更をテストする(最適化 vs 革新)
- 自動化されたプラットフォームでの学習期間を無視する
出力形式
## A/Bテスト計画
### 仮説
もし [変更] を行うならば
そうすれば [指標] は [方向] に [量] だけ変化するだろう
なぜならば [推論]
### テスト設計
| パラメータ | 値 |
|-----------|-------|
| プラットフォーム | [プラットフォーム] |
| テストタイプ | [A/B / 多変量] |
| 変数 | [変更されるもの]
(原文はここで切り詰められています) 📜 原文 SKILL.md(Claudeが読む英語/中国語)を展開
A/B Test Design & Experiment Planning
<!-- Created: 2026-04-13 | v1.5 --> <!-- Source: OpenClaudia/openclaudia-skills (ab-test-setup concept) -->
Process
- Understand what the user wants to test (creative, audience, bidding, landing page)
- Build structured hypothesis using the framework below
- Calculate required sample size and estimated duration
- Recommend platform-specific test setup
- Define success criteria and measurement plan
Hypothesis Framework
Every test must start with a structured hypothesis:
IF we [change/action]
THEN [metric] will [increase/decrease] by [estimated %]
BECAUSE [reasoning based on data or insight]
Example:
IF we replace polished product shots with UGC creator videos
THEN Meta CTR will increase by 25-40%
BECAUSE Andromeda prioritizes diverse creative formats and UGC consistently outperforms polished in 2025-2026 benchmarks
Hypothesis Quality Checklist
- [ ] Single variable being tested (isolate the change)
- [ ] Specific metric defined (not "performance")
- [ ] Estimated effect size stated (needed for sample size calculation)
- [ ] Timeframe defined
- [ ] Success/failure criteria clear before launch
Statistical Significance Calculator
Required Sample Size (per variant):
n = (Z_alpha + Z_beta)^2 × 2 × p × (1-p) / MDE^2
Where:
- Z_alpha = 1.96 (for 95% confidence)
- Z_beta = 0.84 (for 80% power)
- p = baseline conversion rate
- MDE = minimum detectable effect (relative %)
Simplified lookup:
| Baseline CVR | 5% MDE | 10% MDE | 20% MDE | 30% MDE |
|---|---|---|---|---|
| 1% | 612,000 | 153,000 | 38,300 | 17,000 |
| 2% | 302,400 | 75,600 | 18,900 | 8,400 |
| 5% | 116,800 | 29,200 | 7,300 | 3,200 |
| 10% | 55,200 | 13,800 | 3,450 | 1,530 |
| 20% | 24,600 | 6,150 | 1,540 | 680 |
Per variant, 95% confidence, 80% power
Test Duration Estimator
Duration = Required Sample Size / Daily Traffic per Variant
Minimum duration: 7 days (capture weekly patterns)
Maximum recommended: 28 days (avoid seasonal drift)
Learning phase: Google 7-14 days, Meta 3-7 days, LinkedIn 7-14 days
Inputs needed:
- Daily impressions or clicks
- Number of variants (2 = A/B, 3+ = multivariate)
- Baseline conversion rate
- Minimum detectable effect desired
Duration Quick Estimates
| Daily Clicks | 2% CVR, 20% MDE | 5% CVR, 20% MDE | 10% CVR, 20% MDE |
|---|---|---|---|
| 100 | 189 days | 73 days | 35 days |
| 500 | 38 days | 15 days | 7 days |
| 1,000 | 19 days | 7 days | 4 days* |
| 5,000 | 4 days* | 2 days* | 1 day* |
*Minimum 7 days recommended regardless of sample sufficiency
Platform-Specific Test Setup
Meta Experiments
- Use Ads Manager > Experiments tab (not manual ad set duplication)
- Automatic audience splitting ensures no overlap
- Supported test types: A/B (creative, audience, placement), Holdout, Brand Survey
- Meta's Incremental Attribution (April 2025) provides AI-powered holdout testing for measuring real causal impact
- Budget: split evenly across variants; minimum $100/day per variant recommended
- Duration: 7-14 days typical; Meta auto-determines winner at 95% confidence
Google Experiments
- Campaign Experiments (custom experiments) or Ad Variations
- Create experiment from existing campaign > select experiment type
- Traffic split: 50/50 recommended for fastest results
- Supported: bidding strategy, ad copy, landing page, audience
- Metrics: choose primary metric (conversions, CPA, ROAS) before launch
- Duration: 14-30 days recommended; minimum 2 weeks for bidding tests
LinkedIn A/B Testing
- Built into Campaign Manager for Sponsored Content
- Duplicate ad set with single variable change
- Target: same audience segment with automatic rotation
- Minimum budget: $50/day per variant
- Key metrics: CTR (>0.44% benchmark), CPL, Lead Form CVR (13% benchmark)
- Duration: 14-21 days (LinkedIn's smaller daily volumes require longer tests)
TikTok Split Testing
- Available in TikTok Ads Manager > Create A/B Test
- Test types: targeting, bidding, creative
- Auto-splits audience to avoid contamination
- Minimum 7 days, recommended 14 days
- Budget: minimum $20/day per ad group
- Creative tests: isolate hook (first 2-3 seconds) as the primary variable
- TikTok's enhanced split testing supports modular test variables (targeting, creative, budget, placement) via Smart+ since 2025
What to Test (Priority Order)
High Impact (test first)
- Creative concept (different messaging angles, not just color changes)
- Hook/first 3 seconds (video opening on Meta, TikTok, YouTube)
- Offer structure (pricing, discount type, free trial length)
- Landing page (headline, CTA, form length)
- Bidding strategy (tCPA vs tROAS vs Maximize Conversions)
Medium Impact
- Audience targeting (interest vs lookalike vs broad)
- Ad format (static vs video vs carousel)
- CTA button (Learn More vs Sign Up vs Shop Now)
- Campaign structure (CBO vs ABO, consolidated vs segmented)
Low Impact (test last)
- Ad scheduling (time of day, day of week)
- Device targeting (mobile vs desktop)
- Minor copy variations (word substitutions without concept change)
Common Testing Mistakes to Avoid
- Testing too many variables at once (no clear winner attribution)
- Ending tests too early (before statistical significance)
- Testing during atypical periods (holidays, launches, incidents)
- Comparing unequal time periods
- Not documenting learnings (build institutional knowledge)
- Testing small changes when big changes are needed (optimize vs innovate)
- Ignoring learning phase on automated platforms
Output Format
## A/B Test Plan
### Hypothesis
IF [change]
THEN [metric] will [direction] by [amount]
BECAUSE [reasoning]
### Test Design
| Parameter | Value |
|-----------|-------|
| Platform | [platform] |
| Test Type | [A/B / Multivariate] |
| Variable | [what's being changed] |
| Control | [current state] |
| Variant | [proposed change] |
| Primary Metric | [KPI] |
| Traffic Split | [50/50 / other] |
### Sample Size & Duration
| Metric | Value |
|--------|-------|
| Baseline CVR | [X%] |
| MDE | [X%] |
| Required Sample | [N per variant] |
| Daily Traffic | [N clicks/day] |
| Est. Duration | [X days] |
| Min Duration | 7 days |
### Success Criteria
- Winner declared at 95% confidence
- [Primary metric] improvement of [X%]+ sustained over [Y] days
- No negative impact on [secondary metric]
### Setup Instructions
[Platform-specific step-by-step]