jpskill.com
🛠️ 開発・MCP コミュニティ

deploy-model

Unified Azure OpenAI model deployment skill with intelligent intent-based routing. Handles quick preset deployments, fully customized deployments (version/SKU/capacity/RAI policy), and capacity discovery across regions and projects. USE FOR: deploy model, deploy gpt, create deployment, model deployment, deploy openai model, set up model, provision model, find capacity, check model availability, where can I deploy, best region for model, capacity analysis. DO NOT USE FOR: listing existing deployments (use foundry_models_deployments_list MCP tool), deleting deployments, agent creation (use agent/create), project creation (use project/create).

⚡ おすすめ: コマンド1行でインストール(60秒)

下記のコマンドをコピーしてターミナル(Mac/Linux)または PowerShell(Windows)に貼り付けてください。 ダウンロード → 解凍 → 配置まで全自動。

🍎 Mac / 🐧 Linux
mkdir -p ~/.claude/skills && cd ~/.claude/skills && curl -L -o deploy-model.zip https://jpskill.com/download/19681.zip && unzip -o deploy-model.zip && rm deploy-model.zip
🪟 Windows (PowerShell)
$d = "$env:USERPROFILE\.claude\skills"; ni -Force -ItemType Directory $d | Out-Null; iwr https://jpskill.com/download/19681.zip -OutFile "$d\deploy-model.zip"; Expand-Archive "$d\deploy-model.zip" -DestinationPath $d -Force; ri "$d\deploy-model.zip"

完了後、Claude Code を再起動 → 普通に「動画プロンプト作って」のように話しかけるだけで自動発動します。

💾 手動でダウンロードしたい(コマンドが難しい人向け)
  1. 1. 下の青いボタンを押して deploy-model.zip をダウンロード
  2. 2. ZIPファイルをダブルクリックで解凍 → deploy-model フォルダができる
  3. 3. そのフォルダを C:\Users\あなたの名前\.claude\skills\(Win)または ~/.claude/skills/(Mac)へ移動
  4. 4. Claude Code を再起動

⚠️ ダウンロード・利用は自己責任でお願いします。当サイトは内容・動作・安全性について責任を負いません。

🎯 このSkillでできること

下記の説明文を読むと、このSkillがあなたに何をしてくれるかが分かります。Claudeにこの分野の依頼をすると、自動で発動します。

📦 インストール方法 (3ステップ)

  1. 1. 上の「ダウンロード」ボタンを押して .skill ファイルを取得
  2. 2. ファイル名の拡張子を .skill から .zip に変えて展開(macは自動展開可)
  3. 3. 展開してできたフォルダを、ホームフォルダの .claude/skills/ に置く
    • · macOS / Linux: ~/.claude/skills/
    • · Windows: %USERPROFILE%\.claude\skills\

Claude Code を再起動すれば完了。「このSkillを使って…」と話しかけなくても、関連する依頼で自動的に呼び出されます。

詳しい使い方ガイドを見る →
最終更新
2026-05-18
取得日時
2026-05-18
同梱ファイル
3

📖 Skill本文(日本語訳)

※ 原文(英語/中国語)を Gemini で日本語化したものです。Claude 自身は原文を読みます。誤訳がある場合は原文をご確認ください。

[スキル名] deploy-model

モデルのデプロイ

すべての Azure OpenAI モデルデプロイワークフローの統合されたエントリーポイントです。ユーザーの意図を分析し、適切なデプロイモードにルーティングします。

クイックリファレンス

モード 使用する状況 サブスキル
プリセット 迅速なデプロイ、カスタマイズ不要 preset/SKILL.md
カスタマイズ 完全な制御: バージョン、SKU、容量、RAIポリシー customize/SKILL.md
容量検出 特定の容量でデプロイできる場所を見つける capacity/SKILL.md

意図検出

ユーザーのプロンプトを分析し、正しいモードにルーティングします。

User Prompt
    │
    ├─ Simple deployment (no modifiers)
    │  "deploy gpt-4o", "set up a model"
    │  └─> PRESET mode
    │
    ├─ Customization keywords present
    │  "custom settings", "choose version", "select SKU",
    │  "set capacity to X", "configure content filter",
    │  "PTU deployment", "with specific quota"
    │  └─> CUSTOMIZE mode
    │
    ├─ Capacity/availability query
    │  "find where I can deploy", "check capacity",
    │  "which region has X capacity", "best region for 10K TPM",
    │  "where is this model available"
    │  └─> CAPACITY DISCOVERY mode
    │
    └─ Ambiguous (has capacity target + deploy intent)
       "deploy gpt-4o with 10K capacity to best region"
       └─> CAPACITY DISCOVERY first → then PRESET or CUSTOMIZE

ルーティングルール

プロンプト内のシグナル ルーティング先 理由
モデル名のみ、オプションなし プリセット ユーザーは迅速なデプロイを希望しています
"custom", "configure", "choose", "select" カスタマイズ ユーザーは制御を希望しています
"find", "check", "where", "which region", "available" 容量 ユーザーは検出を希望しています
特定の容量数値 + "best region" 容量 → プリセット 検出してから迅速にデプロイします
特定の容量数値 + "custom" キーワード 容量 → カスタマイズ 検出してからオプション付きでデプロイします
"PTU", "provisioned throughput" カスタマイズ PTUにはSKU選択が必要です
"optimal region", "best region" (容量ターゲットなし) プリセット リージョン最適化はプリセットの専門分野です

マルチモードの連結

一部のプロンプトでは、2つのモードを連続して実行する必要があります。

パターン: 容量 → デプロイ ユーザーが容量要件を指定し、かつデプロイを希望する場合:

  1. 容量検出を実行して、十分なクォータを持つリージョン/プロジェクトを見つけます。
  2. ユーザーに結果を提示します。
  3. クイックデフォルトでデプロイしますか、それとも設定をカスタマイズしますか?」と尋ねます。
  4. 回答に基づいてプリセットまたはカスタマイズにルーティングします。

💡 ヒント: ユーザーがどのモードを希望しているか不明な場合は、プリセット(迅速なデプロイ)をデフォルトとしてください。カスタマイズを希望するユーザーは、通常、「custom」、「configure」、または「with specific settings」のような明示的なキーワードを使用します。

プロジェクト選択 (すべてのモード)

デプロイの前に、どのプロジェクトにデプロイするかを解決します。これはすべてのモード(プリセット、カスタマイズ、容量検出後)に適用されます。

解決順序

  1. PROJECT_RESOURCE_ID 環境変数をチェック — 設定されている場合、それをデフォルトとして使用します。
  2. ユーザープロンプトをチェック — ユーザーが特定のプロジェクトまたはリージョンを指定した場合、それを使用します。
  3. どちらでもない場合 — ユーザーのプロジェクトをクエリし、現在のプロジェクトを提案します。

確認ステップ (必須)

デプロイする前に、常にターゲットを確認してください。 ユーザーに何が使用されるかを示し、変更する機会を与えてください。

Deploying to:
  Project:  <project-name>
  Region:   <region>
  Resource: <resource-group>

Is this correct? Or choose a different project:
  1. ✅ Yes, deploy here (default)
  2. 📋 Show me other projects in this region
  3. 🌍 Choose a different region

ユーザーがオプション2を選択した場合、そのリージョン内の上位5つのプロジェクトを表示します。

Projects in <region>:
  1. project-alpha (rg-alpha)
  2. project-beta (rg-beta)
  3. project-gamma (rg-gamma)
  ...

⚠️ ユーザーにどのプロジェクトが使用されるかを示さずにデプロイしないでください。 これにより、誤ったリソースへの意図しないデプロイを防ぎます。

デプロイ前検証 (すべてのモード)

デプロイオプション(SKU、容量)を提示する前に、常に以下の両方を検証してください。

  1. モデルがSKUをサポートしているか — モデルカタログをクエリして、選択されたモデル+バージョンがターゲットSKUをサポートしていることを確認します。

    az cognitiveservices model list --location <region> --subscription <sub-id> -o json

    モデルでフィルタリングし、.model.skus[].name を抽出してサポートされているSKUを取得します。

  2. サブスクリプションに利用可能なクォータがあるか — ユーザーのサブスクリプションに、SKU+モデルの組み合わせに対して未割り当てのクォータがあることを確認します。

    az cognitiveservices usage list --location <region> --subscription <sub-id> -o json

    使用状況名パターン OpenAI.<SKU>.<model-name> (例: OpenAI.GlobalStandard.gpt-4o) で一致させます。available = limit - currentValue を計算します。

⚠️ 警告: 両方のチェックを通過したオプションのみを提示してください。ハードコードされたSKUリストを表示しないでください — 常に動的にクエリしてください。利用可能なクォータが0のSKUは、選択可能なオプションではなく、❌ 情報項目として表示されるべきです。

💡 クォータ管理: クォータ増加リクエスト、使用状況の監視、クォータエラーのトラブルシューティングについては、そのガイダンスをインラインで重複させるのではなく、クォータスキルに委ねてください。

前提条件

すべてのデプロイモードには以下が必要です。

  • Azure CLIがインストールされ、認証されていること (az login)
  • デプロイ権限を持つアクティブなAzureサブスクリプション
  • Azure AI FoundryプロジェクトリソースID (またはエージェントが PROJECT_RESOURCE_ID 環境変数経由で検出を支援します)

サブスキル

  • preset/SKILL.md — 最適なリージョンへの迅速なデプロイと適切なデフォルト設定
  • customize/SKILL.md — 完全な構成制御を備えた対話型ガイド付きフロー
  • capacity/SKILL.md — リージョンおよびプロジェクト全体で利用可能な容量を検出します
📜 原文 SKILL.md(Claudeが読む英語/中国語)を展開

Deploy Model

Unified entry point for all Azure OpenAI model deployment workflows. Analyzes user intent and routes to the appropriate deployment mode.

Quick Reference

Mode When to Use Sub-Skill
Preset Quick deployment, no customization needed preset/SKILL.md
Customize Full control: version, SKU, capacity, RAI policy customize/SKILL.md
Capacity Discovery Find where you can deploy with specific capacity capacity/SKILL.md

Intent Detection

Analyze the user's prompt and route to the correct mode:

User Prompt
    │
    ├─ Simple deployment (no modifiers)
    │  "deploy gpt-4o", "set up a model"
    │  └─> PRESET mode
    │
    ├─ Customization keywords present
    │  "custom settings", "choose version", "select SKU",
    │  "set capacity to X", "configure content filter",
    │  "PTU deployment", "with specific quota"
    │  └─> CUSTOMIZE mode
    │
    ├─ Capacity/availability query
    │  "find where I can deploy", "check capacity",
    │  "which region has X capacity", "best region for 10K TPM",
    │  "where is this model available"
    │  └─> CAPACITY DISCOVERY mode
    │
    └─ Ambiguous (has capacity target + deploy intent)
       "deploy gpt-4o with 10K capacity to best region"
       └─> CAPACITY DISCOVERY first → then PRESET or CUSTOMIZE

Routing Rules

Signal in Prompt Route To Reason
Just model name, no options Preset User wants quick deployment
"custom", "configure", "choose", "select" Customize User wants control
"find", "check", "where", "which region", "available" Capacity User wants discovery
Specific capacity number + "best region" Capacity → Preset Discover then deploy quickly
Specific capacity number + "custom" keywords Capacity → Customize Discover then deploy with options
"PTU", "provisioned throughput" Customize PTU requires SKU selection
"optimal region", "best region" (no capacity target) Preset Region optimization is preset's specialty

Multi-Mode Chaining

Some prompts require two modes in sequence:

Pattern: Capacity → Deploy When a user specifies a capacity requirement AND wants deployment:

  1. Run Capacity Discovery to find regions/projects with sufficient quota
  2. Present findings to user
  3. Ask: "Would you like to deploy with quick defaults or customize settings?"
  4. Route to Preset or Customize based on answer

💡 Tip: If unsure which mode the user wants, default to Preset (quick deployment). Users who want customization will typically use explicit keywords like "custom", "configure", or "with specific settings".

Project Selection (All Modes)

Before any deployment, resolve which project to deploy to. This applies to all modes (preset, customize, and after capacity discovery).

Resolution Order

  1. Check PROJECT_RESOURCE_ID env var — if set, use it as the default
  2. Check user prompt — if user named a specific project or region, use that
  3. If neither — query the user's projects and suggest the current one

Confirmation Step (Required)

Always confirm the target before deploying. Show the user what will be used and give them a chance to change it:

Deploying to:
  Project:  <project-name>
  Region:   <region>
  Resource: <resource-group>

Is this correct? Or choose a different project:
  1. ✅ Yes, deploy here (default)
  2. 📋 Show me other projects in this region
  3. 🌍 Choose a different region

If user picks option 2, show top 5 projects in that region:

Projects in <region>:
  1. project-alpha (rg-alpha)
  2. project-beta (rg-beta)
  3. project-gamma (rg-gamma)
  ...

⚠️ Never deploy without showing the user which project will be used. This prevents accidental deployments to the wrong resource.

Pre-Deployment Validation (All Modes)

Before presenting any deployment options (SKU, capacity), always validate both of these:

  1. Model supports the SKU — query the model catalog to confirm the selected model+version supports the target SKU:

    az cognitiveservices model list --location <region> --subscription <sub-id> -o json

    Filter for the model, extract .model.skus[].name to get supported SKUs.

  2. Subscription has available quota — check that the user's subscription has unallocated quota for the SKU+model combination:

    az cognitiveservices usage list --location <region> --subscription <sub-id> -o json

    Match by usage name pattern OpenAI.<SKU>.<model-name> (e.g., OpenAI.GlobalStandard.gpt-4o). Compute available = limit - currentValue.

⚠️ Warning: Only present options that pass both checks. Do NOT show hardcoded SKU lists — always query dynamically. SKUs with 0 available quota should be shown as ❌ informational items, not selectable options.

💡 Quota management: For quota increase requests, usage monitoring, and troubleshooting quota errors, defer to the quota skill instead of duplicating that guidance inline.

Prerequisites

All deployment modes require:

  • Azure CLI installed and authenticated (az login)
  • Active Azure subscription with deployment permissions
  • Azure AI Foundry project resource ID (or agent will help discover it via PROJECT_RESOURCE_ID env var)

Sub-Skills

同梱ファイル

※ ZIPに含まれるファイル一覧。`SKILL.md` 本体に加え、参考資料・サンプル・スクリプトが入っている場合があります。