vision-analysis
画像ファイルやURLが共有された際、または画像に関する分析、説明、テキスト抽出などの要求があった際に、画像の内容を理解し、説明や情報抽出、オブジェクト検出などを行うSkill。
📜 元の英語説明(参考)
Analyze, describe, and extract information from images using the MiniMax vision MCP tool. Use when: user shares an image file path or URL (any message containing .jpg, .jpeg, .png, .gif, .webp, .bmp, or .svg file extension) or uses any of these words/phrases near an image: "analyze", "analyse", "describe", "explain", "understand", "look at", "review", "extract text", "OCR", "what is in", "what's in", "read this image", "see this image", "tell me about", "explain this", "interpret this", in connection with an image, screenshot, diagram, chart, mockup, wireframe, or photo. Also triggers for: UI mockup review, wireframe analysis, design critique, data extraction from charts, object detection, person/animal/activity identification. Triggers: any message with an image file extension (jpg, jpeg, png, gif, webp, bmp, svg), or any request to analyze/describ/understand/review/extract text from an image, screenshot, diagram, chart, photo, mockup, or wireframe.
🇯🇵 日本人クリエイター向け解説
画像ファイルやURLが共有された際、または画像に関する分析、説明、テキスト抽出などの要求があった際に、画像の内容を理解し、説明や情報抽出、オブジェクト検出などを行うSkill。
※ jpskill.com 編集部が日本のビジネス現場向けに補足した解説です。Skill本体の挙動とは独立した参考情報です。
下記のコマンドをコピーしてターミナル(Mac/Linux)または PowerShell(Windows)に貼り付けてください。 ダウンロード → 解凍 → 配置まで全自動。
mkdir -p ~/.claude/skills && cd ~/.claude/skills && curl -L -o vision-analysis.zip https://jpskill.com/download/19712.zip && unzip -o vision-analysis.zip && rm vision-analysis.zip
$d = "$env:USERPROFILE\.claude\skills"; ni -Force -ItemType Directory $d | Out-Null; iwr https://jpskill.com/download/19712.zip -OutFile "$d\vision-analysis.zip"; Expand-Archive "$d\vision-analysis.zip" -DestinationPath $d -Force; ri "$d\vision-analysis.zip"
完了後、Claude Code を再起動 → 普通に「動画プロンプト作って」のように話しかけるだけで自動発動します。
💾 手動でダウンロードしたい(コマンドが難しい人向け)
- 1. 下の青いボタンを押して
vision-analysis.zipをダウンロード - 2. ZIPファイルをダブルクリックで解凍 →
vision-analysisフォルダができる - 3. そのフォルダを
C:\Users\あなたの名前\.claude\skills\(Win)または~/.claude/skills/(Mac)へ移動 - 4. Claude Code を再起動
⚠️ ダウンロード・利用は自己責任でお願いします。当サイトは内容・動作・安全性について責任を負いません。
🎯 このSkillでできること
下記の説明文を読むと、このSkillがあなたに何をしてくれるかが分かります。Claudeにこの分野の依頼をすると、自動で発動します。
📦 インストール方法 (3ステップ)
- 1. 上の「ダウンロード」ボタンを押して .skill ファイルを取得
- 2. ファイル名の拡張子を .skill から .zip に変えて展開(macは自動展開可)
- 3. 展開してできたフォルダを、ホームフォルダの
.claude/skills/に置く- · macOS / Linux:
~/.claude/skills/ - · Windows:
%USERPROFILE%\.claude\skills\
- · macOS / Linux:
Claude Code を再起動すれば完了。「このSkillを使って…」と話しかけなくても、関連する依頼で自動的に呼び出されます。
詳しい使い方ガイドを見る →- 最終更新
- 2026-05-18
- 取得日時
- 2026-05-18
- 同梱ファイル
- 1
📖 Skill本文(日本語訳)
※ 原文(英語/中国語)を Gemini で日本語化したものです。Claude 自身は原文を読みます。誤訳がある場合は原文をご確認ください。
ビジョン分析
MiniMax Token Planで利用可能なMiniMax MiniMax_understand_image MCPツールを使用して画像を分析します。
前提条件
- 有効な
MINIMAX_API_KEYを含むMiniMax Token Planのサブスクリプション - MiniMax MCPが設定済みであること(
MiniMax_understand_imageツールが利用可能であること)
MCPツールが設定されていない場合
ステップ1: エージェントは以下のURLからセットアップ手順を取得する必要があります。 https://platform.minimaxi.com/docs/token-plan/mcp-guide
ステップ2: ユーザーの環境(OpenCode、Cursor、Claude Codeなど)を検出し、必要な正確なコマンドを出力します。一般的な例を以下に示します。
OpenCode — ~/.config/opencode/opencode.jsonまたはpackage.jsonに追加します。
{
"mcp": {
"MiniMax": {
"type": "local",
"command": ["uvx", "minimax-coding-plan-mcp", "-y"],
"environment": {
"MINIMAX_API_KEY": "YOUR_TOKEN_PLAN_KEY",
"MINIMAX_API_HOST": "https://api.minimaxi.com"
},
"enabled": true
}
}
}
Claude Code:
claude mcp add -s user MiniMax --env MINIMAX_API_KEY=your-key --env MINIMAX_API_HOST=https://api.minimaxi.com -- uvx minimax-coding-plan-mcp -y
Cursor — MCP設定に追加します。
{
"mcpServers": {
"MiniMax": {
"command": "uvx",
"args": ["minimax-coding-plan-mcp"],
"env": {
"MINIMAX_API_KEY": "your-key",
"MINIMAX_API_HOST": "https://api.minimaxi.com"
}
}
}
}
ステップ3: 設定後、ユーザーにアプリを再起動し、/mcpで確認するよう伝えます。
重要: ユーザーがMiniMax Token Planのサブスクリプションを持っていない場合、understand_imageツールにはサブスクリプションが必要であることを伝えてください。無料または他のティアのAPIキーでは使用できません。
分析モード
| モード | 使用する状況 | プロンプト戦略 |
|---|---|---|
describe |
一般的な画像理解 | 詳細な説明を要求 |
ocr |
スクリーンショット、ドキュメントからのテキスト抽出 | すべてのテキストをそのまま抽出するよう要求 |
ui-review |
UIモックアップ、ワイヤーフレーム、デザインファイル | 提案を含むデザイン批評を要求 |
chart-data |
チャート、グラフ、データ視覚化 | データポイントと傾向の抽出を要求 |
object-detect |
オブジェクト、人物、アクティビティの識別 | すべての要素をリストアップし、位置を特定するよう要求 |
ワークフロー
ステップ1: 画像の自動検出
このスキルは、メッセージに以下の拡張子を持つ画像ファイルパスまたはURLが含まれている場合に自動的にトリガーされます。
.jpg, .jpeg, .png, .gif, .webp, .bmp, .svg
メッセージから画像パスを抽出します。
ステップ2: 分析モードを選択し、MCPツールを呼び出す
MiniMax_understand_imageツールをモード固有のプロンプトで使用します。
describe:
この画像の詳細な説明を提供してください。主な被写体、設定/背景、
色/スタイル、表示されているテキスト、注目すべきオブジェクト、および全体的な構図を含めてください。
ocr:
この画像に表示されているすべてのテキストをそのまま抽出してください。構造と書式設定
(ヘッダー、リスト、列)を保持してください。テキストが見つからない場合は、その旨を伝えてください。
ui-review:
あなたはUI/UXデザインレビュー担当者です。このインターフェースのモックアップまたはデザインを分析してください。以下を提供してください。
(1) 強み — うまくいっている点、(2) 問題点 — 使いやすさやデザインの問題、
(3) 改善のための具体的で実行可能な提案。建設的かつ詳細に記述してください。
chart-data:
このチャートまたはグラフからすべてのデータを抽出してください。以下をリストアップしてください。チャートのタイトル、軸ラベル、
読み取り可能な場合はすべてのデータポイント/系列と値、および傾向の簡単な要約。
object-detect:
識別できるすべての異なるオブジェクト、人物、およびアクティビティをリストアップしてください。それぞれについて、
それが何であるか、および画像内のおおよその位置を記述してください。
ステップ3: 結果の提示
分析結果を明確に返します。describeの場合は、読みやすい散文を使用します。ocrの場合は、構造を保持します。ui-reviewの場合は、構造化された批評形式を使用します。
出力形式の例
describeモードの場合:
## 画像の説明
[画像の内容の詳細な説明...]
ocrモードの場合:
## 抽出されたテキスト
[画像から保持されたテキスト構造]
ui-reviewモードの場合:
## UIデザインレビュー
### 強み
- ...
### 問題点
- ...
### 提案
- ...
注意事項
- 最大20MBまでの画像(JPEG、PNG、GIF、WebP)をサポートしています。
- MiniMax MCPがファイルアクセスで設定されている場合、ローカルファイルパスも機能します。
MiniMax_understand_imageツールはminimax-coding-plan-mcpパッケージによって提供されます。
📜 原文 SKILL.md(Claudeが読む英語/中国語)を展開
Vision Analysis
Analyze images using the MiniMax MiniMax_understand_image MCP tool available in the MiniMax Token Plan.
Prerequisites
- MiniMax Token Plan subscription with valid
MINIMAX_API_KEY - MiniMax MCP configured (
MiniMax_understand_imagetool available)
If MCP tool is not configured
Step 1: The agent should fetch setup instructions from: https://platform.minimaxi.com/docs/token-plan/mcp-guide
Step 2: Detect the user's environment (OpenCode, Cursor, Claude Code, etc.) and output the exact commands needed. Common examples:
OpenCode — add to ~/.config/opencode/opencode.json or package.json:
{
"mcp": {
"MiniMax": {
"type": "local",
"command": ["uvx", "minimax-coding-plan-mcp", "-y"],
"environment": {
"MINIMAX_API_KEY": "YOUR_TOKEN_PLAN_KEY",
"MINIMAX_API_HOST": "https://api.minimaxi.com"
},
"enabled": true
}
}
}
Claude Code:
claude mcp add -s user MiniMax --env MINIMAX_API_KEY=your-key --env MINIMAX_API_HOST=https://api.minimaxi.com -- uvx minimax-coding-plan-mcp -y
Cursor — add to MCP settings:
{
"mcpServers": {
"MiniMax": {
"command": "uvx",
"args": ["minimax-coding-plan-mcp"],
"env": {
"MINIMAX_API_KEY": "your-key",
"MINIMAX_API_HOST": "https://api.minimaxi.com"
}
}
}
}
Step 3: After configuration, tell the user to restart their app and verify with /mcp.
Important: If the user does not have a MiniMax Token Plan subscription, inform them that the understand_image tool requires one — it cannot be used with free or other tier API keys.
Analysis Modes
| Mode | When to use | Prompt strategy |
|---|---|---|
describe |
General image understanding | Ask for detailed description |
ocr |
Text extraction from screenshots, documents | Ask to extract all text verbatim |
ui-review |
UI mockups, wireframes, design files | Ask for design critique with suggestions |
chart-data |
Charts, graphs, data visualizations | Ask to extract data points and trends |
object-detect |
Identify objects, people, activities | Ask to list and locate all elements |
Workflow
Step 1: Auto-detect image
The skill triggers automatically when a message contains an image file path or URL with extensions:
.jpg, .jpeg, .png, .gif, .webp, .bmp, .svg
Extract the image path from the message.
Step 2: Select analysis mode and call MCP tool
Use the MiniMax_understand_image tool with a mode-specific prompt:
describe:
Provide a detailed description of this image. Include: main subject, setting/background,
colors/style, any text visible, notable objects, and overall composition.
ocr:
Extract all text visible in this image verbatim. Preserve structure and formatting
(headers, lists, columns). If no text is found, say so.
ui-review:
You are a UI/UX design reviewer. Analyze this interface mockup or design. Provide:
(1) Strengths — what works well, (2) Issues — usability or design problems,
(3) Specific, actionable suggestions for improvement. Be constructive and detailed.
chart-data:
Extract all data from this chart or graph. List: chart title, axis labels, all
data points/series with values if readable, and a brief summary of the trend.
object-detect:
List all distinct objects, people, and activities you can identify. For each,
describe what it is and its approximate location in the image.
Step 3: Present results
Return the analysis clearly. For describe, use readable prose. For ocr, preserve structure. For ui-review, use a structured critique format.
Output Format Example
For describe mode:
## Image Description
[Detailed description of the image contents...]
For ocr mode:
## Extracted Text
[Preserved text structure from the image]
For ui-review mode:
## UI Design Review
### Strengths
- ...
### Issues
- ...
### Suggestions
- ...
Notes
- Images up to 20MB supported (JPEG, PNG, GIF, WebP)
- Local file paths work if MiniMax MCP is configured with file access
- The
MiniMax_understand_imagetool is provided by theminimax-coding-plan-mcppackage