jpskill.com
📦 その他 コミュニティ

buddy-sings

ユーザーがClaudeの相棒(buddy)に歌を歌ってほしい時に、その要望を理解し、言語を問わず歌や音楽に関連する表現を認識して、歌うように指示するSkill。

📜 元の英語説明(参考)

Use when user wants their Claude Code pet (/buddy) to sing a song. Triggers on any request that combines the concept of their Claude Code buddy, pet, or companion with singing or music. Supports multilingual triggers — match equivalent phrases in any language.

🇯🇵 日本人クリエイター向け解説

一言でいうと

ユーザーがClaudeの相棒(buddy)に歌を歌ってほしい時に、その要望を理解し、言語を問わず歌や音楽に関連する表現を認識して、歌うように指示するSkill。

※ jpskill.com 編集部が日本のビジネス現場向けに補足した解説です。Skill本体の挙動とは独立した参考情報です。

⚡ おすすめ: コマンド1行でインストール(60秒)

下記のコマンドをコピーしてターミナル(Mac/Linux)または PowerShell(Windows)に貼り付けてください。 ダウンロード → 解凍 → 配置まで全自動。

🍎 Mac / 🐧 Linux
mkdir -p ~/.claude/skills && cd ~/.claude/skills && curl -L -o buddy-sings.zip https://jpskill.com/download/19691.zip && unzip -o buddy-sings.zip && rm buddy-sings.zip
🪟 Windows (PowerShell)
$d = "$env:USERPROFILE\.claude\skills"; ni -Force -ItemType Directory $d | Out-Null; iwr https://jpskill.com/download/19691.zip -OutFile "$d\buddy-sings.zip"; Expand-Archive "$d\buddy-sings.zip" -DestinationPath $d -Force; ri "$d\buddy-sings.zip"

完了後、Claude Code を再起動 → 普通に「動画プロンプト作って」のように話しかけるだけで自動発動します。

💾 手動でダウンロードしたい(コマンドが難しい人向け)
  1. 1. 下の青いボタンを押して buddy-sings.zip をダウンロード
  2. 2. ZIPファイルをダブルクリックで解凍 → buddy-sings フォルダができる
  3. 3. そのフォルダを C:\Users\あなたの名前\.claude\skills\(Win)または ~/.claude/skills/(Mac)へ移動
  4. 4. Claude Code を再起動

⚠️ ダウンロード・利用は自己責任でお願いします。当サイトは内容・動作・安全性について責任を負いません。

🎯 このSkillでできること

下記の説明文を読むと、このSkillがあなたに何をしてくれるかが分かります。Claudeにこの分野の依頼をすると、自動で発動します。

📦 インストール方法 (3ステップ)

  1. 1. 上の「ダウンロード」ボタンを押して .skill ファイルを取得
  2. 2. ファイル名の拡張子を .skill から .zip に変えて展開(macは自動展開可)
  3. 3. 展開してできたフォルダを、ホームフォルダの .claude/skills/ に置く
    • · macOS / Linux: ~/.claude/skills/
    • · Windows: %USERPROFILE%\.claude\skills\

Claude Code を再起動すれば完了。「このSkillを使って…」と話しかけなくても、関連する依頼で自動的に呼び出されます。

詳しい使い方ガイドを見る →
最終更新
2026-05-18
取得日時
2026-05-18
同梱ファイル
1

📖 Skill本文(日本語訳)

※ 原文(英語/中国語)を Gemini で日本語化したものです。Claude 自身は原文を読みます。誤訳がある場合は原文をご確認ください。

[Skill 名] buddy-sings

バディが歌う — あなたの Claude Code ペットに歌わせましょう

あなたの Claude Code ペットを歌手に変身させます。各ペットは、その名前と個性に基づいて独自の歌声を得ます。同じペットは常に同じ声で歌います。

前提条件

  • mmx CLI (音楽生成に必要です):

    インストール:

    npm install -g mmx-cli

    認証 (初回のみ):

    mmx auth login --api-key <your-minimax-api-key>

    API キーは MiniMax Platform から取得してください。

  • オーディオプレイヤー (再生用 — 以下のいずれか1つ以上):

    • mpv (推奨 — インタラクティブな操作: スペース = 一時停止、q = 終了)
    • ffplay (FFmpeg に含まれます)
    • afplay (macOS に内蔵されています)

ワークフローの概要

ペットの確認 → 歌声の構築 → コンテキストの収集 → 音楽の生成 → 再生とフィードバック

言語とインタラクション

ユーザーの最初のメッセージから言語を検出します。セッション全体を通して、同じ言語で応答してください。以下の例はすべて英語ですが、他の言語で応答する際は自然に翻訳してください。

ユーザー向けテキストのローカライズルール:

  • ペット情報、声の説明、歌詞のプレビュー、プロンプトのプレビュー、再生情報、フィードバックプロンプトを含む、ユーザーに表示されるすべてのテキストは、ユーザーの言語に完全に翻訳されなければなりません。
  • モデルに送信されるAPI プロンプトは、最高の生成品質のために常に英語で記述されるべきです。ただし、ユーザーにプロンプトをプレビューする際は、生の英語プロンプトではなく、ユーザーの言語でローカライズされた説明を表示してください。英語のプロンプトは内部的な実装の詳細であり、ユーザーが見る必要はありません。
  • 以下のテンプレートは参照として英語で書かれています。実行時には、すべてのラベルとメッセージをユーザーの検出された言語に翻訳してください。

ペットはデフォルトでユーザーの言語で歌います。歌う言語は、別途言語タグを追加するのではなく、歌声の説明に自然に組み込んでください(例:「日本語で歌う」や「中国語(北京語)で歌う」)。ユーザーが歌詞に別の言語を明示的に要求した場合は、その要求を尊重してください。


ステップ 1: ペットの確認

~/.claude.json を読み込み、companion フィールドを探します。

コンパニオンが見つからないか、フィールドが空の場合、ユーザーに次のように伝えます。

You don't have a pet yet! Type /buddy to adopt one, then come back to let it sing.

ここで停止し、ユーザーがペットを飼うのを待ちます。ペットなしでは先に進まないでください。

コンパニオンが存在する場合、そのプロフィールを抽出します。

  • name — ペットの名前
  • personality — ペットの性格説明

ペットをユーザーに提示します。

Found your pet!
   Name: <name>
   Personality: <personality>

ステップ 2: 歌声の構築

ペットの名前性格のテキストに基づいて、独自の歌声を創造的にデザインします。テンプレートの検索は行わず、性格を自由に解釈してください。

性格を声に解釈する方法

性格テキストを読み、歌声の属性を作成します。

  • 音色 (Timbre): この性格はどのような音に聞こえますか?例:「口数が少ない」→低く、暖かく、思慮深い;「エネルギッシュ」→明るく、パンチが効いている;「ミステリアス」→息遣いが感じられ、暗い;「伝説のぽっちゃり」→厚く、暖かく、心地よい
  • 歌唱スタイル (Singing style): どのように歌を届けますか?例:「口数が少ない」→まばらに、劇的な間を置く;「遊び心がある」→弾むように、リズミカルに;「詩的」→流れるように、レガートで
  • ムード (Mood): どのような感情的なトーンが合いますか?例:「チル」→リラックスした、ゆったりとした;「激しい」→強烈な、力強い

歌う言語を自然に組み込みながら、歌唱スタイルを英語で記述する prompt_fragment を構築します。例:

Vocal: warm low female voice singing in Mandarin Chinese with cozy thick timbre,
sparse minimalist delivery with dramatic pauses giving each word weight, relaxed
laid-back mood.

声のキャッシュ

歌声はキャッシュされる必要があり、これによりペットは常に同じ声で歌います。

  • キャッシュファイル: ~/.claude/skills/buddy-sings/voices/<name>.json
  • キャッシュ形式:
    {
      "name": "Moth",
      "personality": "A legendary chonk of few words.",
      "prompt_fragment": "Vocal: warm low female voice singing in Mandarin Chinese...",
      "cached_at": "2026-04-07T19:52:15"
    }

初回: キャッシュが存在しない場合 → 性格を解釈 → キャッシュファイルに保存します。

以降の呼び出し: キャッシュを読み込み → 保存された prompt_fragment を直接使用します。再解釈は行いません — 一貫性が重要です。

キャッシュの無効化: ~/.claude.jsonpersonality がキャッシュされているものと異なる場合、ペットが変更されたとみなし、新しいキャッシュを再生成して保存します。

手動での再生成: ユーザーが「声を変更して」または「声を再生成して」と言った場合: キャッシュファイルを削除し、最初から再解釈します。

ユーザーに声を提示する

<name> のユニークな声:

Timbre: <timbre description>
Style: <style description>
Mood: <mood description>

<name> に何を歌わせるか選びましょう!

ステップ 3: 意図を理解し、コンテキストを収集する

常にモードメニューを提示しないでください。代わりに、ユーザーのリクエストを分析して必要なコンテキストを判断し、自動的に収集します。

自動コンテキスト検出

ユーザーのリクエストが個人的なコンテキストを暗示する場合、尋ねることなく関連情報を自動的にスキャンします。トリガーは次のとおりです。

  • 時間ベースの参照: 「今日」、「今週」、「最近」、「昨日」→その期間に何が起こったかについて、現在の会話履歴とメモリファイルをスキャンします。
  • 個人的な参照: 「私の仕事」、「私の日」、「私がしたこと」→ユーザーの活動についてメモリと会話をスキャンします。
  • 関係性の参照: 「私たちの物語」、「私たちが一緒に行ったこと」→ユーザーとペット/Claude の共有体験についてメモリをスキャンします。

コンテキスト収集 (自動、モードゲートなし)

コンテキストが必要な場合、次のソースを順にスキャンします。

  1. 現在の会話コンテキスト: この Claude Code セッションでユーザーが何をしてきたかを確認します — 編集されたファイル、実行されたコマンド、議論されたトピック。「今日」のようなリクエストにとって最も豊富な情報源です。

  2. メモリファイル: 関連するメモリをスキャンします。

    find ~/.claude/projects/*/memory/ -name "*.md" 2>/dev/null | head -20

    また、チェ

(原文がここで切り詰められています)

📜 原文 SKILL.md(Claudeが読む英語/中国語)を展開

Buddy Sings — Let Your Claude Code Pet Sing

Turn your Claude Code pet into a singer. Each pet gets a unique vocal identity based on its name and personality — the same pet always sounds the same.

Prerequisites

  • mmx CLI (required for music generation):

    Install:

    npm install -g mmx-cli

    Authenticate (first time only):

    mmx auth login --api-key <your-minimax-api-key>

    Get your API key from MiniMax Platform.

  • Audio player (for playback — at least one of):

    • mpv (recommended — interactive controls: space = pause, q = quit)
    • ffplay (from FFmpeg)
    • afplay (macOS built-in)

Workflow Overview

Check pet → Build vocal identity → Gather context → Generate music → Play & feedback

Language & Interaction

Detect the user's language from their first message. Respond in the same language throughout the entire session. All examples below are in English — translate them naturally when responding in other languages.

User-facing text localization rule:

  • ALL text shown to the user — including pet info, voice description, lyrics preview, prompt preview, playback info, and feedback prompts — MUST be fully translated into the user's language.
  • The API prompt sent to the model should always be written in English for best generation quality. However, when previewing the prompt to the user, show a localized description in the user's language instead of the raw English prompt. The English prompt is an internal implementation detail — the user does not need to see it.
  • The templates below are written in English as reference. At runtime, translate every label and message into the user's detected language.

The pet sings in the user's language by default. Embed the singing language naturally in the vocal description (e.g., "singing in Japanese" or "singing in Mandarin Chinese") rather than appending a separate language tag. If the user explicitly requests a different language for the lyrics, honor that request.


Step 1: Check for Pet

Read ~/.claude.json and look for the companion field.

If no companion is found or the field is empty, tell the user:

You don't have a pet yet! Type /buddy to adopt one, then come back to let it sing.

Stop here and wait for the user to adopt a pet. Do not proceed without a pet.

If a companion exists, extract its profile:

  • name — the pet's name
  • personality — the pet's personality description

Present the pet to the user:

Found your pet!
   Name: <name>
   Personality: <personality>

Step 2: Build Vocal Identity

Based on the pet's name and personality text, creatively design a unique vocal identity. No template lookups — interpret the personality freely.

How to interpret personality into voice

Read the personality text and craft vocal attributes:

  • Timbre: What does this personality sound like? e.g., "few words" → low, warm, deliberate; "energetic" → bright, punchy; "mysterious" → breathy, dark; "legendary chonk" → thick, warm, cozy
  • Singing style: How would they deliver a song? e.g., "of few words" → sparse, dramatic pauses; "playful" → bouncy, rhythmic; "poetic" → flowing, legato
  • Mood: What emotional tone fits? e.g., "chill" → relaxed, laid-back; "fierce" → intense, powerful

Construct a prompt_fragment that describes the vocal style in English, embedding the singing language naturally. For example:

Vocal: warm low female voice singing in Mandarin Chinese with cozy thick timbre,
sparse minimalist delivery with dramatic pauses giving each word weight, relaxed
laid-back mood.

Voice caching

The vocal identity must be cached so the pet always sounds the same.

  • Cache file: ~/.claude/skills/buddy-sings/voices/<name>.json
  • Cache format:
    {
      "name": "Moth",
      "personality": "A legendary chonk of few words.",
      "prompt_fragment": "Vocal: warm low female voice singing in Mandarin Chinese...",
      "cached_at": "2026-04-07T19:52:15"
    }

First time: No cache exists → interpret personality → save to cache file.

Subsequent calls: Read cache → use the saved prompt_fragment directly. Do NOT re-interpret — consistency matters.

Cache invalidation: If the personality in ~/.claude.json differs from what's cached, the pet has changed — regenerate and save a new cache.

Manual regeneration: If the user says "change the voice" or "regenerate voice": delete the cache file and re-interpret from scratch.

Present the voice to the user

<name>'s unique voice:

Timbre: <timbre description>
Style: <style description>
Mood: <mood description>

Let's pick what <name> should sing about!

Step 3: Understand Intent & Gather Context

Do NOT always present a mode menu. Instead, analyze the user's request to determine what context is needed, and auto-gather it.

Auto-context detection

When the user's request implies personal context, automatically scan for relevant information without asking. Triggers include:

  • Time-based references: "today", "this week", "recently", "yesterday" → scan current conversation history and memory files for what happened in that period
  • Personal references: "my work", "my day", "what I did" → scan memory and conversation for the user's activities
  • Relationship references: "our story", "what we did together" → scan memory for shared experiences between user and pet/Claude

Context gathering (auto, not mode-gated)

When context is needed, scan these sources in order:

  1. Current conversation context: Look at what the user has been doing in this Claude Code session — files edited, commands run, topics discussed. This is the richest source for "today" type requests.

  2. Memory files: Scan for relevant memories:

    find ~/.claude/projects/*/memory/ -name "*.md" 2>/dev/null | head -20

    Also check ~/.claude/memory/ if it exists. Read found files and extract themes relevant to the user's request.

  3. Git history (if in a repo): For work-related songs, check recent commits:

    git log --oneline --since="today" 2>/dev/null | head -10

Use gathered context to enrich the lyrics prompt — make the song personal and specific to what actually happened, not generic.

When NO context is needed

If the user's request is a clear standalone scene (e.g., "sing a rainy day song", "sing a lullaby"), skip context gathering and proceed directly to music generation.

When context is ambiguous

Only ask for clarification when you genuinely can't determine what the user wants. Don't present a mode menu — ask a specific question:

What should <name> sing about?

For example:
  - "Today's work" — I'll check what you've been up to
  - "My pet waiting by the window for me to come home"
  - Or let me pick a random theme?

Fallback to random

If context gathering finds nothing useful (no memory files, no conversation history, no git log), fall back to random theme generation based on the pet's personality:

  • Quiet/reserved personality → midnight lullaby, gentle sunset, quiet morning
  • Energetic personality → party jam, adventure song, victory march
  • Mysterious personality → moonlit serenade, secret whisper, dream journey

Tell the user what theme was picked.


Step 4: Generate Music

Combine the vocal identity with the chosen theme.

  1. Construct the full prompt: The prompt has two parts that MUST both be present:

    Part A — Vocal identity (MUST come first): Always start the prompt with the cached prompt_fragment. This is the most important part — it defines who is singing. Place it at the beginning of the prompt so the API prioritizes it.

    Part B — Genre/style/mood tags: Choose tags that match the theme, NOT a default set. Vary the genre deliberately based on what the song is about.

    Write prompts as vivid English sentences, not comma-separated tags. Follow this pattern: A [mood] [genre] song, featuring [vocal description], about [narrative/theme], [atmosphere], [key instruments and production]. Describe vocals as a character ("sultry baritone with jazz inflections"), not just a gender. Include a scene or vibe to anchor the generation.

    Genre matching guidelines — pick a genre that fits the theme's energy:

    Theme energy Suggested genres Avoid
    Encouragement / motivation / cheer Indie rock, synth-pop, funk, rap Indie folk, healing
    Daily life / warmth / companionship Mandopop, city pop, bossa nova Same as last time
    Missing someone / waiting Folk, R&B, lo-fi Rock, EDM
    Humor / roasting / complaining Funk, rap, ska, electro-pop Classical, ballad
    Late night / quiet Ambient, piano piece, lo-fi, neoclassical Upbeat, EDM
    Celebration / achievement EDM, future bass, funk, K-pop Slow tempo, melancholy
    Work routine City pop, synth-pop, lo-fi hip-hop, indie rock Same genre every time

    Anti-monotony rule: NEVER use the same genre combination twice in a row. Before constructing the prompt, recall what genre was used in the previous generation (if any in this session) and pick something different.

    Prompt structure — write as vivid English sentences, not comma-separated tags:

    <vocal prompt_fragment>. A <genre> song with <mood> mood, featuring <instruments>,
    at a <tempo> tempo, evoking <scene>.

    Diverse examples:

    # Encouragement for the workday
    A deep warm androgynous voice with cozy delivery. An energetic synth-pop track
    with a fiery, uplifting mood, driven by pulsing synthesizers and electronic drums
    at a fast tempo, capturing the rush of a morning commute.
    
    # Waiting for the owner to come home
    A deep warm androgynous voice with cozy delivery. A warm city pop song with sweet,
    tender feelings, featuring electric piano and groovy bass at a mid-tempo pace,
    set on a sunny afternoon windowsill waiting for someone to come home.
    
    # Complaining about overtime
    A deep warm androgynous voice with cozy delivery. A playful funk track with a
    humorous, laid-back vibe, featuring slap bass and brass at a groovy mid-tempo,
    capturing the absurdity of working late in a dim office.
    
    # Late-night companionship
    A deep warm androgynous voice with cozy delivery. A calm lo-fi hip-hop piece with
    a healing, dreamy atmosphere, featuring sampled piano and soft electronic drums
    at a slow tempo, evoking a quiet late-night desk with warm lamp light.
  2. Generate lyrics: Use --lyrics-optimizer to auto-generate lyrics, or write lyrics yourself when you need to control the perspective.

    Important — perspective & personality-driven lyrics:

    The pet is the singer, so lyrics MUST be written from the pet's first-person perspective ("I" = the pet, "you" = the owner/user). The pet is singing TO the owner. For example:

    • "I sit by the door waiting for you to come home" (pet's perspective)
    • "Wake up now, my dear human" (pet singing to owner)
    • NOT "I rub my sleepy eyes" (owner's perspective — wrong)
    • NOT "Then you woke up, my little Moth" (owner talking about pet — wrong)

    The pet's personality should shape the lyrics' tone and word choice:

    • "of few words" → short, impactful lines, minimal filler
    • "playful" → rhyming, bouncy phrasing, fun wordplay
    • "poetic" → metaphor-rich, flowing imagery
    • "fierce" → direct, powerful declarations

    The pet's name may appear in the lyrics (e.g., in a chorus hook) but the narrative voice is always the pet speaking/singing.

    When perspective matters: Write the lyrics yourself and pass via --lyrics. When perspective is not critical: Use --lyrics-optimizer for convenience.

  3. Preview (MUST show full content): Before generating, show the user the complete lyrics and full prompt — no abbreviation, no ..., no summary. This is part of the fun — the user wants to read and enjoy the lyrics before hearing them sung.

    The API prompt is always constructed in English (for best generation quality). When responding in a non-English language, show a localized description of the prompt in the user's language for readability. The English prompt is an internal implementation detail — do not show it to the user. Translate all labels (Singer, Theme, Description, Confirm, etc.) into the user's language.

    Template (English reference — localize all labels at runtime):

    About to generate:
    Singer: <name>
    Theme: <theme>
    
    Lyrics:
    [verse]
    <full verse lyrics here>
    
    [chorus]
    <full chorus lyrics here>
    
    ... (show ALL sections in full)
    
    Description: <localized description of the song style and mood>
    
    Confirm? (press enter to confirm, or tell me what to change)

    Never truncate or abbreviate the lyrics or prompt in the preview. The user should see exactly what will be sent to the API.

  4. Call music generation:

    With auto-generated lyrics (perspective not critical):

    mmx music generate \
      --prompt "<full combined prompt>" \
      --lyrics-optimizer \
      --out ~/Music/minimax-gen/<name>_sings_<YYYYMMDD_HHMMSS>.mp3 \
      --quiet --non-interactive

    With self-written lyrics (perspective-controlled):

    mmx music generate \
      --prompt "<full combined prompt>" \
      --lyrics "<lyrics with correct pet perspective>" \
      --out ~/Music/minimax-gen/<name>_sings_<YYYYMMDD_HHMMSS>.mp3 \
      --quiet --non-interactive

Step 5: Play & Feedback

Cross-platform playback

Detect the available audio player and play the generated file:

if command -v mpv >/dev/null 2>&1; then
  mpv --no-video ~/Music/minimax-gen/<filename>.mp3
elif command -v ffplay >/dev/null 2>&1; then
  ffplay -nodisp -autoexit ~/Music/minimax-gen/<filename>.mp3
elif command -v afplay >/dev/null 2>&1; then
  afplay ~/Music/minimax-gen/<filename>.mp3
else
  echo "No audio player found. Your song is saved at: ~/Music/minimax-gen/<filename>.mp3"
fi

After starting playback, tell the user the file is playing and where it's saved. Do NOT show playback controls (e.g. keyboard shortcuts) — they don't work in this environment since the player runs in the background.

If no player is found, show the file path and suggest installing mpv.

Feedback

After playback, ask for feedback (localize all text):

How was <name>'s performance?

1. Amazing! Keep it!
2. Try a different theme / style
3. Fine-tune the lyrics and regenerate
4. Try another random one

Edge Cases

Situation Action
No ~/.claude.json Tell user to run /buddy first
Companion field is empty Same — guide to /buddy
mmx CLI not installed Print: "You need to install mmx CLI: npm install -g mmx-cli && mmx auth login"
No audio player found Show file path and suggest installing mpv
No memory files found Suggest a custom theme or random mode
User wants to change the pet's voice Delete cache, re-interpret personality
User wants a specific genre Let them override — append their genre to the prompt

Notes

  • The vocal identity is based on name + personality only. No species/rarity template mapping.
  • Voice is cached and consistent across sessions. Same pet = same voice.
  • Lyrics should always be original — never reproduce copyrighted lyrics.
  • The pet's personality shapes both the voice (how they sound) and the lyrics (what they say and how they say it).
  • All generated files go to ~/Music/minimax-gen/ with the pet name in the filename.