jpskill.com
🛠️ 開発・MCP コミュニティ 🔴 エンジニア向け 👤 エンジニア・AI開発者

🛠️ Scviツール

scvi-tools

単一細胞の遺伝子データなどを高度に分析し

⏱ RAG構築 1週間 → 1日

📺 まず動画で見る(YouTube)

▶ 【衝撃】最強のAIエージェント「Claude Code」の最新機能・使い方・プログラミングをAIで効率化する超実践術を解説! ↗

※ jpskill.com 編集部が参考用に選んだ動画です。動画の内容と Skill の挙動は厳密には一致しないことがあります。

📜 元の英語説明(参考)

Deep generative models for single-cell omics. Use when you need probabilistic batch correction (scVI), transfer learning, differential expression with uncertainty, or multi-modal integration (TOTALVI, MultiVI). Best for advanced modeling, batch effects, multimodal data. For standard analysis pipelines use scanpy.

🇯🇵 日本人クリエイター向け解説

一言でいうと

単一細胞の遺伝子データなどを高度に分析し

※ jpskill.com 編集部が日本のビジネス現場向けに補足した解説です。Skill本体の挙動とは独立した参考情報です。

⚡ おすすめ: コマンド1行でインストール(60秒)

下記のコマンドをコピーしてターミナル(Mac/Linux)または PowerShell(Windows)に貼り付けてください。 ダウンロード → 解凍 → 配置まで全自動。

🍎 Mac / 🐧 Linux
mkdir -p ~/.claude/skills && cd ~/.claude/skills && curl -L -o scvi-tools.zip https://jpskill.com/download/4241.zip && unzip -o scvi-tools.zip && rm scvi-tools.zip
🪟 Windows (PowerShell)
$d = "$env:USERPROFILE\.claude\skills"; ni -Force -ItemType Directory $d | Out-Null; iwr https://jpskill.com/download/4241.zip -OutFile "$d\scvi-tools.zip"; Expand-Archive "$d\scvi-tools.zip" -DestinationPath $d -Force; ri "$d\scvi-tools.zip"

完了後、Claude Code を再起動 → 普通に「動画プロンプト作って」のように話しかけるだけで自動発動します。

💾 手動でダウンロードしたい(コマンドが難しい人向け)
  1. 1. 下の青いボタンを押して scvi-tools.zip をダウンロード
  2. 2. ZIPファイルをダブルクリックで解凍 → scvi-tools フォルダができる
  3. 3. そのフォルダを C:\Users\あなたの名前\.claude\skills\(Win)または ~/.claude/skills/(Mac)へ移動
  4. 4. Claude Code を再起動

⚠️ ダウンロード・利用は自己責任でお願いします。当サイトは内容・動作・安全性について責任を負いません。

🎯 このSkillでできること

下記の説明文を読むと、このSkillがあなたに何をしてくれるかが分かります。Claudeにこの分野の依頼をすると、自動で発動します。

📦 インストール方法 (3ステップ)

  1. 1. 上の「ダウンロード」ボタンを押して .skill ファイルを取得
  2. 2. ファイル名の拡張子を .skill から .zip に変えて展開(macは自動展開可)
  3. 3. 展開してできたフォルダを、ホームフォルダの .claude/skills/ に置く
    • · macOS / Linux: ~/.claude/skills/
    • · Windows: %USERPROFILE%\.claude\skills\

Claude Code を再起動すれば完了。「このSkillを使って…」と話しかけなくても、関連する依頼で自動的に呼び出されます。

詳しい使い方ガイドを見る →
最終更新
2026-05-17
取得日時
2026-05-18
同梱ファイル
9

💬 こう話しかけるだけ — サンプルプロンプト

  • Scvi Tools を使って、最小構成のサンプルコードを示して
  • Scvi Tools の主な使い方と注意点を教えて
  • Scvi Tools を既存プロジェクトに組み込む方法を教えて

これをClaude Code に貼るだけで、このSkillが自動発動します。

📖 Skill本文(日本語訳)

※ 原文(英語/中国語)を Gemini で日本語化したものです。Claude 自身は原文を読みます。誤訳がある場合は原文をご確認ください。

[Skill 名] scvi-tools

scvi-tools

概要

scvi-toolsは、シングルセルゲノミクスにおける確率モデルのための包括的なPythonフレームワークです。PyTorchとPyTorch Lightningを基盤として構築されており、多様なシングルセルデータモダリティを解析するための変分推論を用いた深層生成モデルを提供します。

このスキルを使用するタイミング

このスキルは、次のような場合に使用します。

  • シングルセルRNA-seqデータの解析(次元削減、バッチ補正、統合)
  • シングルセルATAC-seqまたはクロマチンアクセシビリティデータの操作
  • マルチモーダルデータ(CITE-seq、マルチオーム、ペア/アンペアデータセット)の統合
  • 空間トランスクリプトミクスデータ(デコンボリューション、空間マッピング)の解析
  • シングルセルデータに対する差次的発現解析の実行
  • 細胞型アノテーションまたは転移学習タスクの実施
  • 特殊なシングルセルモダリティ(メチル化、サイトメトリー、RNAベロシティ)の操作
  • シングルセル解析のためのカスタム確率モデルの構築

コア機能

scvi-toolsは、データモダリティ別に整理されたモデルを提供します。

1. シングルセルRNA-seq解析

発現解析、バッチ補正、統合のためのコアモデルです。詳細についてはreferences/models-scrna-seq.mdをご覧ください。

  • scVI: 教師なし次元削減とバッチ補正
  • scANVI: 半教師あり細胞型アノテーションと統合
  • AUTOZI: ゼロインフレーションの検出とモデリング
  • VeloVI: RNAベロシティ解析
  • contrastiveVI: 摂動効果の分離

2. クロマチンアクセシビリティ (ATAC-seq)

シングルセルクロマチンデータ解析のためのモデルです。詳細についてはreferences/models-atac-seq.mdをご覧ください。

  • PeakVI: ピークベースのATAC-seq解析と統合
  • PoissonVI: 定量的フラグメントカウントモデリング
  • scBasset: モチーフ解析を用いた深層学習アプローチ

3. マルチモーダル&マルチオミクス統合

複数のデータタイプの共同解析です。詳細についてはreferences/models-multimodal.mdをご覧ください。

  • totalVI: CITE-seqタンパク質とRNAの共同モデリング
  • MultiVI: ペアおよびアンペアマルチオミクス統合
  • MrVI: マルチ解像度クロスサンプル解析

4. 空間トランスクリプトミクス

空間的に分解されたトランスクリプトミクス解析です。詳細についてはreferences/models-spatial.mdをご覧ください。

  • DestVI: マルチ解像度空間デコンボリューション
  • Stereoscope: 細胞型デコンボリューション
  • Tangram: 空間マッピングと統合
  • scVIVA: 細胞-環境関係解析

5. 特殊なモダリティ

追加の特殊な解析ツールです。詳細についてはreferences/models-specialized.mdをご覧ください。

  • MethylVI/MethylANVI: シングルセルメチル化解析
  • CytoVI: フロー/マスサイトメトリーバッチ補正
  • Solo: ダブレット検出
  • CellAssign: マーカーベースの細胞型アノテーション

典型的なワークフロー

すべてのscvi-toolsモデルは、一貫したAPIパターンに従います。

# 1. データの読み込みと前処理 (AnnData形式)
import scvi
import scanpy as sc

adata = scvi.data.heart_cell_atlas_subsampled()
sc.pp.filter_genes(adata, min_counts=3)
sc.pp.highly_variable_genes(adata, n_top_genes=1200)

# 2. モデルへのデータ登録 (レイヤー、共変量を指定)
scvi.model.SCVI.setup_anndata(
    adata,
    layer="counts",  # 生のカウントを使用、ログ正規化されたものではない
    batch_key="batch",
    categorical_covariate_keys=["donor"],
    continuous_covariate_keys=["percent_mito"]
)

# 3. モデルの作成と学習
model = scvi.model.SCVI(adata)
model.train()

# 4. 潜在表現と正規化された値の抽出
latent = model.get_latent_representation()
normalized = model.get_normalized_expression(library_size=1e4)

# 5. ダウンストリーム解析のためにAnnDataに保存
adata.obsm["X_scVI"] = latent
adata.layers["scvi_normalized"] = normalized

# 6. scanpyを用いたダウンストリーム解析
sc.pp.neighbors(adata, use_rep="X_scVI")
sc.tl.umap(adata)
sc.tl.leiden(adata)

主要な設計原則:

  • 生のカウントが必要: モデルは最適なパフォーマンスのために非正規化されたカウントデータを期待します
  • 統一されたAPI: すべてのモデルで一貫したインターフェース(セットアップ → 学習 → 抽出)
  • AnnData中心: scanpyエコシステムとのシームレスな統合
  • GPUアクセラレーション: 利用可能なGPUの自動利用
  • バッチ補正: 共変量登録による技術的変動の処理

一般的な解析タスク

差次的発現

学習された生成モデルを用いた確率的DE解析です。

de_results = model.differential_expression(
    groupby="cell_type",
    group1="TypeA",
    group2="TypeB",
    mode="change",  # 複合仮説検定を使用
    delta=0.25      # 最小効果量閾値
)

詳細な手法と解釈についてはreferences/differential-expression.mdをご覧ください。

モデルの永続化

学習済みモデルの保存と読み込みです。

# モデルの保存
model.save("./model_directory", overwrite=True)

# モデルの読み込み
model = scvi.model.SCVI.load("./model_directory", adata=adata)

バッチ補正と統合

バッチまたは研究間でデータセットを統合します。

# バッチ情報の登録
scvi.model.SCVI.setup_anndata(adata, batch_key="study")

# モデルはバッチ補正された表現を自動的に学習します
model = scvi.model.SCVI(adata)
model.train()
latent = model.get_latent_representation()  # バッチ補正済み

理論的基盤

scvi-toolsは以下に基づいています。

  • 変分推論: スケーラブルなベイズ推論のための近似事後分布
  • 深層生成モデル: 複雑なデータ分布を学習するVAEアーキテクチャ
  • 償却推論: 細胞間で効率的な学習のための共有ニューラルネットワーク
  • 確率的モデリング: 原理に基づいた不確実性定量化と統計的検定

数学的フレームワークの詳細な背景についてはreferences/theoretical-foundations.mdをご覧ください。

追加リソース

  • ワークフロー: references/workflows.mdには、一般的なワークフロー、ベストプラクティス、ハイパーパラメータチューニング、GPU最適化が含まれています。
  • モデルリファレンス: references/ディレクトリ内の各モデルカテゴリの詳細なドキュメントです。
  • 公式ドキュメント: https://docs.scvi-tools.org/en/stable/
  • チュートリアル: https://docs.scvi

(原文がここで切り詰められています)

📜 原文 SKILL.md(Claudeが読む英語/中国語)を展開

scvi-tools

Overview

scvi-tools is a comprehensive Python framework for probabilistic models in single-cell genomics. Built on PyTorch and PyTorch Lightning, it provides deep generative models using variational inference for analyzing diverse single-cell data modalities.

When to Use This Skill

Use this skill when:

  • Analyzing single-cell RNA-seq data (dimensionality reduction, batch correction, integration)
  • Working with single-cell ATAC-seq or chromatin accessibility data
  • Integrating multimodal data (CITE-seq, multiome, paired/unpaired datasets)
  • Analyzing spatial transcriptomics data (deconvolution, spatial mapping)
  • Performing differential expression analysis on single-cell data
  • Conducting cell type annotation or transfer learning tasks
  • Working with specialized single-cell modalities (methylation, cytometry, RNA velocity)
  • Building custom probabilistic models for single-cell analysis

Core Capabilities

scvi-tools provides models organized by data modality:

1. Single-Cell RNA-seq Analysis

Core models for expression analysis, batch correction, and integration. See references/models-scrna-seq.md for:

  • scVI: Unsupervised dimensionality reduction and batch correction
  • scANVI: Semi-supervised cell type annotation and integration
  • AUTOZI: Zero-inflation detection and modeling
  • VeloVI: RNA velocity analysis
  • contrastiveVI: Perturbation effect isolation

2. Chromatin Accessibility (ATAC-seq)

Models for analyzing single-cell chromatin data. See references/models-atac-seq.md for:

  • PeakVI: Peak-based ATAC-seq analysis and integration
  • PoissonVI: Quantitative fragment count modeling
  • scBasset: Deep learning approach with motif analysis

3. Multimodal & Multi-omics Integration

Joint analysis of multiple data types. See references/models-multimodal.md for:

  • totalVI: CITE-seq protein and RNA joint modeling
  • MultiVI: Paired and unpaired multi-omic integration
  • MrVI: Multi-resolution cross-sample analysis

4. Spatial Transcriptomics

Spatially-resolved transcriptomics analysis. See references/models-spatial.md for:

  • DestVI: Multi-resolution spatial deconvolution
  • Stereoscope: Cell type deconvolution
  • Tangram: Spatial mapping and integration
  • scVIVA: Cell-environment relationship analysis

5. Specialized Modalities

Additional specialized analysis tools. See references/models-specialized.md for:

  • MethylVI/MethylANVI: Single-cell methylation analysis
  • CytoVI: Flow/mass cytometry batch correction
  • Solo: Doublet detection
  • CellAssign: Marker-based cell type annotation

Typical Workflow

All scvi-tools models follow a consistent API pattern:

# 1. Load and preprocess data (AnnData format)
import scvi
import scanpy as sc

adata = scvi.data.heart_cell_atlas_subsampled()
sc.pp.filter_genes(adata, min_counts=3)
sc.pp.highly_variable_genes(adata, n_top_genes=1200)

# 2. Register data with model (specify layers, covariates)
scvi.model.SCVI.setup_anndata(
    adata,
    layer="counts",  # Use raw counts, not log-normalized
    batch_key="batch",
    categorical_covariate_keys=["donor"],
    continuous_covariate_keys=["percent_mito"]
)

# 3. Create and train model
model = scvi.model.SCVI(adata)
model.train()

# 4. Extract latent representations and normalized values
latent = model.get_latent_representation()
normalized = model.get_normalized_expression(library_size=1e4)

# 5. Store in AnnData for downstream analysis
adata.obsm["X_scVI"] = latent
adata.layers["scvi_normalized"] = normalized

# 6. Downstream analysis with scanpy
sc.pp.neighbors(adata, use_rep="X_scVI")
sc.tl.umap(adata)
sc.tl.leiden(adata)

Key Design Principles:

  • Raw counts required: Models expect unnormalized count data for optimal performance
  • Unified API: Consistent interface across all models (setup → train → extract)
  • AnnData-centric: Seamless integration with the scanpy ecosystem
  • GPU acceleration: Automatic utilization of available GPUs
  • Batch correction: Handle technical variation through covariate registration

Common Analysis Tasks

Differential Expression

Probabilistic DE analysis using the learned generative models:

de_results = model.differential_expression(
    groupby="cell_type",
    group1="TypeA",
    group2="TypeB",
    mode="change",  # Use composite hypothesis testing
    delta=0.25      # Minimum effect size threshold
)

See references/differential-expression.md for detailed methodology and interpretation.

Model Persistence

Save and load trained models:

# Save model
model.save("./model_directory", overwrite=True)

# Load model
model = scvi.model.SCVI.load("./model_directory", adata=adata)

Batch Correction and Integration

Integrate datasets across batches or studies:

# Register batch information
scvi.model.SCVI.setup_anndata(adata, batch_key="study")

# Model automatically learns batch-corrected representations
model = scvi.model.SCVI(adata)
model.train()
latent = model.get_latent_representation()  # Batch-corrected

Theoretical Foundations

scvi-tools is built on:

  • Variational inference: Approximate posterior distributions for scalable Bayesian inference
  • Deep generative models: VAE architectures that learn complex data distributions
  • Amortized inference: Shared neural networks for efficient learning across cells
  • Probabilistic modeling: Principled uncertainty quantification and statistical testing

See references/theoretical-foundations.md for detailed background on the mathematical framework.

Additional Resources

Installation

uv pip install scvi-tools
# For GPU support
uv pip install scvi-tools[cuda]

Best Practices

  1. Use raw counts: Always provide unnormalized count data to models
  2. Filter genes: Remove low-count genes before analysis (e.g., min_counts=3)
  3. Register covariates: Include known technical factors (batch, donor, etc.) in setup_anndata
  4. Feature selection: Use highly variable genes for improved performance
  5. Model saving: Always save trained models to avoid retraining
  6. GPU usage: Enable GPU acceleration for large datasets (accelerator="gpu")
  7. Scanpy integration: Store outputs in AnnData objects for downstream analysis

同梱ファイル

※ ZIPに含まれるファイル一覧。`SKILL.md` 本体に加え、参考資料・サンプル・スクリプトが入っている場合があります。