nextflow-development
Run nf-core bioinformatics pipelines (rnaseq, sarek, atacseq) on sequencing data. Use when analyzing RNA-seq, WGS/WES, or ATAC-seq data—either local FASTQs or public datasets from GEO/SRA. Triggers on nf-core, Nextflow, FASTQ analysis, variant calling, gene expression, differential expression, GEO reanalysis, GSE/GSM/SRR accessions, or samplesheet creation.
下記のコマンドをコピーしてターミナル(Mac/Linux)または PowerShell(Windows)に貼り付けてください。 ダウンロード → 解凍 → 配置まで全自動。
mkdir -p ~/.claude/skills && cd ~/.claude/skills && curl -L -o nextflow-development.zip https://jpskill.com/download/22570.zip && unzip -o nextflow-development.zip && rm nextflow-development.zip
$d = "$env:USERPROFILE\.claude\skills"; ni -Force -ItemType Directory $d | Out-Null; iwr https://jpskill.com/download/22570.zip -OutFile "$d\nextflow-development.zip"; Expand-Archive "$d\nextflow-development.zip" -DestinationPath $d -Force; ri "$d\nextflow-development.zip"
完了後、Claude Code を再起動 → 普通に「動画プロンプト作って」のように話しかけるだけで自動発動します。
💾 手動でダウンロードしたい(コマンドが難しい人向け)
- 1. 下の青いボタンを押して
nextflow-development.zipをダウンロード - 2. ZIPファイルをダブルクリックで解凍 →
nextflow-developmentフォルダができる - 3. そのフォルダを
C:\Users\あなたの名前\.claude\skills\(Win)または~/.claude/skills/(Mac)へ移動 - 4. Claude Code を再起動
⚠️ ダウンロード・利用は自己責任でお願いします。当サイトは内容・動作・安全性について責任を負いません。
🎯 このSkillでできること
下記の説明文を読むと、このSkillがあなたに何をしてくれるかが分かります。Claudeにこの分野の依頼をすると、自動で発動します。
📦 インストール方法 (3ステップ)
- 1. 上の「ダウンロード」ボタンを押して .skill ファイルを取得
- 2. ファイル名の拡張子を .skill から .zip に変えて展開(macは自動展開可)
- 3. 展開してできたフォルダを、ホームフォルダの
.claude/skills/に置く- · macOS / Linux:
~/.claude/skills/ - · Windows:
%USERPROFILE%\.claude\skills\
- · macOS / Linux:
Claude Code を再起動すれば完了。「このSkillを使って…」と話しかけなくても、関連する依頼で自動的に呼び出されます。
詳しい使い方ガイドを見る →- 最終更新
- 2026-05-18
- 取得日時
- 2026-05-18
- 同梱ファイル
- 22
📖 Skill本文(日本語訳)
※ 原文(英語/中国語)を Gemini で日本語化したものです。Claude 自身は原文を読みます。誤訳がある場合は原文をご確認ください。
[Skill 名] nextflow-development
nf-core パイプラインのデプロイ
ローカルまたは公開されているシーケンスデータで nf-core バイオインフォマティクスパイプラインを実行します。
対象ユーザー: 専門的なバイオインフォマティクス訓練を受けていないベンチ科学者や研究者で、大規模なオミクス解析(差次的発現解析、バリアントコール、クロマチンアクセシビリティ解析など)を実行する必要がある方。
ワークフローチェックリスト
- [ ] ステップ0: データの取得(GEO/SRAからの場合)
- [ ] ステップ1: 環境チェック(必須)
- [ ] ステップ2: パイプラインの選択(ユーザーと確認)
- [ ] ステップ3: テストプロファイルの実行(必須)
- [ ] ステップ4: サンプルシートの作成
- [ ] ステップ5: 設定と実行(ユーザーとゲノムを確認)
- [ ] ステップ6: 出力の検証
ステップ0: データの取得(GEO/SRAのみ)
ユーザーがローカルのFASTQファイルを持っている場合は、このステップをスキップしてください。
公開データセットの場合、まずGEO/SRAから取得します。完全なワークフローについては、references/geo-sra-acquisition.md を参照してください。
クイックスタート:
# 1. 研究情報を取得
python scripts/sra_geo_fetch.py info GSE110004
# 2. ダウンロード(インタラクティブモード)
python scripts/sra_geo_fetch.py download GSE110004 -o ./fastq -i
# 3. サンプルシートを生成
python scripts/sra_geo_fetch.py samplesheet GSE110004 --fastq-dir ./fastq -o samplesheet.csv
決定ポイント: 研究情報の取得後、ユーザーと以下を確認してください。
- ダウンロードするサンプルサブセット(複数のデータタイプがある場合)
- 推奨されるゲノムとパイプライン
その後、ステップ1に進みます。
ステップ1: 環境チェック
最初に実行してください。環境がパスしないとパイプラインは失敗します。
python scripts/check_environment.py
すべての重要なチェックがパスする必要があります。いずれかが失敗した場合は、修正手順を提供してください。
Dockerの問題
| 問題 | 修正 |
|---|---|
| 未インストール | https://docs.docker.com/get-docker/ からインストール |
| 権限拒否 | sudo usermod -aG docker $USER の後、再ログイン |
| デーモンが実行されていない | sudo systemctl start docker |
Nextflowの問題
| 問題 | 修正 |
|---|---|
| 未インストール | curl -s https://get.nextflow.io \| bash && mv nextflow ~/bin/ |
| バージョン < 23.04 | nextflow self-update |
Javaの問題
| 問題 | 修正 |
|---|---|
| 未インストール / < 11 | sudo apt install openjdk-11-jdk |
すべてのチェックがパスするまで先に進まないでください。 HPC/Singularityについては、references/troubleshooting.md を参照してください。
ステップ2: パイプラインの選択
決定ポイント: 進む前にユーザーと確認してください。
| データタイプ | パイプライン | バージョン | 目標 |
|---|---|---|---|
| RNA-seq | rnaseq |
3.22.2 | 遺伝子発現 |
| WGS/WES | sarek |
3.7.1 | バリアントコール |
| ATAC-seq | atacseq |
2.1.2 | クロマチンアクセシビリティ |
データからの自動検出:
python scripts/detect_data_type.py /path/to/data
パイプライン固有の詳細については、以下を参照してください。
ステップ3: テストプロファイルの実行
少量のデータで環境を検証します。実際のデータを使用する前に、必ずパスする必要があります。
nextflow run nf-core/<pipeline> -r <version> -profile test,docker --outdir test_output
| パイプライン | コマンド |
|---|---|
| rnaseq | nextflow run nf-core/rnaseq -r 3.22.2 -profile test,docker --outdir test_rnaseq |
| sarek | nextflow run nf-core/sarek -r 3.7.1 -profile test,docker --outdir test_sarek |
| atacseq | nextflow run nf-core/atacseq -r 2.1.2 -profile test,docker --outdir test_atacseq |
検証:
ls test_output/multiqc/multiqc_report.html
grep "Pipeline completed successfully" .nextflow.log
テストが失敗した場合は、references/troubleshooting.md を参照してください。
ステップ4: サンプルシートの作成
自動生成
python scripts/generate_samplesheet.py /path/to/data <pipeline> -o samplesheet.csv
このスクリプトは以下を行います。
- FASTQ/BAM/CRAMファイルを発見します
- R1/R2リードをペアリングします
- サンプルメタデータを推測します
- 書き込み前に検証します
sarekの場合: 自動検出されない場合、スクリプトは腫瘍/正常の状態を尋ねます。
既存のサンプルシートの検証
python scripts/generate_samplesheet.py --validate samplesheet.csv <pipeline>
サンプルシートの形式
rnaseq:
sample,fastq_1,fastq_2,strandedness
SAMPLE1,/abs/path/R1.fq.gz,/abs/path/R2.fq.gz,auto
sarek:
patient,sample,lane,fastq_1,fastq_2,status
patient1,tumor,L001,/abs/path/tumor_R1.fq.gz,/abs/path/tumor_R2.fq.gz,1
patient1,normal,L001,/abs/path/normal_R1.fq.gz,/abs/path/normal_R2.fq.gz,0
atacseq:
sample,fastq_1,fastq_2,replicate
CONTROL,/abs/path/ctrl_R1.fq.gz,/abs/path/ctrl_R2.fq.gz,1
ステップ5: 設定と実行
5a. ゲノムの利用可能性の確認
python scripts/manage_genomes.py check <genome>
# インストールされていない場合:
python scripts/manage_genomes.py download <genome>
一般的なゲノム: GRCh38 (ヒト), GRCh37 (レガシー), GRCm39 (マウス), R64-1-1 (酵母), BDGP6 (ハエ)
5b. 決定ポイント
決定ポイント: ユーザーと以下を確認してください。
- ゲノム: どの参照を使用するか
- パイプライン固有のオプション:
- rnaseq: アライナー (star_salmonを推奨、低メモリの場合はhisat2)
- sarek: ツール (生殖細胞系にはhaplotypecaller、体細胞にはmutect2)
- atacseq: read_length (50, 75, 100, または 150)
5c. パイプラインの実行
nextflow run nf-core/<pipeline> \
-r <version> \
-profile docker \
--input samplesheet.csv \
--outdir results \
--genome <genome> \
-resume
主要なフラグ:
-r: バージョンを固定-profile docker: Dockerを使用(HPCの場合はsingularity)--genome: iGenomesキー-resume: チェックポイントから続行
リソース制限(必要な場合):
--max_cpus 8 --max_memory '32.GB' --max_time '24.h'
ステップ6: 出力の検証
完了の確認
ls results/multiqc/multiqc_report.html
grep "Pipeline completed successfully" .nextflow.log
パイプラインごとの主要な出力
rnaseq:
results/star_salmon/salmon.merged.gene_counts.tsv- 遺伝子カウント- `resu
📜 原文 SKILL.md(Claudeが読む英語/中国語)を展開
nf-core Pipeline Deployment
Run nf-core bioinformatics pipelines on local or public sequencing data.
Target users: Bench scientists and researchers without specialized bioinformatics training who need to run large-scale omics analyses—differential expression, variant calling, or chromatin accessibility analysis.
Workflow Checklist
- [ ] Step 0: Acquire data (if from GEO/SRA)
- [ ] Step 1: Environment check (MUST pass)
- [ ] Step 2: Select pipeline (confirm with user)
- [ ] Step 3: Run test profile (MUST pass)
- [ ] Step 4: Create samplesheet
- [ ] Step 5: Configure & run (confirm genome with user)
- [ ] Step 6: Verify outputs
Step 0: Acquire Data (GEO/SRA Only)
Skip this step if user has local FASTQ files.
For public datasets, fetch from GEO/SRA first. See references/geo-sra-acquisition.md for the full workflow.
Quick start:
# 1. Get study info
python scripts/sra_geo_fetch.py info GSE110004
# 2. Download (interactive mode)
python scripts/sra_geo_fetch.py download GSE110004 -o ./fastq -i
# 3. Generate samplesheet
python scripts/sra_geo_fetch.py samplesheet GSE110004 --fastq-dir ./fastq -o samplesheet.csv
DECISION POINT: After fetching study info, confirm with user:
- Which sample subset to download (if multiple data types)
- Suggested genome and pipeline
Then continue to Step 1.
Step 1: Environment Check
Run first. Pipeline will fail without passing environment.
python scripts/check_environment.py
All critical checks must pass. If any fail, provide fix instructions:
Docker issues
| Problem | Fix |
|---|---|
| Not installed | Install from https://docs.docker.com/get-docker/ |
| Permission denied | sudo usermod -aG docker $USER then re-login |
| Daemon not running | sudo systemctl start docker |
Nextflow issues
| Problem | Fix |
|---|---|
| Not installed | curl -s https://get.nextflow.io \| bash && mv nextflow ~/bin/ |
| Version < 23.04 | nextflow self-update |
Java issues
| Problem | Fix |
|---|---|
| Not installed / < 11 | sudo apt install openjdk-11-jdk |
Do not proceed until all checks pass. For HPC/Singularity, see references/troubleshooting.md.
Step 2: Select Pipeline
DECISION POINT: Confirm with user before proceeding.
| Data Type | Pipeline | Version | Goal |
|---|---|---|---|
| RNA-seq | rnaseq |
3.22.2 | Gene expression |
| WGS/WES | sarek |
3.7.1 | Variant calling |
| ATAC-seq | atacseq |
2.1.2 | Chromatin accessibility |
Auto-detect from data:
python scripts/detect_data_type.py /path/to/data
For pipeline-specific details:
Step 3: Run Test Profile
Validates environment with small data. MUST pass before real data.
nextflow run nf-core/<pipeline> -r <version> -profile test,docker --outdir test_output
| Pipeline | Command |
|---|---|
| rnaseq | nextflow run nf-core/rnaseq -r 3.22.2 -profile test,docker --outdir test_rnaseq |
| sarek | nextflow run nf-core/sarek -r 3.7.1 -profile test,docker --outdir test_sarek |
| atacseq | nextflow run nf-core/atacseq -r 2.1.2 -profile test,docker --outdir test_atacseq |
Verify:
ls test_output/multiqc/multiqc_report.html
grep "Pipeline completed successfully" .nextflow.log
If test fails, see references/troubleshooting.md.
Step 4: Create Samplesheet
Generate automatically
python scripts/generate_samplesheet.py /path/to/data <pipeline> -o samplesheet.csv
The script:
- Discovers FASTQ/BAM/CRAM files
- Pairs R1/R2 reads
- Infers sample metadata
- Validates before writing
For sarek: Script prompts for tumor/normal status if not auto-detected.
Validate existing samplesheet
python scripts/generate_samplesheet.py --validate samplesheet.csv <pipeline>
Samplesheet formats
rnaseq:
sample,fastq_1,fastq_2,strandedness
SAMPLE1,/abs/path/R1.fq.gz,/abs/path/R2.fq.gz,auto
sarek:
patient,sample,lane,fastq_1,fastq_2,status
patient1,tumor,L001,/abs/path/tumor_R1.fq.gz,/abs/path/tumor_R2.fq.gz,1
patient1,normal,L001,/abs/path/normal_R1.fq.gz,/abs/path/normal_R2.fq.gz,0
atacseq:
sample,fastq_1,fastq_2,replicate
CONTROL,/abs/path/ctrl_R1.fq.gz,/abs/path/ctrl_R2.fq.gz,1
Step 5: Configure & Run
5a. Check genome availability
python scripts/manage_genomes.py check <genome>
# If not installed:
python scripts/manage_genomes.py download <genome>
Common genomes: GRCh38 (human), GRCh37 (legacy), GRCm39 (mouse), R64-1-1 (yeast), BDGP6 (fly)
5b. Decision points
DECISION POINT: Confirm with user:
- Genome: Which reference to use
- Pipeline-specific options:
- rnaseq: aligner (star_salmon recommended, hisat2 for low memory)
- sarek: tools (haplotypecaller for germline, mutect2 for somatic)
- atacseq: read_length (50, 75, 100, or 150)
5c. Run pipeline
nextflow run nf-core/<pipeline> \
-r <version> \
-profile docker \
--input samplesheet.csv \
--outdir results \
--genome <genome> \
-resume
Key flags:
-r: Pin version-profile docker: Use Docker (orsingularityfor HPC)--genome: iGenomes key-resume: Continue from checkpoint
Resource limits (if needed):
--max_cpus 8 --max_memory '32.GB' --max_time '24.h'
Step 6: Verify Outputs
Check completion
ls results/multiqc/multiqc_report.html
grep "Pipeline completed successfully" .nextflow.log
Key outputs by pipeline
rnaseq:
results/star_salmon/salmon.merged.gene_counts.tsv- Gene countsresults/star_salmon/salmon.merged.gene_tpm.tsv- TPM values
sarek:
results/variant_calling/*/- VCF filesresults/preprocessing/recalibrated/- BAM files
atacseq:
results/macs2/narrowPeak/- Peak callsresults/bwa/mergedLibrary/bigwig/- Coverage tracks
Quick Reference
For common exit codes and fixes, see references/troubleshooting.md.
Resume failed run
nextflow run nf-core/<pipeline> -resume
References
- references/geo-sra-acquisition.md - Downloading public GEO/SRA data
- references/troubleshooting.md - Common issues and fixes
- references/installation.md - Environment setup
- references/pipelines/rnaseq.md - RNA-seq pipeline details
- references/pipelines/sarek.md - Variant calling details
- references/pipelines/atacseq.md - ATAC-seq details
Disclaimer
This skill is provided as a prototype example demonstrating how to integrate nf-core bioinformatics pipelines into Claude Code for automated analysis workflows. The current implementation supports three pipelines (rnaseq, sarek, and atacseq), serving as a foundation that enables the community to expand support to the full set of nf-core pipelines.
It is intended for educational and research purposes and should not be considered production-ready without appropriate validation for your specific use case. Users are responsible for ensuring their computing environment meets pipeline requirements and for verifying analysis results.
Anthropic does not guarantee the accuracy of bioinformatics outputs, and users should follow standard practices for validating computational analyses. This integration is not officially endorsed by or affiliated with the nf-core community.
Attribution
When publishing results, cite the appropriate pipeline. Citations are available in each nf-core repository's CITATIONS.md file (e.g., https://github.com/nf-core/rnaseq/blob/3.22.2/CITATIONS.md).
Licenses
- nf-core pipelines: MIT License (https://nf-co.re/about)
- Nextflow: Apache License, Version 2.0 (https://www.nextflow.io/about-us.html)
- NCBI SRA Toolkit: Public Domain (https://github.com/ncbi/sra-tools/blob/master/LICENSE)
同梱ファイル
※ ZIPに含まれるファイル一覧。`SKILL.md` 本体に加え、参考資料・サンプル・スクリプトが入っている場合があります。
- 📄 SKILL.md (8,828 bytes)
- 📎 LICENSE.txt (10,254 bytes)
- 📎 references/geo-sra-acquisition.md (14,122 bytes)
- 📎 references/installation.md (1,816 bytes)
- 📎 references/pipelines/atacseq.md (4,181 bytes)
- 📎 references/pipelines/rnaseq.md (3,614 bytes)
- 📎 references/pipelines/sarek.md (4,018 bytes)
- 📎 references/troubleshooting.md (3,368 bytes)
- 📎 scripts/check_environment.py (14,111 bytes)
- 📎 scripts/config/genomes.yaml (3,520 bytes)
- 📎 scripts/config/pipelines/atacseq.yaml (5,158 bytes)
- 📎 scripts/config/pipelines/rnaseq.yaml (4,173 bytes)
- 📎 scripts/config/pipelines/sarek.yaml (6,278 bytes)
- 📎 scripts/detect_data_type.py (9,953 bytes)
- 📎 scripts/generate_samplesheet.py (15,440 bytes)
- 📎 scripts/manage_genomes.py (16,718 bytes)
- 📎 scripts/sra_geo_fetch.py (24,982 bytes)
- 📎 scripts/utils/__init__.py (1,788 bytes)
- 📎 scripts/utils/file_discovery.py (5,169 bytes)
- 📎 scripts/utils/ncbi_utils.py (28,480 bytes)
- 📎 scripts/utils/sample_inference.py (7,848 bytes)
- 📎 scripts/utils/validators.py (8,419 bytes)