jpskill.com
🛠️ 開発・MCP コミュニティ

ena-database

Access European Nucleotide Archive via API/FTP. Retrieve DNA/RNA sequences, raw reads (FASTQ), genome assemblies by accession, for genomics and bioinformatics pipelines. Supports multiple formats.

⚡ おすすめ: コマンド1行でインストール(60秒)

下記のコマンドをコピーしてターミナル(Mac/Linux)または PowerShell(Windows)に貼り付けてください。 ダウンロード → 解凍 → 配置まで全自動。

🍎 Mac / 🐧 Linux
mkdir -p ~/.claude/skills && cd ~/.claude/skills && curl -L -o ena-database.zip https://jpskill.com/download/18397.zip && unzip -o ena-database.zip && rm ena-database.zip
🪟 Windows (PowerShell)
$d = "$env:USERPROFILE\.claude\skills"; ni -Force -ItemType Directory $d | Out-Null; iwr https://jpskill.com/download/18397.zip -OutFile "$d\ena-database.zip"; Expand-Archive "$d\ena-database.zip" -DestinationPath $d -Force; ri "$d\ena-database.zip"

完了後、Claude Code を再起動 → 普通に「動画プロンプト作って」のように話しかけるだけで自動発動します。

💾 手動でダウンロードしたい(コマンドが難しい人向け)
  1. 1. 下の青いボタンを押して ena-database.zip をダウンロード
  2. 2. ZIPファイルをダブルクリックで解凍 → ena-database フォルダができる
  3. 3. そのフォルダを C:\Users\あなたの名前\.claude\skills\(Win)または ~/.claude/skills/(Mac)へ移動
  4. 4. Claude Code を再起動

⚠️ ダウンロード・利用は自己責任でお願いします。当サイトは内容・動作・安全性について責任を負いません。

🎯 このSkillでできること

下記の説明文を読むと、このSkillがあなたに何をしてくれるかが分かります。Claudeにこの分野の依頼をすると、自動で発動します。

📦 インストール方法 (3ステップ)

  1. 1. 上の「ダウンロード」ボタンを押して .skill ファイルを取得
  2. 2. ファイル名の拡張子を .skill から .zip に変えて展開(macは自動展開可)
  3. 3. 展開してできたフォルダを、ホームフォルダの .claude/skills/ に置く
    • · macOS / Linux: ~/.claude/skills/
    • · Windows: %USERPROFILE%\.claude\skills\

Claude Code を再起動すれば完了。「このSkillを使って…」と話しかけなくても、関連する依頼で自動的に呼び出されます。

詳しい使い方ガイドを見る →
最終更新
2026-05-18
取得日時
2026-05-18
同梱ファイル
2

📖 Skill本文(日本語訳)

※ 原文(英語/中国語)を Gemini で日本語化したものです。Claude 自身は原文を読みます。誤訳がある場合は原文をご確認ください。

ENAデータベース

概要

European Nucleotide Archive (ENA) は、ヌクレオチド配列データと関連するメタデータのための包括的な公共リポジトリです。ゲノミクスおよびバイオインフォマティクスパイプラインのために、REST API および FTP を介して DNA/RNA 配列、生リード、ゲノムアセンブリ、および機能アノテーションにアクセスし、クエリを実行します。

この Skill を使用するべき時

この Skill は、以下の場合に使用する必要があります。

  • アクセッションによるヌクレオチド配列または生のシーケンスリードの取得
  • メタデータ基準によるサンプル、研究、またはアセンブリの検索
  • 解析のための FASTQ ファイルまたはゲノムアセンブリのダウンロード
  • 生物の分類学的情報のクエリ
  • 配列アノテーションおよび機能データへのアクセス
  • ENA データをバイオインフォマティクスパイプラインに統合
  • 関連データベースへの相互参照検索の実行
  • FTP または Aspera を介したデータセットの一括ダウンロード

主要な機能

1. データ型と構造

ENA は、データを階層的なオブジェクト型に整理します。

研究/プロジェクト - 関連データをグループ化し、リリース日を制御します。研究は、アーカイブされたデータを引用するための主要な単位です。

サンプル - シーケンスライブラリが作成された生体物質の単位を表します。ほとんどのデータ型を送信する前に、サンプルを登録する必要があります。

生リード - 以下で構成されます。

  • 実験: シーケンス方法、ライブラリ調製、および機器の詳細に関するメタデータ
  • ラン: 単一のシーケンスランからの生のシーケンスリードを含むデータファイルへの参照

アセンブリ - さまざまな完了レベルのゲノム、トランスクリプトーム、メタゲノム、またはメタトランスクリプトームアセンブリ。

配列 - コーディング/ノンコーディング領域および機能アノテーションを含む、EMBL Nucleotide Sequence Database に保存されているアセンブルおよびアノテーションされた配列。

解析 - 配列データの計算解析からの結果。

分類記録 - 系統およびランクを含む分類学的情報。

2. プログラムによるアクセス

ENA は、データアクセス用の複数の REST API を提供します。詳細なエンドポイントドキュメントについては、references/api_reference.md を参照してください。

主要な API:

ENA Portal API - すべての ENA データ型にわたる高度な検索機能

ENA Browser API - レコードおよびメタデータの直接取得

ENA Taxonomy REST API - 分類学的情報のクエリ

  • 系統、ランク、および関連する分類学的データにアクセス

ENA Cross Reference Service - 外部データベースからの関連レコードへのアクセス

CRAM Reference Registry - 参照配列の取得

レート制限: すべての API には、1 秒あたり 50 リクエストのレート制限があります。これを超えると、HTTP 429 (Too Many Requests) が返されます。

3. データの検索と取得

ブラウザベースの検索:

  • すべてのフィールドにわたる自由テキスト検索
  • 配列類似性検索 (BLAST 統合)
  • 関連レコードを見つけるための相互参照検索
  • Rulespace クエリビルダーによる高度な検索

プログラムによるクエリ:

  • 大規模な高度な検索には Portal API を使用
  • データ型、日付範囲、分類、またはメタデータフィールドでフィルタリング
  • 結果を、表形式のメタデータ概要または XML レコードとしてダウンロード

API クエリの例:

import requests

# 特定の研究からのサンプルを検索
base_url = "https://www.ebi.ac.uk/ena/portal/api/search"
params = {
    "result": "sample",
    "query": "study_accession=PRJEB1234",
    "format": "json",
    "limit": 100
}

response = requests.get(base_url, params=params)
samples = response.json()

4. データ取得形式

メタデータ形式:

  • XML (ネイティブ ENA 形式)
  • JSON (Portal API 経由)
  • TSV/CSV (表形式の概要)

配列データ:

  • FASTQ (生リード)
  • BAM/CRAM (アラインメントされたリード)
  • FASTA (アセンブルされた配列)
  • EMBL フラットファイル形式 (アノテーションされた配列)

ダウンロード方法:

  • 直接 API ダウンロード (小規模ファイル)
  • 一括データ転送用の FTP
  • 大規模データセットの高速転送用の Aspera
  • 一括ダウンロード用の enaBrowserTools コマンドラインユーティリティ

5. 一般的なユースケース

アクセッションによる生のシーケンスリードの取得:

# Browser API を使用してランファイルをダウンロード
accession = "ERR123456"
url = f"https://www.ebi.ac.uk/ena/browser/api/xml/{accession}"

研究内のすべてのサンプルを検索:

# Portal API を使用してサンプルをリスト
study_id = "PRJNA123456"
url = f"https://www.ebi.ac.uk/ena/portal/api/search?result=sample&query=study_accession={study_id}&format=tsv"

特定の生物のアセンブリを検索:

# 分類によるアセンブリの検索
organism = "Escherichia coli"
url = f"https://www.ebi.ac.uk/ena/portal/api/search?result=assembly&query=tax_tree({organism})&format=json"

分類学的系統を取得:

# Taxonomy API のクエリ
taxon_id = "562"  # E. coli
url = f"https://www.ebi.ac.uk/ena/taxonomy/rest/tax-id/{taxon_id}"

6. 解析パイプラインとの統合

一括ダウンロードパターン:

  1. Portal API を使用して、基準に一致するアクセッションを検索
  2. 検索結果からファイル URL を抽出
  3. FTP または enaBrowserTools を使用してファイルをダウンロード
  4. パイプラインでダウンロードしたデータを処理

BLAST 統合: ENA 配列に対する配列類似性検索のために、EBI の NCBI BLAST サービス (REST/SOAP API) と統合します。

7. ベストプラクティス

レート制限:

  • HTTP 429 応答を受信した場合は、指数バックオフを実装します
  • 可能な場合はリクエストをバッチ処理して、1 秒あたり 50 リクエストの制限内に収めます
  • 大規模なデータセットの場合は、API 呼び出しを反復処理する代わりに、一括ダウンロードツールを使用します

データの引用:

  • 公開する際は、常に研究/プロジェクトのアクセッションを使用して引用してください
  • 使用した特定のサンプル、ラン、またはアセンブリのアクセッション番号を含めます

API 応答の処理:

  • 応答を処理する前に、HTTP ステータスコードを確認してください
  • 適切な XML ライブラリ (正規表現ではない) を使用して XML 応答を解析してください
  • pa
📜 原文 SKILL.md(Claudeが読む英語/中国語)を展開

ENA Database

Overview

The European Nucleotide Archive (ENA) is a comprehensive public repository for nucleotide sequence data and associated metadata. Access and query DNA/RNA sequences, raw reads, genome assemblies, and functional annotations through REST APIs and FTP for genomics and bioinformatics pipelines.

When to Use This Skill

This skill should be used when:

  • Retrieving nucleotide sequences or raw sequencing reads by accession
  • Searching for samples, studies, or assemblies by metadata criteria
  • Downloading FASTQ files or genome assemblies for analysis
  • Querying taxonomic information for organisms
  • Accessing sequence annotations and functional data
  • Integrating ENA data into bioinformatics pipelines
  • Performing cross-reference searches to related databases
  • Bulk downloading datasets via FTP or Aspera

Core Capabilities

1. Data Types and Structure

ENA organizes data into hierarchical object types:

Studies/Projects - Group related data and control release dates. Studies are the primary unit for citing archived data.

Samples - Represent units of biomaterial from which sequencing libraries were produced. Samples must be registered before submitting most data types.

Raw Reads - Consist of:

  • Experiments: Metadata about sequencing methods, library preparation, and instrument details
  • Runs: References to data files containing raw sequencing reads from a single sequencing run

Assemblies - Genome, transcriptome, metagenome, or metatranscriptome assemblies at various completion levels.

Sequences - Assembled and annotated sequences stored in the EMBL Nucleotide Sequence Database, including coding/non-coding regions and functional annotations.

Analyses - Results from computational analyses of sequence data.

Taxonomy Records - Taxonomic information including lineage and rank.

2. Programmatic Access

ENA provides multiple REST APIs for data access. Consult references/api_reference.md for detailed endpoint documentation.

Key APIs:

ENA Portal API - Advanced search functionality across all ENA data types

ENA Browser API - Direct retrieval of records and metadata

ENA Taxonomy REST API - Query taxonomic information

  • Access lineage, rank, and related taxonomic data

ENA Cross Reference Service - Access related records from external databases

CRAM Reference Registry - Retrieve reference sequences

Rate Limiting: All APIs have a rate limit of 50 requests per second. Exceeding this returns HTTP 429 (Too Many Requests).

3. Searching and Retrieving Data

Browser-Based Search:

  • Free text search across all fields
  • Sequence similarity search (BLAST integration)
  • Cross-reference search to find related records
  • Advanced search with Rulespace query builder

Programmatic Queries:

  • Use Portal API for advanced searches at scale
  • Filter by data type, date range, taxonomy, or metadata fields
  • Download results as tabulated metadata summaries or XML records

Example API Query Pattern:

import requests

# Search for samples from a specific study
base_url = "https://www.ebi.ac.uk/ena/portal/api/search"
params = {
    "result": "sample",
    "query": "study_accession=PRJEB1234",
    "format": "json",
    "limit": 100
}

response = requests.get(base_url, params=params)
samples = response.json()

4. Data Retrieval Formats

Metadata Formats:

  • XML (native ENA format)
  • JSON (via Portal API)
  • TSV/CSV (tabulated summaries)

Sequence Data:

  • FASTQ (raw reads)
  • BAM/CRAM (aligned reads)
  • FASTA (assembled sequences)
  • EMBL flat file format (annotated sequences)

Download Methods:

  • Direct API download (small files)
  • FTP for bulk data transfer
  • Aspera for high-speed transfer of large datasets
  • enaBrowserTools command-line utility for bulk downloads

5. Common Use Cases

Retrieve raw sequencing reads by accession:

# Download run files using Browser API
accession = "ERR123456"
url = f"https://www.ebi.ac.uk/ena/browser/api/xml/{accession}"

Search for all samples in a study:

# Use Portal API to list samples
study_id = "PRJNA123456"
url = f"https://www.ebi.ac.uk/ena/portal/api/search?result=sample&query=study_accession={study_id}&format=tsv"

Find assemblies for a specific organism:

# Search assemblies by taxonomy
organism = "Escherichia coli"
url = f"https://www.ebi.ac.uk/ena/portal/api/search?result=assembly&query=tax_tree({organism})&format=json"

Get taxonomic lineage:

# Query taxonomy API
taxon_id = "562"  # E. coli
url = f"https://www.ebi.ac.uk/ena/taxonomy/rest/tax-id/{taxon_id}"

6. Integration with Analysis Pipelines

Bulk Download Pattern:

  1. Search for accessions matching criteria using Portal API
  2. Extract file URLs from search results
  3. Download files via FTP or using enaBrowserTools
  4. Process downloaded data in pipeline

BLAST Integration: Integrate with EBI's NCBI BLAST service (REST/SOAP API) for sequence similarity searches against ENA sequences.

7. Best Practices

Rate Limiting:

  • Implement exponential backoff when receiving HTTP 429 responses
  • Batch requests when possible to stay within 50 req/sec limit
  • Use bulk download tools for large datasets instead of iterating API calls

Data Citation:

  • Always cite using Study/Project accessions when publishing
  • Include accession numbers for specific samples, runs, or assemblies used

API Response Handling:

  • Check HTTP status codes before processing responses
  • Parse XML responses using proper XML libraries (not regex)
  • Handle pagination for large result sets

Performance:

  • Use FTP/Aspera for downloading large files (>100MB)
  • Prefer TSV/JSON formats over XML when only metadata is needed
  • Cache taxonomy lookups locally when processing many records

Resources

This skill includes detailed reference documentation for working with ENA:

references/

api_reference.md - Comprehensive API endpoint documentation including:

  • Detailed parameters for Portal API and Browser API
  • Response format specifications
  • Advanced query syntax and operators
  • Field names for filtering and searching
  • Common API patterns and examples

Load this reference when constructing complex API queries, debugging API responses, or needing specific parameter details.

同梱ファイル

※ ZIPに含まれるファイル一覧。`SKILL.md` 本体に加え、参考資料・サンプル・スクリプトが入っている場合があります。