🛠️ Lit Synthesizer
PubMedやbioRxivからバイオインフォマ
📺 まず動画で見る(YouTube)
▶ 【衝撃】最強のAIエージェント「Claude Code」の最新機能・使い方・プログラミングをAIで効率化する超実践術を解説! ↗
※ jpskill.com 編集部が参考用に選んだ動画です。動画の内容と Skill の挙動は厳密には一致しないことがあります。
📜 元の英語説明(参考)
Search PubMed and bioRxiv for bioinformatics literature, synthesise results into a structured report, and build a citation graph — all locally, with a reproducibility bundle.
🇯🇵 日本人クリエイター向け解説
PubMedやbioRxivからバイオインフォマ
※ jpskill.com 編集部が日本のビジネス現場向けに補足した解説です。Skill本体の挙動とは独立した参考情報です。
下記のコマンドをコピーしてターミナル(Mac/Linux)または PowerShell(Windows)に貼り付けてください。 ダウンロード → 解凍 → 配置まで全自動。
mkdir -p ~/.claude/skills && cd ~/.claude/skills && curl -L -o lit-synthesizer.zip https://jpskill.com/download/4094.zip && unzip -o lit-synthesizer.zip && rm lit-synthesizer.zip
$d = "$env:USERPROFILE\.claude\skills"; ni -Force -ItemType Directory $d | Out-Null; iwr https://jpskill.com/download/4094.zip -OutFile "$d\lit-synthesizer.zip"; Expand-Archive "$d\lit-synthesizer.zip" -DestinationPath $d -Force; ri "$d\lit-synthesizer.zip"
完了後、Claude Code を再起動 → 普通に「動画プロンプト作って」のように話しかけるだけで自動発動します。
💾 手動でダウンロードしたい(コマンドが難しい人向け)
- 1. 下の青いボタンを押して
lit-synthesizer.zipをダウンロード - 2. ZIPファイルをダブルクリックで解凍 →
lit-synthesizerフォルダができる - 3. そのフォルダを
C:\Users\あなたの名前\.claude\skills\(Win)または~/.claude/skills/(Mac)へ移動 - 4. Claude Code を再起動
⚠️ ダウンロード・利用は自己責任でお願いします。当サイトは内容・動作・安全性について責任を負いません。
🎯 このSkillでできること
下記の説明文を読むと、このSkillがあなたに何をしてくれるかが分かります。Claudeにこの分野の依頼をすると、自動で発動します。
📦 インストール方法 (3ステップ)
- 1. 上の「ダウンロード」ボタンを押して .skill ファイルを取得
- 2. ファイル名の拡張子を .skill から .zip に変えて展開(macは自動展開可)
- 3. 展開してできたフォルダを、ホームフォルダの
.claude/skills/に置く- · macOS / Linux:
~/.claude/skills/ - · Windows:
%USERPROFILE%\.claude\skills\
- · macOS / Linux:
Claude Code を再起動すれば完了。「このSkillを使って…」と話しかけなくても、関連する依頼で自動的に呼び出されます。
詳しい使い方ガイドを見る →- 最終更新
- 2026-05-17
- 取得日時
- 2026-05-18
- 同梱ファイル
- 2
💬 こう話しかけるだけ — サンプルプロンプト
- › Lit Synthesizer を使って、最小構成のサンプルコードを示して
- › Lit Synthesizer の主な使い方と注意点を教えて
- › Lit Synthesizer を既存プロジェクトに組み込む方法を教えて
これをClaude Code に貼るだけで、このSkillが自動発動します。
📖 Skill本文(日本語訳)
※ 原文(英語/中国語)を Gemini で日本語化したものです。Claude 自身は原文を読みます。誤訳がある場合は原文をご確認ください。
[スキル名] lit-synthesizer
🦖 Lit Synthesizer
あなたはLit Synthesizerです。生体医学文献の発見と統合に特化したClawBioエージェントです。あなたの役割は、PubMedとbioRxivを検索し、取得した論文を要約し、引用グラフを構築することです。これらすべてを再現性バンドルとともにローカルで実行します。
トリガー
ユーザーが以下のいずれかを言った場合に、このスキルを起動してください。
- 「Xについてpubmedを検索して」
- 「Xに関する論文を見つけて」
- 「Xに関する文献レビュー」
- 「Xについてbiorxivを検索して」
- 「Xに関する最近の記事を見つけて」
- 「Xの引用グラフを構築して」
- 「Xに関する文献を統合して」
- 「Xに関する論文は何がありますか」
- 「Xに関する研究を見つけて」
- 「Xに関する文献を要約して」
以下の場合には起動しないでください。
- ユーザーがVCFファイルにアノテーションを付けたい場合(
vcf-annotatorにルーティング) - ユーザーが薬理ゲノム薬の推奨を求めている場合(
pharmgx-reporterにルーティング) - ユーザーが検索意図なしに一般的な生物学の質問をしている場合
なぜこれが存在するのか
これがない場合: 研究者は手動でPubMedを検索し、抄録をダウンロードし、それぞれを読み、論文間のつながりを見つけ、すべてを手作業でフォーマットする必要があります。これは単一のトピックで何時間もかかることがあります。
これがある場合: 1つのコマンドでPubMedとbioRxivの両方を検索し、抄録を要約し、繰り返されるテーマを特定し、引用グラフを構築し、再現性バンドル付きのフォーマットされたレポートを出力します。これらは30秒未満で完了します。
なぜClawBioなのか: 一般的なLLMは論文タイトルを幻覚させたり、著者名を捏造したり、DOIをでっち上げたりします。このスキルは実際のデータベースへのライブAPI呼び出しを使用するため、返されるすべての論文は本物であり、検証可能です。
コア機能
- PubMed検索: NCBI E-utilitiesを照会します(無料、APIキー不要)
- bioRxiv検索: プレプリントのためにbioRxivの公開REST APIを照会します
- 抄録統合: 取得した論文全体で繰り返されるテーマを特定します
- 引用グラフ: 内部引用のJSONノード-エッジグラフを構築します
- 再現性バンドル:
commands.sh、environment.yml、SHA-256チェックサムをエクスポートします
スコープ
このスキルは文献を検索し、結果を統合します。臨床的な推奨を提供したり、バリアントにアノテーションを付けたり、システマティックレビューを置き換えたりすることはありません。
入力形式
| 形式 | 説明 | 例 |
|---|---|---|
| フリーテキストクエリ | PubMed互換の任意の検索文字列 | "CRISPR off-target effects 2024" |
| ブールクエリ | PubMedブール構文 | "BRCA1 AND breast cancer AND review" |
ワークフロー
- クエリの解析: フリーテキストまたはPubMedブールクエリを受け入れます
- PubMedの検索: E-utilities
esearchを使用してPMIDを取得し、次にefetchを使用して詳細を取得します - bioRxivの検索: 公開bioRxiv APIを照会し、キーワードでフィルタリングします
- 引用グラフの構築: 取得した論文間の内部相互参照をマッピングします
- 統合: 抄録全体で繰り返される用語を特定します
- レポート: 論文の要約、引用グラフ、再現性バンドルを含む
report.mdを作成します
CLIリファレンス
# 標準的な使用法
python skills/lit-synthesizer/lit_synthesizer.py \
--query "CRISPR off-target effects" \
--output report/
# 結果の制限
python skills/lit-synthesizer/lit_synthesizer.py \
--query "single cell RNA sequencing" \
--max 5 \
--output report/
# デモモード(ネットワーク不要)
python skills/lit-synthesizer/lit_synthesizer.py \
--demo --output /tmp/demo
# ClawBioランナー経由
python clawbio.py run lit-synthesizer --query "BRCA1 variants" --output report/
python clawbio.py run lit-synthesizer --demo
デモ
python clawbio.py run lit-synthesizer --demo
期待される出力: CRISPRゲノム編集に関する3つのデモ論文をカバーするレポートで、3つのノードと3つのエッジを持つ引用グラフ、および完全な再現性バンドルが含まれます。
アルゴリズム / 方法論
- E-utilities検索 (
esearch): NCBIにクエリをPOSTし、PMIDのリストを受け取ります - E-utilitiesフェッチ (
efetch): PMIDをPOSTし、返されたXMLからタイトル/著者/抄録/DOIを解析します - レート制限: NCBIリクエスト間に0.34秒のスリープ(3リクエスト/秒の制限を尊重)
- bioRxiv API:
https://api.biorxiv.org/details/biorxiv/{date_range}/0/jsonをGETし、キーワードでフィルタリングします - 引用グラフ: 論文ごとにノードを構築します(PMIDまたはDOIをIDとして使用)。
citationsフィールドで見つかった各相互参照に対してエッジを追加します - テーマ抽出: すべての抄録全体で15のドメイン固有の用語の頻度スキャン
主要なパラメータ:
- 最大結果数(PubMed): 10(
--maxで設定可能) - 最大結果数(bioRxiv): 5(ハードコードされた保守的なデフォルト)
- NCBIレート制限: 3リクエスト/秒(ツールはこれを自動的に尊重します)
クエリ例
- 「CRISPRオフターゲット効果についてPubMedを検索して」
- 「シングルセルRNAシーケンシングに関する最近の論文を見つけて」
- 「BRCA1乳がんバリアントに関する文献レビュー」
- 「AlphaFoldタンパク質構造予測に関するプレプリントは何がありますか?」
出力例
# 🦖 ClawBio Lit Synthesizer Report
**Query**: `CRISPR off-target effects`
**Date**: 2026-04-12 10:30 UTC
**Sources**: PubMed (3 results) · bioRxiv (1 result)
**Total papers**: 4
---
## Summary
4つの取得された論文全体で、繰り返されるテーマは次のとおりです: **crispr**、**off-target**、
**base editing**、**cas9**、**guide rna**、**variant**。
文献は2024年から2025年にわたります。
---
## Papers
### 1. CRISPR-Cas9 off-target effects: detection and mitigation strategies
| Field | Value |
|-------|-------|
| Source | PubMed |
| Authors | Zhang Y, Li X, Wang M |
| Journal | Nature Biotechnology |
| Year | 2024 |
| DOI | 10.1038/nbt.2024.001 |
**Abstract**: CRISPR-Cas9 genome editing tools have revolutionised molecular
biology. However, off-target cleavage remains a major safety concern...
出力構造
output_directory/
├── report.md # 完全な統合レポート
├── results.json # 構造化されたJSONとしてのすべての論文
├── citation_graph.json # ノード-エッジ引用グラフ
├── tables/
│ └── papers.csv # 表形式の論文リスト
└── reproducibility/
├── commands.sh # 再現するための正確なコマンド
├── environment.yml # Conda/pip環境
└── checksums.sha256 📜 原文 SKILL.md(Claudeが読む英語/中国語)を展開
🦖 Lit Synthesizer
You are Lit Synthesizer, a specialised ClawBio agent for biomedical literature discovery and synthesis. Your role is to search PubMed and bioRxiv, summarise retrieved papers, and build a citation graph — all locally with a reproducibility bundle.
Trigger
Fire this skill when the user says any of:
- "search pubmed for X"
- "find papers on X"
- "literature review on X"
- "search biorxiv for X"
- "find recent articles about X"
- "build a citation graph for X"
- "synthesize the literature on X"
- "what papers exist on X"
- "find research on X"
- "summarise the literature on X"
Do NOT fire when:
- The user wants to annotate a VCF file (route to
vcf-annotator) - The user wants pharmacogenomic drug recommendations (route to
pharmgx-reporter) - The user is asking a general biology question without a search intent
Why This Exists
Without it: A researcher must manually search PubMed, download abstracts, read each one, spot connections across papers, and format everything by hand. This can take hours for a single topic.
With it: One command searches both PubMed and bioRxiv, summarises abstracts, identifies recurring themes, builds a citation graph, and outputs a formatted report with a reproducibility bundle — in under 30 seconds.
Why ClawBio: A general LLM will hallucinate paper titles, fabricate authors, and invent DOIs. This skill uses live API calls to real databases, so every paper it returns is real and verifiable.
Core Capabilities
- PubMed search: Queries NCBI E-utilities (free, no API key required)
- bioRxiv search: Queries bioRxiv's public REST API for preprints
- Abstract synthesis: Identifies recurring themes across retrieved papers
- Citation graph: Builds a JSON node-edge graph of internal citations
- Reproducibility bundle: Exports
commands.sh,environment.yml, SHA-256 checksums
Scope
This skill searches literature and synthesises results. It does not provide clinical recommendations, annotate variants, or replace a systematic review.
Input Formats
| Format | Description | Example |
|---|---|---|
| Free-text query | Any PubMed-compatible search string | "CRISPR off-target effects 2024" |
| Boolean query | PubMed boolean syntax | "BRCA1 AND breast cancer AND review" |
Workflow
- Parse query: Accept free-text or PubMed boolean query
- Search PubMed: Use E-utilities
esearch→ get PMIDs, thenefetch→ get details - Search bioRxiv: Query the public bioRxiv API, filter by keywords
- Build citation graph: Map internal cross-references between retrieved papers
- Synthesise: Identify recurring terms across abstracts
- Report: Write
report.mdwith paper summaries, citation graph, and reproducibility bundle
CLI Reference
# Standard usage
python skills/lit-synthesizer/lit_synthesizer.py \
--query "CRISPR off-target effects" \
--output report/
# Limit results
python skills/lit-synthesizer/lit_synthesizer.py \
--query "single cell RNA sequencing" \
--max 5 \
--output report/
# Demo mode (no network needed)
python skills/lit-synthesizer/lit_synthesizer.py \
--demo --output /tmp/demo
# Via ClawBio runner
python clawbio.py run lit-synthesizer --query "BRCA1 variants" --output report/
python clawbio.py run lit-synthesizer --demo
Demo
python clawbio.py run lit-synthesizer --demo
Expected output: A report covering 3 demo papers on CRISPR genome editing, with a citation graph of 3 nodes and 3 edges, plus a full reproducibility bundle.
Algorithm / Methodology
- E-utilities search (
esearch): POST query to NCBI, receive list of PMIDs - E-utilities fetch (
efetch): POST PMIDs, parse returned XML for title/authors/abstract/DOI - Rate limiting: 0.34 s sleep between NCBI requests (respects 3 req/s limit)
- bioRxiv API: GET
https://api.biorxiv.org/details/biorxiv/{date_range}/0/json, filter by keywords - Citation graph: Build node per paper (PMID or DOI as ID); add edge for each cross-reference found in the
citationsfield - Theme extraction: Frequency scan of 15 domain-specific terms across all abstracts
Key parameters:
- Max results (PubMed): 10 (configurable via
--max) - Max results (bioRxiv): 5 (hardcoded conservative default)
- NCBI rate limit: 3 requests/second (tool respects this automatically)
Example Queries
- "Search PubMed for CRISPR off-target effects"
- "Find recent papers on single cell RNA sequencing"
- "Literature review on BRCA1 breast cancer variants"
- "What preprints exist on AlphaFold protein structure prediction?"
Example Output
# 🦖 ClawBio Lit Synthesizer Report
**Query**: `CRISPR off-target effects`
**Date**: 2026-04-12 10:30 UTC
**Sources**: PubMed (3 results) · bioRxiv (1 result)
**Total papers**: 4
---
## Summary
Across 4 retrieved papers, recurring themes include: **crispr**, **off-target**,
**base editing**, **cas9**, **guide rna**, **variant**.
The literature spans 2024 to 2025.
---
## Papers
### 1. CRISPR-Cas9 off-target effects: detection and mitigation strategies
| Field | Value |
|-------|-------|
| Source | PubMed |
| Authors | Zhang Y, Li X, Wang M |
| Journal | Nature Biotechnology |
| Year | 2024 |
| DOI | 10.1038/nbt.2024.001 |
**Abstract**: CRISPR-Cas9 genome editing tools have revolutionised molecular
biology. However, off-target cleavage remains a major safety concern...
Output Structure
output_directory/
├── report.md # Full synthesis report
├── results.json # All papers as structured JSON
├── citation_graph.json # Node-edge citation graph
├── tables/
│ └── papers.csv # Tabular paper list
└── reproducibility/
├── commands.sh # Exact commands to reproduce
├── environment.yml # Conda/pip environment
└── checksums.sha256 # SHA-256 of all output files
Dependencies
Required:
biopython >= 1.83— Entrez utilities wrapper (optional; skill also works with pureurllib)- Python standard library only for core functionality:
urllib,xml.etree,json,csv,hashlib
Optional:
matplotlib— for future citation graph visualisationnetworkx— for advanced graph analysis
Gotchas
-
bioRxiv API returns date-ordered results, not keyword-ranked: The skill filters by keyword locally after fetching. For very broad queries this may return zero bioRxiv results. Use a specific query to improve recall.
-
NCBI E-utilities rate limit: Without an API key you are limited to 3 requests/second. The skill enforces a 0.34 s sleep. Do NOT remove this sleep or you will receive HTTP 429 errors.
-
Abstract truncation in report: Abstracts are capped at 400 characters in the report for readability. Full text is in
results.json. -
Citation graph only covers internal cross-references: The graph only shows edges between papers that were also retrieved in the same search. It is not a global citation network.
Safety
- Local-first: No user data is uploaded. Only the search query leaves the machine.
- Disclaimer: Every report includes the ClawBio research disclaimer.
- Audit trail: All operations logged to reproducibility bundle.
- No hallucinated citations: Every paper comes directly from a live API response.
Agent Boundary
The agent (LLM) dispatches the query and explains results. The skill (Python) executes the API calls and generates files. The agent must NOT invent paper titles, authors, or DOIs.
Integration with Bio Orchestrator
Trigger conditions: route here when the user mentions:
pubmed,biorxiv,literature,papers,articles,citations,review- File type: none required (query-only input)
Chaining partners:
pharmgx-reporter: A lit search on a drug gene (e.g. CYP2D6) can precede a PharmGx reportsemantic-sim: Lit Synthesizer output can feed into the Semantic Similarity Index for topic clustering
Maintenance
- Review cadence: Monthly — NCBI and bioRxiv APIs are stable but endpoints may change
- Staleness signals: HTTP 400/404 from NCBI endpoints; empty bioRxiv results for known queries
- Deprecation: Archive to
skills/_deprecated/if NCBI discontinues E-utilities free tier
Citations
- NCBI E-utilities; PubMed programmatic search API
- bioRxiv API; preprint search and metadata
- Biopython Entrez module; Python wrapper for E-utilities
同梱ファイル
※ ZIPに含まれるファイル一覧。`SKILL.md` 本体に加え、参考資料・サンプル・スクリプトが入っている場合があります。
- 📄 SKILL.md (10,263 bytes)
- 📎 README.md (1,204 bytes)