pdf-skill
PDFの生成、内容抽出、結合、フォーム入力など、PDF文書のあらゆる操作を効率的に行うSkill。
📜 元の英語説明(参考)
Expert in generating, parsing, and manipulating PDF documents using tools like PDFKit, PDF.js, and Puppeteer. Use when creating PDFs, extracting content, merging documents, or filling forms. Triggers include "PDF", "generate PDF", "parse PDF", "extract PDF", "merge PDF", "PDF form", "PDFKit".
🇯🇵 日本人クリエイター向け解説
PDFの生成、内容抽出、結合、フォーム入力など、PDF文書のあらゆる操作を効率的に行うSkill。
※ jpskill.com 編集部が日本のビジネス現場向けに補足した解説です。Skill本体の挙動とは独立した参考情報です。
下記のコマンドをコピーしてターミナル(Mac/Linux)または PowerShell(Windows)に貼り付けてください。 ダウンロード → 解凍 → 配置まで全自動。
mkdir -p ~/.claude/skills && cd ~/.claude/skills && curl -L -o pdf-skill.zip https://jpskill.com/download/6704.zip && unzip -o pdf-skill.zip && rm pdf-skill.zip
$d = "$env:USERPROFILE\.claude\skills"; ni -Force -ItemType Directory $d | Out-Null; iwr https://jpskill.com/download/6704.zip -OutFile "$d\pdf-skill.zip"; Expand-Archive "$d\pdf-skill.zip" -DestinationPath $d -Force; ri "$d\pdf-skill.zip"
完了後、Claude Code を再起動 → 普通に「動画プロンプト作って」のように話しかけるだけで自動発動します。
💾 手動でダウンロードしたい(コマンドが難しい人向け)
- 1. 下の青いボタンを押して
pdf-skill.zipをダウンロード - 2. ZIPファイルをダブルクリックで解凍 →
pdf-skillフォルダができる - 3. そのフォルダを
C:\Users\あなたの名前\.claude\skills\(Win)または~/.claude/skills/(Mac)へ移動 - 4. Claude Code を再起動
⚠️ ダウンロード・利用は自己責任でお願いします。当サイトは内容・動作・安全性について責任を負いません。
🎯 このSkillでできること
下記の説明文を読むと、このSkillがあなたに何をしてくれるかが分かります。Claudeにこの分野の依頼をすると、自動で発動します。
📦 インストール方法 (3ステップ)
- 1. 上の「ダウンロード」ボタンを押して .skill ファイルを取得
- 2. ファイル名の拡張子を .skill から .zip に変えて展開(macは自動展開可)
- 3. 展開してできたフォルダを、ホームフォルダの
.claude/skills/に置く- · macOS / Linux:
~/.claude/skills/ - · Windows:
%USERPROFILE%\.claude\skills\
- · macOS / Linux:
Claude Code を再起動すれば完了。「このSkillを使って…」と話しかけなくても、関連する依頼で自動的に呼び出されます。
詳しい使い方ガイドを見る →- 最終更新
- 2026-05-17
- 取得日時
- 2026-05-17
- 同梱ファイル
- 1
📖 Skill本文(日本語訳)
※ 原文(英語/中国語)を Gemini で日本語化したものです。Claude 自身は原文を読みます。誤訳がある場合は原文をご確認ください。
[Skill 名] pdf-skill
PDF スキル
目的
プログラムによる PDF の生成、解析、操作に関する専門知識を提供します。PDFKit、PDF.js、Puppeteer、および類似のツールを使用して、PDF をゼロから作成する、コンテンツを抽出する、ドキュメントを結合/分割する、フォームを処理することに特化しています。
使用する状況
- プログラムで PDF を生成する場合
- PDF からテキストやデータを抽出する場合
- PDF ドキュメントを結合または分割する場合
- PDF フォームをプログラムで入力する場合
- HTML を PDF に変換する場合
- 透かしや注釈を追加する場合
- PDF の構造とメタデータを解析する場合
- PDF レポートジェネレーターを構築する場合
クイックスタート
このスキルを呼び出す場合:
- コードまたはデータから PDF を生成する場合
- PDF ファイルからコンテンツを抽出する場合
- PDF を結合、分割、または操作する場合
- PDF フォームに入力または作成する場合
- HTML/Web ページを PDF に変換する場合
呼び出さない場合:
- Word ドキュメントの作成 →
/docx-skillを使用してください - Excel/スプレッドシートの作業 →
/xlsx-skillを使用してください - PowerPoint の作成 →
/pptx-skillを使用してください - 一般的なファイル操作 → Bash またはファイルツールを使用してください
意思決定フレームワーク
PDF Operation?
├── Generate from scratch
│ ├── Simple → PDFKit (Node) / ReportLab (Python)
│ └── Complex layouts → Puppeteer/Playwright + HTML
├── Parse/Extract
│ ├── Text extraction → pdf-parse / PyPDF2
│ └── Table extraction → Camelot / Tabula
├── Manipulate
│ └── pdf-lib (merge, split, edit)
└── Forms
└── pdf-lib (fill) / PDFtk (advanced)
主要なワークフロー
1. PDFKit を使用した PDF 生成
- PDFKit をインストールします (
npm install pdfkit) - 新しい PDDocument を作成します
- コンテンツ(テキスト、画像、グラフィック)を追加します
- フォントと色でスタイルを設定します
- 必要に応じてページを追加します
- ファイルまたはレスポンスにパイプします
2. HTML から PDF への変換
- Puppeteer/Playwright をセットアップします
- HTML コンテンツまたは URL に移動します
- ページサイズと余白を設定します
- 印刷オプション(ヘッダー、フッター)を設定します
- PDF バッファを生成します
- 結果を保存またはストリームします
3. PDF の解析と抽出
- パーサーを選択します (pdf-parse, PyPDF2, pdfplumber)
- PDF ファイルを読み込みます
- テキストまたは構造化データを抽出します
- 複数ページのドキュメントを処理します
- 抽出されたテキストをクリーンアップし、正規化します
- 目的の形式で出力します
ベストプラクティス
- 可能な場合はラスターよりもベクターグラフィックを使用してください
- 一貫したレンダリングのためにフォントを埋め込んでください
- 異なるリーダーで PDF 出力をテストしてください
- 大容量の PDF はストリーミングで処理してください
- タスクの複雑さに応じて適切なライブラリを使用してください
- アクセシビリティ(タグ付き PDF)を考慮してください
アンチパターン
| アンチパターン | 問題 | 正しいアプローチ |
|---|---|---|
| 画像のみの PDF | 検索/アクセス不可 | フォント付きのテキストを使用する |
| フォントの埋め込みなし | レンダリングの問題 | 必要なフォントを埋め込む |
| 大容量 PDF のメモリ読み込み | クラッシュ | ストリーム処理 |
| 暗号化の無視 | セキュリティ/アクセス問題 | 暗号化された PDF を処理する |
| 誤ったツールの使用 | 過剰な設計 | 複雑さに合わせてツールを選択する |
📜 原文 SKILL.md(Claudeが読む英語/中国語)を展開
PDF Skill
Purpose
Provides expertise in programmatic PDF generation, parsing, and manipulation. Specializes in creating PDFs from scratch, extracting content, merging/splitting documents, and handling forms using PDFKit, PDF.js, Puppeteer, and similar tools.
When to Use
- Generating PDFs programmatically
- Extracting text or data from PDFs
- Merging or splitting PDF documents
- Filling PDF forms programmatically
- Converting HTML to PDF
- Adding watermarks or annotations
- Parsing PDF structure and metadata
- Building PDF report generators
Quick Start
Invoke this skill when:
- Generating PDFs from code or data
- Extracting content from PDF files
- Merging, splitting, or manipulating PDFs
- Filling or creating PDF forms
- Converting HTML/web pages to PDF
Do NOT invoke when:
- Word document creation → use
/docx-skill - Excel/spreadsheet work → use
/xlsx-skill - PowerPoint creation → use
/pptx-skill - General file operations → use Bash or file tools
Decision Framework
PDF Operation?
├── Generate from scratch
│ ├── Simple → PDFKit (Node) / ReportLab (Python)
│ └── Complex layouts → Puppeteer/Playwright + HTML
├── Parse/Extract
│ ├── Text extraction → pdf-parse / PyPDF2
│ └── Table extraction → Camelot / Tabula
├── Manipulate
│ └── pdf-lib (merge, split, edit)
└── Forms
└── pdf-lib (fill) / PDFtk (advanced)
Core Workflows
1. PDF Generation with PDFKit
- Install PDFKit (
npm install pdfkit) - Create new PDDocument
- Add content (text, images, graphics)
- Style with fonts and colors
- Add pages as needed
- Pipe to file or response
2. HTML to PDF Conversion
- Set up Puppeteer/Playwright
- Navigate to HTML content or URL
- Configure page size and margins
- Set print options (headers, footers)
- Generate PDF buffer
- Save or stream result
3. PDF Parsing and Extraction
- Choose parser (pdf-parse, PyPDF2, pdfplumber)
- Load PDF file
- Extract text or structured data
- Handle multi-page documents
- Clean and normalize extracted text
- Output in desired format
Best Practices
- Use vector graphics over raster when possible
- Embed fonts for consistent rendering
- Test PDF output across different readers
- Handle large PDFs with streaming
- Use appropriate library for task complexity
- Consider accessibility (tagged PDFs)
Anti-Patterns
| Anti-Pattern | Problem | Correct Approach |
|---|---|---|
| Image-only PDFs | Not searchable/accessible | Use text with fonts |
| No font embedding | Rendering issues | Embed required fonts |
| Memory loading large PDFs | Crashes | Stream processing |
| Ignoring encryption | Security/access issues | Handle encrypted PDFs |
| Wrong tool for job | Over-engineering | Match tool to complexity |