url-citation-search
指定されたURLを引用している論文やプレプリントを検索し、通常の論文データベースでは見つけにくいブログやドキュメントなどのWebコンテンツの引用情報を、PDFやHTMLから見つけ出して整理・提供するSkill。
📜 元の英語説明(参考)
Find papers and preprints that cite a given URL, especially blogs, docs pages, project pages, or other web content that standard citation indexes often miss. Use when the user provides a URL and wants confirmed citing works, evidence from PDF or HTML references, DOI or arXiv links, BibTeX, or a deduplicated citation report.
🇯🇵 日本人クリエイター向け解説
指定されたURLを引用している論文やプレプリントを検索し、通常の論文データベースでは見つけにくいブログやドキュメントなどのWebコンテンツの引用情報を、PDFやHTMLから見つけ出して整理・提供するSkill。
※ jpskill.com 編集部が日本のビジネス現場向けに補足した解説です。Skill本体の挙動とは独立した参考情報です。
下記のコマンドをコピーしてターミナル(Mac/Linux)または PowerShell(Windows)に貼り付けてください。 ダウンロード → 解凍 → 配置まで全自動。
mkdir -p ~/.claude/skills && cd ~/.claude/skills && curl -L -o url-citation-search.zip https://jpskill.com/download/21293.zip && unzip -o url-citation-search.zip && rm url-citation-search.zip
$d = "$env:USERPROFILE\.claude\skills"; ni -Force -ItemType Directory $d | Out-Null; iwr https://jpskill.com/download/21293.zip -OutFile "$d\url-citation-search.zip"; Expand-Archive "$d\url-citation-search.zip" -DestinationPath $d -Force; ri "$d\url-citation-search.zip"
完了後、Claude Code を再起動 → 普通に「動画プロンプト作って」のように話しかけるだけで自動発動します。
💾 手動でダウンロードしたい(コマンドが難しい人向け)
- 1. 下の青いボタンを押して
url-citation-search.zipをダウンロード - 2. ZIPファイルをダブルクリックで解凍 →
url-citation-searchフォルダができる - 3. そのフォルダを
C:\Users\あなたの名前\.claude\skills\(Win)または~/.claude/skills/(Mac)へ移動 - 4. Claude Code を再起動
⚠️ ダウンロード・利用は自己責任でお願いします。当サイトは内容・動作・安全性について責任を負いません。
🎯 このSkillでできること
下記の説明文を読むと、このSkillがあなたに何をしてくれるかが分かります。Claudeにこの分野の依頼をすると、自動で発動します。
📦 インストール方法 (3ステップ)
- 1. 上の「ダウンロード」ボタンを押して .skill ファイルを取得
- 2. ファイル名の拡張子を .skill から .zip に変えて展開(macは自動展開可)
- 3. 展開してできたフォルダを、ホームフォルダの
.claude/skills/に置く- · macOS / Linux:
~/.claude/skills/ - · Windows:
%USERPROFILE%\.claude\skills\
- · macOS / Linux:
Claude Code を再起動すれば完了。「このSkillを使って…」と話しかけなくても、関連する依頼で自動的に呼び出されます。
詳しい使い方ガイドを見る →- 最終更新
- 2026-05-18
- 取得日時
- 2026-05-18
- 同梱ファイル
- 1
📖 Skill本文(日本語訳)
※ 原文(英語/中国語)を Gemini で日本語化したものです。Claude 自身は原文を読みます。誤訳がある場合は原文をご確認ください。
[Skill 名] url-citation-search
URL引用検索
このスキルを使用する場面
- ユーザーがURLを指定し、そのURLを引用している論文を尋ねる場合。
- ターゲットが標準的な論文ではなく、ブログ記事、ドキュメントページ、プロジェクトページ、デモ、GitHubページ、またはその他のウェブコンテンツである場合。
- ユーザーが検索結果からの可能性のある一致だけでなく、確認済みの引用を求めている場合。
ワークフロー
-
ターゲットページを解決します。
- ページをフェッチし、表示されているタイトルを記録します。
- 存在する場合は、正規URLを抽出します。
http/https、www/non-www、末尾のスラッシュ、移動したドメイン、ミラーまたはクロスポストされたURLなど、明らかなバリアントを保持します。- 直接URLのバリアントとミラーURLを区別して保持します。最終レポートでは、
direct citationとmirror citationを区別する必要があります。 - 著者と日付は、ページを明確にするのに役立つ場合にのみ記録します。
-
検索キーを作成します。
- 完全一致のURL。
- プロトコルなしのホストとパス。
- 安定したスラッグまたは最終パスセグメント。
- 完全一致のページタイトル。
- ページメタデータまたはミラーページによって公開されているタイトルのバリアント。
-
この順序で検索します。
- 一般的なウェブ検索で、完全一致のURLとプロトコルなしのURLを検索します。
- 一般的なウェブ検索で、完全一致のタイトルとスラッグを検索します。
arxiv.org、openreview.net、aclanthology.org、proceedings.neurips.cc、proceedings.mlr.press、dl.acm.org、ieeexplore.ieee.org、nature.com、link.springer.com、ceur-ws.orgなどの学術ソースにサイト制限をかけて検索します。- ミラーまたはクロスポストされたURLも検索します。論文は現在の正規URLではなく、ミラーを引用していることがよくあります。
- 直接URLまたはタイトル検索が少ない場合は、トピック候補プールを作成し、可能性のある論文をバッチスキャンします。これは、arXivで全文検索が正確な引用文字列を見逃す場合に特に役立ちます。
-
すべての候補を検証します。
- 論文のPDF、HTML参照リスト、または本文中の参考文献にターゲットURL、タイトル、スラッグ、または検証済みのミラーURLが含まれている場合にのみ、その論文を保持します。
- 検索スニペットだけでは不十分です。
- 抽出されたテキストまたはPDFリンク注釈に正確なURLが表示されている場合、PDFのみの証拠も許容されます。
- 出版社の記事ページでは、
citation_referenceなどのHTMLメタデータや専用の参考文献ページで参照を公開している場合があります。PDFをスクレイピングする前にこれらを使用します。 - arXivのHTML参考文献エントリは、表示されているテキストにURLが省略されている場合でも、
External Links内に実際のターゲットを隠している場合があります。レンダリングされたテキストだけでなく、基になるhrefを検査します。 - 参考文献ページ、プロジェクトページ、検索インデックスは、引用元の実際の参照エントリを公開していない限り、候補を見つけるためのものであり、最終的な証明ではありません。
-
重複排除と正規化を行います。
- 同じ論文がプレプリントと出版論文の両方として存在する場合、メインリストでは出版版を優先し、プレプリントはアクセスフォールバックとして保持します。
- 正式なバージョンが存在しない場合は、本物のプレプリントを保持します。
- 出版版がプレプリントで見られたウェブ引用を保持していると仮定しないでください。各バージョンを個別に検証します。
- 公式の同一サイトバリアントとミラーを区別して保持します。例:
/engineering/...と/research/...、名前が変更された公式パス、または同じサイト上のルートページと/homeページ。 - 検証が不完全な場合は、
confirmedとcandidateを区別します。
出力
ユーザーの要求に合致する最も軽量な形式を選択します。
- 簡潔なリスト:タイトル、年、種類、およびランディングリンク。
- 引用レポート:タイトル、リンク、DOIまたはarXiv ID、証拠メモ、および出版済みかプレプリントか。
- 必要に応じて、
direct、official variant、mirror引用を区別します。 - Bibモード:引用論文のBibTeXを返します。ユーザーが明示的に要求した場合にのみ、ターゲットURLのBibTeXを返します。
重要なヒューリスティクス
- 標準的な引用インデックスはウェブページを見逃すことが多いため、URL、タイトル、スラッグによる逆検索は、
cited byの数よりも通常信頼性が高いです。 - arXivの全文検索は、一部の引用文字列を見逃します。何も返されない場合は、一般検索に戻り、候補のPDFまたはHTMLを直接検査します。
- arXivでは、広範なトピック検索と候補HTML参照リストのバッチ検査により、正確な文字列による全文検索が見逃す引用を回復できます。
- ドメインの移動やクロスポストはよくあります。何もページを引用していないと結論付ける前に、正規タグと明らかなミラーを確認してください。
- 公式バリアントもよくあります。論文は、シード論文の正確なURLではなく、名前が変更されたり移行されたりしたファーストパーティURLを引用する場合があります。
- PDFテキスト抽出は損失を伴います。表示されている引用テキストがない場合は、PDFリンク注釈または生の抽出文字列でURLを検査してください。
- 出版社のHTMLは、参照がすでにページメタデータに正規化されている可能性があるため、検証においてPDFよりも優れている場合があります。
- 誤検知は積極的に拒否します。同じトピックに関する論文は、参照が目に見える形で存在しない限り、引用ではありません。
📜 原文 SKILL.md(Claudeが読む英語/中国語)を展開
URL Citation Search
Use this skill for
- A user gives a URL and asks which papers cited it.
- The target is a blog post, documentation page, project page, demo, GitHub page, or other web content rather than a standard paper.
- The user wants confirmed citations, not just likely matches from search results.
Workflow
- Resolve the target page.
- Fetch the page and record the visible title.
- Extract the canonical URL if present.
- Keep obvious variants:
http/https,www/non-www, trailing slash, moved domains, and mirrored or cross-posted URLs. - Keep direct-URL variants separate from mirror URLs. The final report should distinguish
direct citationfrommirror citation. - Record author and date only when they help disambiguate the page.
- Build search keys.
- Exact full URL.
- Host plus path without protocol.
- Stable slug or final path segment.
- Exact page title.
- Title variants exposed by the page metadata or mirror pages.
- Search in this order.
- Exact full URL and protocol-less URL in a general web search.
- Exact title and slug in a general web search.
- Site-restricted searches on academic sources such as
arxiv.org,openreview.net,aclanthology.org,proceedings.neurips.cc,proceedings.mlr.press,dl.acm.org,ieeexplore.ieee.org,nature.com,link.springer.com, andceur-ws.org. - Mirror or cross-post URLs too. Papers often cite the mirror instead of the current canonical URL.
- If direct URL or title search is sparse, build a topical candidate pool and batch-scan likely papers. This is especially useful on arXiv when full-text search misses exact quoted strings.
- Verify every candidate.
- Keep a work only if its PDF, HTML reference list, or in-text bibliography contains the target URL, title, slug, or a verified mirror URL.
- Search snippets alone are not enough.
- PDF-only evidence is acceptable when the exact URL appears in extracted text or PDF link annotations.
- Publisher article pages may expose references in HTML metadata such as
citation_referenceor dedicated bibliography pages. Use those before scraping PDFs. - arXiv HTML bibliography entries may hide the real target inside
External Linkseven when the visible text omits the URL. Inspect the underlying href, not just the rendered text. - Bibliography pages, project pages, and search indexes are candidate finders, not final proof, unless they expose the actual reference entry for the citing work.
- Deduplicate and normalize.
- If the same work exists as both a preprint and a published paper, prefer the published version in the main list and keep the preprint as an access fallback.
- Keep genuine preprints when no formal version exists.
- Do not assume the published version preserves a web citation seen in the preprint. Verify each version separately.
- Keep official same-site variants separate from mirrors. Examples:
/engineering/...versus/research/..., renamed official paths, or root-versus-/homepages on the same site. - Separate
confirmedfromcandidatewhen verification is incomplete.
Output
Choose the lightest format that matches the user's ask.
- Brief list: title, year, type, and landing link.
- Citation report: title, link, DOI or arXiv ID, evidence note, and whether it is published or a preprint.
- When useful, distinguish
direct,official variant, andmirrorcitation. - Bib mode: return BibTeX for the citing papers. Return BibTeX for the target URL only if the user explicitly asks for it.
Heuristics That Matter
- Standard citation indexes often miss web pages, so reverse search on URL, title, and slug is usually more reliable than
cited bycounts. - arXiv full-text search misses some quoted strings. If it returns nothing, switch back to general search and inspect candidate PDFs or HTML directly.
- On arXiv, broad topic searches plus batch inspection of candidate HTML reference lists can recover citations that exact-string full-text search misses.
- Moved domains and cross-posts are common. Check canonical tags and obvious mirrors before concluding that nothing cites the page.
- Official variants are common too. A paper may cite a renamed or migrated first-party URL rather than the exact URL from the seed paper.
- PDF text extraction is lossy. If the visible citation text is missing, inspect PDF link annotations or raw extracted strings for the URL.
- Publisher HTML can be better than PDF for verification because references may already be normalized into page metadata.
- Reject false positives aggressively: a paper on the same topic is not a citation unless the reference is visible.