jpskill.com
📄 ドキュメント コミュニティ

figure-results-review

AIや機械学習の実験結果を論文や会議で発表する前に、図表、グラフ、説明文、全体の視覚スタイルを専門的にレビューするSkill。

📜 元の英語説明(参考)

Review ML or AI experiment figures, tables, plots, captions, result narratives, and paper visual style before they are shown in a paper, advisor meeting, report, slide deck, rebuttal, or submission. Use this skill whenever the user has experimental results, plots, tables, metrics, screenshots, captions, draft result sections, or wants to audit figure style choices such as color, typography, markers, symbols, line widths, sizing, and venue-consistent visual conventions.

🇯🇵 日本人クリエイター向け解説

一言でいうと

AIや機械学習の実験結果を論文や会議で発表する前に、図表、グラフ、説明文、全体の視覚スタイルを専門的にレビューするSkill。

※ jpskill.com 編集部が日本のビジネス現場向けに補足した解説です。Skill本体の挙動とは独立した参考情報です。

⚠️ ダウンロード・利用は自己責任でお願いします。当サイトは内容・動作・安全性について責任を負いません。

🎯 このSkillでできること

下記の説明文を読むと、このSkillがあなたに何をしてくれるかが分かります。Claudeにこの分野の依頼をすると、自動で発動します。

📦 インストール方法 (3ステップ)

  1. 1. 上の「ダウンロード」ボタンを押して .skill ファイルを取得
  2. 2. ファイル名の拡張子を .skill から .zip に変えて展開(macは自動展開可)
  3. 3. 展開してできたフォルダを、ホームフォルダの .claude/skills/ に置く
    • · macOS / Linux: ~/.claude/skills/
    • · Windows: %USERPROFILE%\.claude\skills\

Claude Code を再起動すれば完了。「このSkillを使って…」と話しかけなくても、関連する依頼で自動的に呼び出されます。

詳しい使い方ガイドを見る →
最終更新
2026-05-17
取得日時
2026-05-17
同梱ファイル
1

📖 Skill本文(日本語訳)

※ 原文(英語/中国語)を Gemini で日本語化したものです。Claude 自身は原文を読みます。誤訳がある場合は原文をご確認ください。

[Skill 名] figure-results-review

図表結果レビュー

図、表、プロット、キャプション、および結果の記述が論文の証拠や会議資料になる前に監査します。

このスキルを使用する状況:

  • ユーザーが図、表、プロット、結果のスクリーンショット、キャプション、結果セクション、または実験的証拠を含むスライドを持っている場合
  • 論文の主張を実際に表示されている証拠と照合する必要がある場合
  • プロットにベースライン、エラーバー、シード、ラベル、単位、または公平性のコンテキストが欠けている可能性がある場合
  • 表のレイアウトが主要な比較を隠したり、結果を実際よりも弱く見せたりする場合
  • 論文の図に一貫した視覚スタイル(カラーパレット、マーカー、記号、線幅、フォント、サイズ、表記)が必要な場合
  • 新しい結果について、記述を更新するか、実験を再実行するか、失敗を診断するか、主張を絞り込むかを決定する必要がある場合
  • 反論のために、きれいな結果表または簡潔な視覚的回答が必要な場合
  • アドバイザー会議で、決定を明確にする図が必要な場合

このスキルを最初から実験を設計するために使用しないでください。結果が存在する前に experiment-design-planner を使用してください。結果が驚くべきものや壊れている理由が主な問題である場合は result-diagnosis を使用してください。証拠がすでに受け入れられた後の主要なタスクが散文スタイルである場合は conference-writing-adapter を使用してください。

このスキルと組み合わせて使用するスキル:

  • 図/表を論文の主張、セクション、レビュアーのリスク、およびアクションにリンクする必要がある場合は paper-evidence-board
  • プロットされた結果が疑わしい、不安定、否定的、または矛盾している場合は result-diagnosis
  • 視覚が欠落している、弱い、または不公平なベースラインを露出させる場合は baseline-selection-audit
  • 修正に新しい実験、アブレーション、コントロール、またはメトリックが必要な場合は experiment-design-planner
  • 図のレビューの前に生の結果を構造化されたレポートにする必要がある場合は experiment-report-writer
  • 最終的な図の記述または視覚スタイルをターゲット会場に適応させる必要がある場合は conference-writing-adapter
  • 主張/証拠/リスク/アクションの更新をセッション間で保持する必要がある場合は research-project-memory

スキルディレクトリのレイアウト

<installed-skill-dir>/
├── SKILL.md
└── references/
    ├── caption-and-narrative.md
    ├── claim-support.md
    ├── memory-writeback.md
    ├── paper-visual-style.md
    ├── report-template.md
    ├── statistical-evidence.md
    └── visual-integrity.md

段階的読み込み

  • 常に references/claim-support.mdreferences/visual-integrity.md、および references/statistical-evidence.md を読んでください。
  • 図/表が論文、スライドデッキ、反論、カメラレディ、または会場固有の書き換えを意図している場合は references/paper-visual-style.md を読んでください。
  • キャプション、結果の散文、スライドテキスト、または論文の図の呼び出しを修正する場合は references/caption-and-narrative.md を読んでください。
  • 最終レビューを作成する前に references/report-template.md を読んでください。
  • プロジェクトに memory/、コンポーネント .agent/ フォルダーがある場合、またはユーザーが永続的なプロジェクトメモリを要求する場合は references/memory-writeback.md を読んでください。
  • 期待されるプロットまたは表の慣例がターゲット会場、ベンチマーク、または最近の論文スタイルに依存する場合は、現在受け入れられている論文、公式のベンチマークプロトコル、またはユーザー提供の例で確認してください。
  • 実際の画像/表を検査できない場合は、提供されたデータ/キャプション/散文を監査し、視覚レイアウトの判断を未検証として明確にマークしてください。

核となる原則

  • 図は特定の主張の証拠であり、装飾ではありません。
  • すべてのプロット/表は、レビュアーの1つの質問に答えるべきです。
  • 主要な比較は、視覚的にも数値的にも簡単に見つけられるべきです。
  • キャプションは、論文を検索することなく結果を解釈するのに十分な設定を記述する必要があります。
  • 主張が小さな違いに依存する場合、統計的不確実性、シード、および分散が重要です。
  • 解釈に影響を与える場合、計算、データ、ベースライン、およびプロトコルの公平性が可視である必要があります。
  • 論文の図は、意図的な視覚言語を共有すべきです。スタイル選択は、レビュアーが最初に気づくものを制御するため、記述の一部です。
  • 主張を支持しない美しいプロットは、修正または削除されるべきです。
  • 新しい結果は、主張、記述、レビュアーのリスク、および次のアクションを更新する必要があります。

ステップ1 - 証拠コンテキストの回復

収集するもの:

  • 図/表のファイルパス、スクリーンショット、生データ、キャプション、または結果の散文
  • 結果が支持することを意図している論文の主張またはセクション
  • 実験設定:データセット、モデル、ベースライン、メトリック、シード、分割、ハイパーパラメータ、プロトコル
  • ターゲットオーディエンス:論文、アドバイザー会議、スライド、反論、内部レポート、または付録
  • ターゲット会場またはベンチマークの期待
  • 現在の論文の場所(もしあれば)
  • CLM-###EVD-###FIG-###TAB-###RSK-###、または ACT-### などのリンクされたプロジェクトメモリID

意図された証拠関係を書き直します:

この図/表は、[設定] の下で [メトリック/比較/傾向] であるため、[主張] を示すことになっています。

この文が書けない場合は、視覚を磨く前に paper-evidence-board にルーティングしてください。

ステップ2 - 主張の支持を監査する

references/claim-support.md を読んでください。

各図または表について、次の質問に答えてください:

  • それはどのような正確な主張を支持していますか?
  • 表示されている証拠はその主張に十分ですか?
  • 主張は測定された設定に対して広すぎませんか?
  • ベースライン、アブレーション、コントロール、または診断が欠落していませんか?
  • 結果は他の図、表、またはセクションと矛盾していませんか?
  • 結果は主要論文の資料、付録の資料、診断の資料、または未準備の資料ですか?

次のいずれかのステータスを割り当ててください:

  • supports-claim
  • supports-narrower-claim
  • ambiguous
  • contradicts-claim
  • diagnostic-only
  • not-ready

ステップ3 - 視覚と表の整合性を監査する

references/visual-integrity.md を読んでください。

確認事項:

  • 軸、ラベル、単位、スケール、および変換
  • 凡例の読みやすさとメソッド名
  • メソッド、データセット、メトリック、およびアブレーションの順序
  • 主要な結果が視覚的に際立っているか
  • 表のグループ化、太字、小数点、欠損値、および脚注
  • 色、マーカー、線種、またはハッチングがグレースケールでも読みやすいか
  • 図のサイズが1列、2列、スライド、または付録の使用に適しているか
  • キャプションとラベルが実際にプロットされたデータと一致しているか

共同で発生する問題をすべてフラグ立てしてください。

📜 原文 SKILL.md(Claudeが読む英語/中国語)を展開

Figure Results Review

Audit figures, tables, plots, captions, and result narratives before they become paper evidence or meeting material.

Use this skill when:

  • the user has a figure, table, plot, result screenshot, caption, result section, or slide with experimental evidence
  • a paper claim needs to be checked against the actual displayed evidence
  • a plot may be missing baselines, error bars, seeds, labels, units, or fairness context
  • a table layout hides the main comparison or makes the result look weaker than it is
  • paper figures need a consistent visual style: color palette, markers, symbols, line widths, fonts, sizing, and notation
  • new results require deciding whether to update writing, rerun experiments, diagnose failures, or narrow claims
  • a rebuttal needs a clean result table or concise visual answer
  • an advisor meeting needs figures that make the decision obvious

Do not use this skill to design experiments from scratch. Use experiment-design-planner before results exist. Use result-diagnosis when the primary issue is why a result is surprising or broken. Use conference-writing-adapter when the main task is prose style after the evidence is already accepted.

Pair this skill with:

  • paper-evidence-board when figures/tables must be linked to paper claims, sections, reviewer risks, and actions
  • result-diagnosis when a plotted result is suspicious, unstable, negative, or contradictory
  • baseline-selection-audit when the visual exposes missing, weak, or unfair baselines
  • experiment-design-planner when the fix requires new experiments, ablations, controls, or metrics
  • experiment-report-writer when raw results need a structured report before figure review
  • conference-writing-adapter when the final figure narrative or visual style must be adapted to a target venue
  • research-project-memory when claim/evidence/risk/action updates should persist across sessions

Skill Directory Layout

<installed-skill-dir>/
├── SKILL.md
└── references/
    ├── caption-and-narrative.md
    ├── claim-support.md
    ├── memory-writeback.md
    ├── paper-visual-style.md
    ├── report-template.md
    ├── statistical-evidence.md
    └── visual-integrity.md

Progressive Loading

  • Always read references/claim-support.md, references/visual-integrity.md, and references/statistical-evidence.md.
  • Read references/paper-visual-style.md when figures/tables are intended for a paper, slide deck, rebuttal, camera-ready, or venue-specific rewrite.
  • Read references/caption-and-narrative.md when revising captions, result prose, slide text, or paper figure callouts.
  • Read references/report-template.md before writing the final review.
  • Read references/memory-writeback.md when the project has memory/, component .agent/ folders, or the user asks for persistent project memory.
  • If the expected plotting or table conventions depend on a target venue, benchmark, or recent paper style, verify with current accepted papers, official benchmark protocols, or user-provided exemplars.
  • If the actual image/table cannot be inspected, audit the provided data/caption/prose and clearly mark visual-layout judgments as unverified.

Core Principles

  • A figure is evidence for a specific claim, not decoration.
  • Every plot/table should answer one reviewer question.
  • The main comparison should be visually and numerically easy to find.
  • Captions must state enough setup for the result to be interpreted without searching the paper.
  • Statistical uncertainty, seeds, and variance matter when the claim depends on small differences.
  • Compute, data, baseline, and protocol fairness must be visible when they affect interpretation.
  • Paper figures should share a deliberate visual language. Style choices are part of writing because they control what reviewers notice first.
  • A beautiful plot that does not support the claim should be revised or cut.
  • New results must update claims, writing, reviewer risks, and next actions.

Step 1 - Recover Evidence Context

Collect:

  • figure/table file path, screenshot, raw data, caption, or result prose
  • paper claim or section the result is meant to support
  • experiment setup: dataset, model, baseline, metric, seed, split, hyperparameters, protocol
  • target audience: paper, advisor meeting, slide, rebuttal, internal report, or appendix
  • target venue or benchmark expectations
  • current paper location, if any
  • linked project memory IDs such as CLM-###, EVD-###, FIG-###, TAB-###, RSK-###, or ACT-###

Rewrite the intended evidence relation:

This figure/table is supposed to show that [claim] because [metric/comparison/trend] under [setup].

If that sentence cannot be written, route to paper-evidence-board before polishing the visual.

Step 2 - Audit Claim Support

Read references/claim-support.md.

For each figure or table, answer:

  • what exact claim does it support?
  • is the displayed evidence sufficient for that claim?
  • is the claim too broad for the measured setup?
  • are baselines, ablations, controls, or diagnostics missing?
  • does the result contradict another figure, table, or section?
  • is the result main-paper material, appendix material, diagnostic material, or not ready?

Assign one status:

  • supports-claim
  • supports-narrower-claim
  • ambiguous
  • contradicts-claim
  • diagnostic-only
  • not-ready

Step 3 - Audit Visual and Table Integrity

Read references/visual-integrity.md.

Check:

  • axes, labels, units, scales, and transformations
  • legend readability and method names
  • ordering of methods, datasets, metrics, and ablations
  • whether the main result is visually salient
  • table grouping, bolding, decimals, missing values, and footnotes
  • whether color, markers, line styles, or hatching remain readable in grayscale
  • whether figure size works for one-column, two-column, slide, or appendix usage
  • whether captions and labels match the actual plotted data

Flag any issue that could cause a reviewer to misread the result.

Step 4 - Audit Paper Visual Style

Read references/paper-visual-style.md when the output is paper-facing.

Check:

  • color palette and colorblind/grayscale robustness
  • stable method-to-color and method-to-marker mapping across all figures
  • line width, marker size, hatch, symbol, and notation consistency
  • font size, tick density, label length, and final-column readability
  • figure dimensions for one-column, two-column, appendix, or slide use
  • whether visual emphasis matches the paper's claim hierarchy
  • whether the main method is recognizable without relying only on color
  • whether theorem/method symbols in plots match the paper notation

If the paper has no visual style policy, propose one and record it in paper/.agent/ or .agent/conference-writing/project-style.md when appropriate.

Step 5 - Audit Statistical and Experimental Evidence

Read references/statistical-evidence.md.

Check:

  • number of seeds or repeated runs
  • variance, confidence intervals, standard deviation, or standard error
  • significance or effect-size interpretation when differences are small
  • data split and leakage risk
  • metric definition and averaging
  • baseline fairness and tuning budget
  • compute or speed reporting when efficiency is part of the claim
  • failure cases or negative results that should be shown

If the plot lacks necessary uncertainty, decide whether to rerun, add error bars, weaken the claim, or move the result to appendix/diagnostic status.

Step 6 - Review Caption and Result Narrative

Read references/caption-and-narrative.md when output text needs revision.

For each figure/table, produce:

  • caption diagnosis
  • revised caption or caption outline
  • one-sentence paper callout
  • claims to avoid in nearby prose
  • reviewer question answered
  • missing setup details to add

Captions should not oversell. They should state the setup, comparison, metric, and takeaway.

Step 7 - Route Fixes

For every issue, route to one or more actions:

  • edit-figure: labels, ordering, scale, legend, layout, or visual emphasis
  • edit-table: grouping, decimals, bolding, footnotes, missing values, or row/column order
  • rewrite-caption: setup, metric, takeaway, caveat, or claim alignment
  • rewrite-results-text: nearby paper prose overclaims or misses the takeaway
  • define-visual-style: missing or inconsistent paper visual style policy
  • restyle-figure: color, marker, line width, font size, symbol, panel layout, or emphasis
  • rerun: missing seeds, variance, baseline, metric, or protocol
  • diagnose-result: suspicious, negative, unstable, or contradictory pattern
  • baseline-audit: missing or unfair baseline
  • narrow-claim: evidence only supports a smaller statement
  • move-to-appendix: useful but not central enough for main paper
  • cut: visual does not support a paper need

Name the next skill when appropriate.

Step 8 - Write the Review Report

Read references/report-template.md.

If saving to a project and no path is given, use:

docs/results/figure_results_review_YYYY-MM-DD_<short-name>.md

The report must include:

  • figure/table inventory
  • claim-support status
  • visual/table integrity issues
  • visual style policy and consistency issues
  • statistical evidence issues
  • caption and narrative fixes
  • reviewer-risk forecast
  • routed actions and next skills
  • memory update section

Step 9 - Write Back to Project Memory

Read references/memory-writeback.md when memory exists.

Update the smallest useful set of entries:

  • memory/evidence-board.md: figure/table evidence status, setup, and linked claims
  • memory/claim-board.md: claims supported, narrowed, contradicted, or not ready
  • memory/risk-board.md: reviewer risks from visual ambiguity, missing uncertainty, weak baselines, or overclaiming
  • memory/action-board.md: figure edits, reruns, caption fixes, result diagnosis, or claim revisions
  • paper/.agent/: figure/table map, paper locations, caption state, and stale visual warnings
  • .agent/conference-writing/project-style.md: venue-facing figure style decisions when conference adaptation is active
  • worktree .agent/worktree-status.md: result-generation or plotting tasks and exit conditions

Use certainty labels:

  • verified for values checked against raw data, logs, or source figures
  • user-stated for user-supplied context
  • inferred for reviewer-risk and narrative judgments
  • unverified for visual or statistical claims that could not be inspected

Final Sanity Check

Before finalizing:

  • every figure/table has a linked claim and reviewer question
  • main comparison is easy to find
  • axes, units, legends, captions, and table labels are unambiguous
  • colors, markers, fonts, symbols, and figure sizes are consistent across the paper
  • uncertainty is present or the lack of uncertainty is justified
  • baseline and compute fairness are visible when relevant
  • overclaims are narrowed
  • fixes are routed to concrete next actions or skills
  • project memory is updated when present