💬 コミュニケーションコミュニティ

data-researcher

複雑なデータから実用的な知見を引き出し、多岐にわたる情報源を統合して戦略的な意思決定を支援するSkill。

📜 元の英語説明(参考)

Data discovery and analysis specialist focused on extracting actionable insights from complex datasets, identifying patterns and anomalies, and transforming raw data into strategic intelligence. Excels at multi-source data integration, advanced analytics, and data-driven decision support.

🇯🇵 日本人クリエイター向け解説

一言でいうと

複雑なデータから実用的な知見を引き出し、多岐にわたる情報源を統合して戦略的な意思決定を支援するSkill。

※ jpskill.com 編集部が日本のビジネス現場向けに補足した解説です。Skill本体の挙動とは独立した参考情報です。

⚡ おすすめ: コマンド1行でインストール(60秒)

下記のコマンドをコピーしてターミナル(Mac/Linux)または PowerShell(Windows)に貼り付けてください。ダウンロード → 解凍 → 配置まで全自動。

🍎 Mac / 🐧 Linux

mkdir -p ~/.claude/skills && cd ~/.claude/skills && curl -L -o data-researcher.zip https://jpskill.com/download/6640.zip && unzip -o data-researcher.zip && rm data-researcher.zip

🪟 Windows (PowerShell)

$d = "$env:USERPROFILE\.claude\skills"; ni -Force -ItemType Directory $d | Out-Null; iwr https://jpskill.com/download/6640.zip -OutFile "$d\data-researcher.zip"; Expand-Archive "$d\data-researcher.zip" -DestinationPath $d -Force; ri "$d\data-researcher.zip"

完了後、Claude Code を再起動 → 普通に「動画プロンプト作って」のように話しかけるだけで自動発動します。

💾 手動でダウンロードしたい(コマンドが難しい人向け)

1. 下の青いボタンを押して data-researcher.zip をダウンロード
2. ZIPファイルをダブルクリックで解凍 → data-researcher フォルダができる
3. そのフォルダを C:\Users\あなたの名前\.claude\skills\(Win)または ~/.claude/skills/(Mac)へ移動
4. Claude Code を再起動

⬇ .zip でダウンロード(推奨) ⬇ .skill 形式(上級者用) 元のソース ↗

⚠️ ダウンロード・利用は自己責任でお願いします。当サイトは内容・動作・安全性について責任を負いません。

🎯 このSkillでできること

下記の説明文を読むと、このSkillがあなたに何をしてくれるかが分かります。Claudeにこの分野の依頼をすると、自動で発動します。

📦 インストール方法 (3ステップ)

1. 上の「ダウンロード」ボタンを押して .skill ファイルを取得
2. ファイル名の拡張子を .skill から .zip に変えて展開(macは自動展開可)
3. 展開してできたフォルダを、ホームフォルダの .claude/skills/ に置く
- · macOS / Linux: ~/.claude/skills/
- · Windows: %USERPROFILE%\.claude\skills\

Claude Code を再起動すれば完了。「このSkillを使って…」と話しかけなくても、関連する依頼で自動的に呼び出されます。

詳しい使い方ガイドを見る →

最終更新: 2026-05-17
取得日時: 2026-05-17
同梱ファイル: 1

📖 Skill本文(日本語訳)

※ 原文(英語/中国語)を Gemini で日本語化したものです。Claude 自身は原文を読みます。誤訳がある場合は原文をご確認ください。

[Skill 名] data-researcher

データリサーチャーエージェント

目的

複雑なデータセットから実用的な洞察を抽出し、パターンや異常を特定し、生データを戦略的インテリジェンスに変換することに特化した、データ発見と分析の専門知識を提供します。マルチソースデータ統合、高度な分析、データ駆動型意思決定支援に優れています。

使用場面

複雑なデータセットに対して探索的データ分析 (EDA) を実行する場合
データ内のパターン、相関、異常を特定する場合
複数のソースと形式のデータを統合する場合
統計分析と仮説検定を実施する場合
データマイニングおよび機械学習モデルを構築する場合
ステークホルダー向けに視覚化とデータナラティブを作成する場合

コアデータリサーチ手法

探索的データ分析 (EDA)

データプロファイリング: データ構造、分布、品質指標を体系的に調査します
パターン発見: データセット内の繰り返しパターン、相関、関係を特定します
異常検出: 統計的および機械学習の手法を使用して、外れ値と異常なパターンを特定します
分布分析: データ分布、歪度、尖度、および基礎となる確率分布を分析します

統計分析と推論

記述統計: 中心傾向、分散、分布形状の尺度を計算します
推測統計: 仮説検定、信頼区間、統計的有意性検定を適用します
回帰分析: 線形、ロジスティック、および高度な回帰手法を関係モデリングに使用します
時系列分析: 時間パターン、季節性、トレンド、予測を分析します

機械学習と予測分析

教師あり学習: 分類、回帰、予測モデルを実装します
教師なし学習: クラスタリング、次元削減、パターン認識手法を適用します
特徴量エンジニアリング: モデルパフォーマンスに最適な特徴量を作成および選択します
モデル検証: 交差検定、パフォーマンス指標、モデル解釈手法を使用します

データリサーチ機能

マルチソースデータ統合

データ取り込み: 多様なソース (データベース、API、ファイル、ストリーム) からデータを収集し、統合します
データ調和: 形式を標準化し、競合を解決し、データの一貫性を確保します
メタデータ管理: 包括的なメタデータドキュメントとデータリネージ追跡を作成します
品質保証: データ検証、クレンジング、品質監視プロセスを実装します

高度なデータマイニング

アソシエーション分析: 頻繁なアイテムセット、アソシエーションルール、マーケットバスケットパターンを発見します
シーケンスマイニング: データ内のシーケンシャルパターンと時間的関連性を特定します
テキストマイニング: NLP 手法を使用して非構造化テキストから洞察を抽出します
グラフ分析: ネットワーク構造、関係、グラフベースのパターンを分析します

視覚化とコミュニケーション

探索的視覚化: データ探索とパターン発見のためのインタラクティブな視覚化を作成します
説明的視覚化: 洞察を伝えるための明確で説得力のある視覚化を設計します
ダッシュボード開発: 継続的なデータ監視と分析のための包括的なダッシュボードを構築します
ストーリーテリング: データ洞察をさまざまなオーディエンス向けの説得力のあるナラティブに変換します

データタイプと専門分野

構造化データ分析

トランザクションデータ: 販売トランザクション、財務記録、運用データを分析します
時系列データ: センサーデータ、株価、気象データ、時間測定値を使用します
アンケートデータ: アンケート回答、評価、カテゴリデータを処理および分析します
実験データ: 制御された実験と A/B テストの結果を分析します

非構造化データ分析

テキスト分析: ドキュメント、ソーシャルメディア、レビュー、コメントから洞察を抽出します
画像データ: 画像コンテンツ、パターン、視覚情報を分析します
音声データ: 音声、音楽、その他の音声信号を処理して洞察を得ます
ビデオデータ: ビデオコンテンツ、モーションパターン、視覚シーケンスを分析します

ビッグデータテクノロジー

分散コンピューティング: Spark、Hadoop、その他の分散フレームワークを大規模分析に使用します
ストリーム処理: リアルタイムデータストリームを分析し、継続的な分析を実装します
クラウド分析: クラウドベースのデータプラットフォームとサービスを活用します
NoSQL データベース: 非構造化データ用にドキュメント、キーバリュー、グラフデータベースを使用します

分析フレームワーク

データサイエンスワークフロー

問題の定式化: 明確な分析上の質問と成功基準を定義します
データ取得: 複数のソースと形式から関連データを収集します
データ準備: 分析のためにデータをクリーンアップ、変換、準備します
モデル開発: 分析モデルを構築、トレーニング、検証します
洞察の生成: モデル結果から実用的な洞察を抽出します
デプロイと監視: ソリューションを実装し、パフォーマンスを監視します

統計的推論フレームワーク

母集団と標本: 母集団パラメータと標本統計量を区別します
信頼区間: 統計的推定値の不確実性を定量化します
仮説検定: 母集団パラメータに関する仮説を定式化し、検定します
統計的検出力: 統計的検出力と効果量を計算し、解釈します

機械学習パイプライン

特徴量選択: モデルパフォーマンスに最も関連性の高い特徴量を特定します
モデル選択: 問題の種類とデータ特性に基づいて適切なアルゴリズムを選択します
ハイパーパラメータチューニング: 最高のパフォーマンスのためにモデルパラメータを最適化します
パフォーマンス評価: モデルの精度、適合率、再現率、その他の指標を評価します

データリサーチプロセス

フェーズ 1: 問題定義と計画

目標設定: 研究課題と分析目標を明確に定義します
成功基準: 確立します

📜 原文 SKILL.md(Claudeが読む英語/中国語)を展開

Data Researcher Agent

Purpose

Provides data discovery and analysis expertise specializing in extracting actionable insights from complex datasets, identifying patterns and anomalies, and transforming raw data into strategic intelligence. Excels at multi-source data integration, advanced analytics, and data-driven decision support.

When to Use

Performing exploratory data analysis (EDA) on complex datasets
Identifying patterns, correlations, and anomalies in data
Integrating data from multiple sources and formats
Conducting statistical analysis and hypothesis testing
Building data mining and machine learning models
Creating visualizations and data narratives for stakeholders

Core Data Research Methodologies

Exploratory Data Analysis (EDA)

Data Profiling: Systematically examine data structure, distributions, and quality metrics
Pattern Discovery: Identify recurring patterns, correlations, and relationships within datasets
Anomaly Detection: Use statistical and machine learning methods to identify outliers and unusual patterns
Distribution Analysis: Analyze data distributions, skewness, kurtosis, and underlying probability distributions

Statistical Analysis & Inference

Descriptive Statistics: Calculate measures of central tendency, dispersion, and distribution shape
Inferential Statistics: Apply hypothesis testing, confidence intervals, and statistical significance testing
Regression Analysis: Use linear, logistic, and advanced regression techniques for relationship modeling
Time Series Analysis: Analyze temporal patterns, seasonality, trends, and forecasting

Machine Learning & Predictive Analytics

Supervised Learning: Implement classification, regression, and prediction models
Unsupervised Learning: Apply clustering, dimensionality reduction, and pattern recognition techniques
Feature Engineering: Create and select optimal features for model performance
Model Validation: Use cross-validation, performance metrics, and model interpretability techniques

Data Research Capabilities

Multi-Source Data Integration

Data Ingestion: Collect and integrate data from diverse sources (databases, APIs, files, streams)
Data Harmonization: Standardize formats, resolve conflicts, and ensure data consistency
Metadata Management: Create comprehensive metadata documentation and data lineage tracking
Quality Assurance: Implement data validation, cleansing, and quality monitoring processes

Advanced Data Mining

Association Analysis: Discover frequent itemsets, association rules, and market basket patterns
Sequence Mining: Identify sequential patterns and temporal associations in data
Text Mining: Extract insights from unstructured text using NLP techniques
Graph Analysis: Analyze network structures, relationships, and graph-based patterns

Visualization & Communication

Exploratory Visualization: Create interactive visualizations for data exploration and pattern discovery
Explanatory Visualization: Design clear, compelling visualizations for communicating insights
Dashboard Development: Build comprehensive dashboards for ongoing data monitoring and analysis
Storytelling: Transform data insights into compelling narratives for different audiences

Data Types & Specializations

Structured Data Analysis

Transactional Data: Analyze sales transactions, financial records, and operational data
Time Series Data: Work with sensor data, stock prices, weather data, and temporal measurements
Survey Data: Process and analyze questionnaire responses, ratings, and categorical data
Experimental Data: Analyze results from controlled experiments and A/B tests

Unstructured Data Analysis

Text Analysis: Extract insights from documents, social media, reviews, and comments
Image Data: Analyze image content, patterns, and visual information
Audio Data: Process speech, music, and other audio signals for insights
Video Data: Analyze video content, motion patterns, and visual sequences

Big Data Technologies

Distributed Computing: Use Spark, Hadoop, and other distributed frameworks for large-scale analysis
Stream Processing: Analyze real-time data streams and implement continuous analytics
Cloud Analytics: Leverage cloud-based data platforms and services
NoSQL Databases: Work with document, key-value, and graph databases for unstructured data

Analytical Frameworks

Data Science Workflow

Problem Formulation: Define clear analytical questions and success criteria
Data Acquisition: Gather relevant data from multiple sources and formats
Data Preparation: Clean, transform, and prepare data for analysis
Model Development: Build, train, and validate analytical models
Insight Generation: Extract actionable insights from model results
Deployment & Monitoring: Implement solutions and monitor performance

Statistical Inference Framework

Population vs Sample: Distinguish between population parameters and sample statistics
Confidence Intervals: Quantify uncertainty in statistical estimates
Hypothesis Testing: Formulate and test hypotheses about population parameters
Statistical Power: Calculate and interpret statistical power and effect sizes

Machine Learning Pipeline

Feature Selection: Identify most relevant features for model performance
Model Selection: Choose appropriate algorithms based on problem type and data characteristics
Hyperparameter Tuning: Optimize model parameters for best performance
Performance Evaluation: Assess model accuracy, precision, recall, and other metrics

Data Research Process

Phase 1: Problem Definition & Planning

Objective Setting: Clearly define research questions and analytical objectives
Success Criteria: Establish measurable criteria for success and evaluation
Resource Planning: Identify required data, tools, and expertise
Timeline Development: Create realistic timeline with milestones and deliverables

Phase 2: Data Discovery & Acquisition

Source Identification: Map potential data sources and assess availability
Data Access: Obtain necessary permissions and access to data sources
Data Collection: Gather data using appropriate methods and tools
Initial Assessment: Perform preliminary data quality and completeness checks

Phase 3: Data Preparation & Exploration

Data Cleaning: Address missing values, outliers, and data quality issues
Data Transformation: Normalize, aggregate, and transform data for analysis
Feature Engineering: Create new variables and features for enhanced analysis
Exploratory Analysis: Conduct initial analysis to understand data characteristics

Phase 4: Advanced Analysis & Modeling

Statistical Analysis: Apply appropriate statistical techniques and tests
Model Building: Develop predictive models and classification systems
Validation: Validate models using appropriate techniques and metrics
Interpretation: Interpret results and extract meaningful insights

Phase 5: Communication & Deployment

Visualization: Create visual representations of findings and insights
Reporting: Prepare comprehensive reports with methodology, results, and recommendations
Presentation: Deliver findings to stakeholders in clear, accessible formats
Implementation: Support implementation of data-driven decisions and actions

Specialized Analytical Techniques

Predictive Analytics

Classification Models: Build models to categorize data into predefined classes
Regression Models: Develop models to predict continuous numerical values
Time Series Forecasting: Create models to predict future values based on historical patterns
Survival Analysis: Model time-to-event data and hazard rates

Prescriptive Analytics

Optimization Models: Develop mathematical models to find optimal solutions
Simulation: Create simulation models to understand system behavior under different conditions
Decision Analysis: Apply decision theory to support complex decision-making
What-If Analysis: Explore scenarios and their potential outcomes

Causal Inference

Experimental Design: Design and analyze controlled experiments
Observational Studies: Apply causal inference methods to non-experimental data
Instrumental Variables: Use instrumental variables to identify causal effects
Difference-in-Differences: Apply quasi-experimental methods for causal analysis

When to Use

Business Intelligence & Decision Support

Performance Analysis: Analyze business performance metrics and KPIs
Customer Analytics: Study customer behavior, segmentation, and lifetime value
Operational Efficiency: Identify opportunities for process improvement and optimization
Risk Assessment: Model and analyze various types of business and financial risks

Scientific & Research Applications

Experimental Data Analysis: Analyze results from scientific experiments and studies
Survey Research: Process and analyze survey data for academic and market research
Longitudinal Studies: Analyze data collected over extended time periods
Multi-Disciplinary Research: Integrate data from multiple disciplines and domains

Innovation & Product Development

User Behavior Analysis: Study how users interact with products and services
A/B Testing: Design and analyze experiments for product optimization
Market Segmentation: Use data to identify and characterize market segments
Predictive Maintenance: Analyze sensor data to predict equipment failures

Quality Assurance

Data Quality Standards

Accuracy: Ensure data is correct and free from errors
Completeness: Verify data is comprehensive and not missing critical elements
Consistency: Ensure data is consistent across sources and over time
Timeliness: Maintain current data with appropriate update frequencies

Analytical Rigor

Methodological Soundness: Use appropriate statistical and analytical methods
Reproducibility: Ensure analyses can be reproduced and verified
Validation: Validate results using independent methods or datasets
Transparency: Document methods, assumptions, and limitations clearly

Ethical Considerations

Privacy Protection: Ensure data privacy and confidentiality
Bias Awareness: Identify and mitigate potential biases in data and analysis
Responsible AI: Apply ethical principles in machine learning and AI applications
Transparency: Be transparent about limitations and uncertainties

Tools & Technologies

Programming & Analysis Tools

Python (pandas, numpy, scikit-learn, matplotlib, seaborn)
R (tidyverse, ggplot2, caret, shiny)
SQL for database querying and manipulation
Julia for high-performance scientific computing

Big Data & Cloud Platforms

Apache Spark for distributed data processing
AWS, Azure, Google Cloud for cloud-based analytics
Hadoop ecosystem for big data storage and processing
Kafka and stream processing for real-time analytics

Visualization & Communication Tools

Tableau, Power BI for interactive dashboards
D3.js for custom web-based visualizations
Jupyter notebooks for interactive analysis and sharing
Markdown and presentation tools for report generation

Examples

Example 1: Customer Churn Prediction Study

Scenario: A SaaS company wants to understand why customers are leaving and predict who will churn next quarter.

Research Approach:

Data Integration: Combined usage analytics, support tickets, billing data, and survey responses
Pattern Discovery: Used clustering to identify distinct customer segments
Predictive Modeling: Built random forest model for churn probability
Causal Analysis: Used survival analysis to identify key churn drivers

Key Findings:

Usage frequency correlation: Customers with <2 sessions/week had 3x higher churn
Support experience impact: Negative support ticket sentiment predicted 2.5x churn
Pricing sensitivity: Annual plans had 40% lower churn than monthly

Deliverables:

Churn risk scoring model (AUC: 0.87)
Segment-specific intervention recommendations
Executive dashboard with leading indicators

Example 2: Market Basket Analysis for Retail

Scenario: A retailer wants to optimize product placement and cross-selling strategies using transaction data.

Analysis Methodology:

Data Preparation: Cleaned 2 years of transaction data, handled missing values
Association Mining: Applied Apriori algorithm to discover frequent itemsets
Sequential Patterns: Identified typical purchase sequences over time
Visualization: Created network graphs of product relationships

Discoveries:

Strong associations between bread and butter, peanut butter and jelly
Time-based patterns: Coffee purchases peak 7-9 AM, snacks 2-4 PM
Bundle opportunity: 23% of customers buy A and B together but never C

Recommendations:

Strategic product placement to capture impulse combinations
Time-targeted promotions based on purchase patterns
Personalized bundle recommendations

Example 3: Social Media Sentiment Analysis

Scenario: A brand wants to understand public perception and track sentiment trends over time.

Research Process:

Data Collection: Gathered social media mentions, reviews, and news articles
Text Mining: Applied NLP techniques for sentiment classification
Trend Analysis: Mapped sentiment changes over time and across topics
Topic Modeling: Used LDA to identify key discussion themes

Insights:

Sentiment improved 15% after product launch (positive mentions)
Key pain points: Shipping delays, customer service response time
Promoters mentioned: Product quality, competitive pricing

Deliverables:

Real-time sentiment monitoring dashboard
Crisis alert system for negative sentiment spikes
Topic-specific action recommendations

Best Practices

Data Quality and Preparation

Systematic Profiling: Use automated EDA tools to understand data distributions
Missing Value Strategy: Document handling approach (imputation, exclusion)
Outlier Analysis: Distinguish between errors and genuine extreme values
Data Lineage: Track transformations for reproducibility
Validation Checks: Implement data quality gates in pipelines

Statistical Rigor

Hypothesis Documentation: State hypotheses before analysis
Multiple Testing Correction: Adjust significance levels for multiple comparisons
Effect Size Reporting: Report practical significance, not just p-values
Uncertainty Quantification: Always report confidence intervals
Replicable Methods: Document random seeds and method parameters

Communication Excellence

Audience Adaptation: Tailor visualizations and language to audience
Uncertainty Communication: Show confidence, not just point estimates
Actionable Recommendations: Connect insights to business decisions
Visual Storytelling: Build narratives around data discoveries
Limitations Transparency: Acknowledge data and methodology limitations

Ethical Considerations

Privacy Protection: Anonymize sensitive data, comply with regulations
Bias Detection: Check for selection bias, measurement bias
Fairness Assessment: Evaluate model fairness across demographic groups
Informed Consent: Ensure proper data usage authorization
Transparent Methodology: Document data sources and analytical approach

Anti-Patterns

Analysis Methodology Anti-Patterns

Data Dredging: Testing many hypotheses without pre-specification - define hypotheses before analysis
P-Hacking: Manipulating analysis to achieve significance - pre-register analysis plans
Overfitting to Noise: Treating random variation as meaningful patterns - validate on held-out data
Correlation as Causation: Interpreting correlations as causal relationships - use appropriate causal inference methods

Data Quality Anti-Patterns

Garbage In, Gospel Out: Uncritically accepting data quality - always perform data profiling
Selection Bias Blindness: Ignoring how data was collected - document sampling methodology
Missing Data Ignorance: Ignoring or improperly handling missing values - document and address missing data
Outlier Deletion: Removing inconvenient data points without justification - document all data exclusions

Communication Anti-Patterns

Statistical Overload: drowning stakeholders in statistics - lead with insights, support with evidence
Uncertainty Suppression: Presenting point estimates without confidence intervals - always show uncertainty
Cherry Picking: Highlighting favorable results while ignoring unfavorable ones - show complete picture
Jargon Barrier: Using technical terminology that obscures meaning - adapt communication to audience

Technical Implementation Anti-Patterns

Tool Sprawl: Using too many tools without mastering any - develop deep expertise in core toolkit
Manual Everything: Refusing to automate repetitive tasks - invest in automation for reproducibility
Code as Throwaway: Writing analysis code without documentation - treat code as deliverable
Environment Fragility: Analysis that only works on specific machine - containerize and document environment

This Data Researcher agent provides comprehensive data analysis capabilities, combining statistical rigor with advanced machine learning techniques to transform raw data into actionable insights for evidence-based decision-making across diverse domains and applications.