airbyte
Airbyteのエキスパートとして、300以上のコネクタを使い、SaaSツールやデータベース等のデータをデータウェアハウスへ連携させ、差分同期やエラー対応など、データパイプライン構築を支援するSkill。
📜 元の英語説明(参考)
You are an expert in Airbyte, the open-source data integration platform with 300+ pre-built connectors. You help developers sync data from SaaS tools, databases, and APIs into data warehouses and lakes — handling incremental syncs, CDC (Change Data Capture), schema evolution, and error recovery for production data pipelines.
🇯🇵 日本人クリエイター向け解説
Airbyteのエキスパートとして、300以上のコネクタを使い、SaaSツールやデータベース等のデータをデータウェアハウスへ連携させ、差分同期やエラー対応など、データパイプライン構築を支援するSkill。
※ jpskill.com 編集部が日本のビジネス現場向けに補足した解説です。Skill本体の挙動とは独立した参考情報です。
下記のコマンドをコピーしてターミナル(Mac/Linux)または PowerShell(Windows)に貼り付けてください。 ダウンロード → 解凍 → 配置まで全自動。
mkdir -p ~/.claude/skills && cd ~/.claude/skills && curl -L -o airbyte.zip https://jpskill.com/download/14619.zip && unzip -o airbyte.zip && rm airbyte.zip
$d = "$env:USERPROFILE\.claude\skills"; ni -Force -ItemType Directory $d | Out-Null; iwr https://jpskill.com/download/14619.zip -OutFile "$d\airbyte.zip"; Expand-Archive "$d\airbyte.zip" -DestinationPath $d -Force; ri "$d\airbyte.zip"
完了後、Claude Code を再起動 → 普通に「動画プロンプト作って」のように話しかけるだけで自動発動します。
💾 手動でダウンロードしたい(コマンドが難しい人向け)
- 1. 下の青いボタンを押して
airbyte.zipをダウンロード - 2. ZIPファイルをダブルクリックで解凍 →
airbyteフォルダができる - 3. そのフォルダを
C:\Users\あなたの名前\.claude\skills\(Win)または~/.claude/skills/(Mac)へ移動 - 4. Claude Code を再起動
⚠️ ダウンロード・利用は自己責任でお願いします。当サイトは内容・動作・安全性について責任を負いません。
🎯 このSkillでできること
下記の説明文を読むと、このSkillがあなたに何をしてくれるかが分かります。Claudeにこの分野の依頼をすると、自動で発動します。
📦 インストール方法 (3ステップ)
- 1. 上の「ダウンロード」ボタンを押して .skill ファイルを取得
- 2. ファイル名の拡張子を .skill から .zip に変えて展開(macは自動展開可)
- 3. 展開してできたフォルダを、ホームフォルダの
.claude/skills/に置く- · macOS / Linux:
~/.claude/skills/ - · Windows:
%USERPROFILE%\.claude\skills\
- · macOS / Linux:
Claude Code を再起動すれば完了。「このSkillを使って…」と話しかけなくても、関連する依頼で自動的に呼び出されます。
詳しい使い方ガイドを見る →- 最終更新
- 2026-05-18
- 取得日時
- 2026-05-18
- 同梱ファイル
- 1
📖 Skill本文(日本語訳)
※ 原文(英語/中国語)を Gemini で日本語化したものです。Claude 自身は原文を読みます。誤訳がある場合は原文をご確認ください。
Airbyte — オープンソースのデータ統合プラットフォーム
あなたは、300以上の事前構築済みコネクタを持つオープンソースのデータ統合プラットフォームである Airbyte の専門家です。開発者が SaaS ツール、データベース、API からデータウェアハウスやデータレイクにデータを同期するのを支援し、本番データパイプラインの増分同期、CDC (Change Data Capture)、スキーマ進化、およびエラーリカバリを処理します。
主要な機能
セルフホストセットアップ
# Docker Compose (小〜中規模向けに推奨)
git clone https://github.com/airbytehq/airbyte.git
cd airbyte && ./run-ab-platform.sh
# UI at http://localhost:8000
# Kubernetes (本番環境)
helm repo add airbyte https://airbytehq.github.io/helm-charts
helm install airbyte airbyte/airbyte -n airbyte --create-namespace
# Cloud: https://cloud.airbyte.com (マネージド)
API による設定
# Airbyte API を介してプログラムで接続を作成する
import requests
AIRBYTE_API = "http://localhost:8000/api/v1"
# Stripe ソースを作成する
source = requests.post(f"{AIRBYTE_API}/sources/create", json={
"workspaceId": workspace_id,
"name": "Stripe Production",
"sourceDefinitionId": "e094cb9a-26de-4645-8761-65c0c425d1de", # Stripe
"connectionConfiguration": {
"account_id": "acct_xxx",
"client_secret": os.environ["STRIPE_SECRET_KEY"],
"start_date": "2025-01-01T00:00:00Z",
},
}).json()
# BigQuery デスティネーションを作成する
destination = requests.post(f"{AIRBYTE_API}/destinations/create", json={
"workspaceId": workspace_id,
"name": "BigQuery Warehouse",
"destinationDefinitionId": "22f6c74f-5699-40ff-833c-4a879ea40133",
"connectionConfiguration": {
"project_id": "my-project",
"dataset_id": "raw_stripe",
"credentials_json": os.environ["GCP_CREDENTIALS"],
"loading_method": {"method": "GCS Staging", "gcs_bucket_name": "airbyte-staging"},
},
}).json()
# 接続を作成する (ソース → デスティネーション)
connection = requests.post(f"{AIRBYTE_API}/connections/create", json={
"sourceId": source["sourceId"],
"destinationId": destination["destinationId"],
"syncCatalog": {
"streams": [
{
"stream": {"name": "subscriptions", "namespace": "stripe"},
"config": {
"syncMode": "incremental",
"destinationSyncMode": "append_dedup",
"cursorField": ["created"],
"primaryKey": [["id"]],
},
},
],
},
"schedule": {"scheduleType": "cron", "cronExpression": "0 */2 * * * ?"},
"namespaceFormat": "raw_${SOURCE_NAMESPACE}",
}).json()
カスタムコネクタ (CDK)
# Airbyte CDK を使用してカスタムソースコネクタを構築する
from airbyte_cdk.sources import AbstractSource
from airbyte_cdk.sources.streams import Stream
from airbyte_cdk.sources.streams.http import HttpStream
class InternalAPIStream(HttpStream):
url_base = "https://api.internal.company.com/v1/"
primary_key = "id"
cursor_field = "updated_at"
def path(self, **kwargs) -> str:
return "events"
def parse_response(self, response, **kwargs):
for record in response.json()["data"]:
yield record
class Source(AbstractSource):
def check_connection(self, logger, config):
# API クレデンシャルが機能することを確認する
return True, None
def streams(self, config):
return [InternalAPIStream(authenticator=self.get_auth(config))]
インストール
# Docker Compose
curl -o docker-compose.yaml https://raw.githubusercontent.com/airbytehq/airbyte/master/docker-compose.yaml
docker compose up -d
# カスタムコネクタ用の Python CDK
pip install airbyte-cdk
ベストプラクティス
- 増分同期 — 大きなテーブルには増分モードを使用します。小さな参照テーブルのみに完全なリフレッシュを使用します。
- データベースの CDC — リアルタイムの PostgreSQL/MySQL 同期には、Change Data Capture (論理レプリケーション) を使用します。
- ステージングエリア — BigQuery/Snowflake デスティネーション用に GCS/S3 ステージングを構成します。大量のデータの場合、直接挿入は遅いです。
- スキーマ進化 — Airbyte は新しいカラムを自動的に処理します。接続設定で
auto_propagationを構成します。 - アラート — 同期失敗の webhook 通知を設定します。Slack/PagerDuty と統合します。
- ソースごとの名前空間 —
raw_${SOURCE}名前空間パターンを使用します。dbt 変換の前に、生データを整理された状態に保ちます。 - コスト削減のためのセルフホスト — Airbyte Cloud は同期された行ごとに課金されます。セルフホストは無制限のデータに対して無料です。
- カスタムコネクタ — 内部 API には CDK を使用します。コミュニティで使用するために Airbyte のコネクタマーケットプレイスに公開します。
📜 原文 SKILL.md(Claudeが読む英語/中国語)を展開
Airbyte — Open-Source Data Integration Platform
You are an expert in Airbyte, the open-source data integration platform with 300+ pre-built connectors. You help developers sync data from SaaS tools, databases, and APIs into data warehouses and lakes — handling incremental syncs, CDC (Change Data Capture), schema evolution, and error recovery for production data pipelines.
Core Capabilities
Self-Hosted Setup
# Docker Compose (recommended for small-medium)
git clone https://github.com/airbytehq/airbyte.git
cd airbyte && ./run-ab-platform.sh
# UI at http://localhost:8000
# Kubernetes (production)
helm repo add airbyte https://airbytehq.github.io/helm-charts
helm install airbyte airbyte/airbyte -n airbyte --create-namespace
# Cloud: https://cloud.airbyte.com (managed)
Configuration via API
# Create connections programmatically via Airbyte API
import requests
AIRBYTE_API = "http://localhost:8000/api/v1"
# Create a Stripe source
source = requests.post(f"{AIRBYTE_API}/sources/create", json={
"workspaceId": workspace_id,
"name": "Stripe Production",
"sourceDefinitionId": "e094cb9a-26de-4645-8761-65c0c425d1de", # Stripe
"connectionConfiguration": {
"account_id": "acct_xxx",
"client_secret": os.environ["STRIPE_SECRET_KEY"],
"start_date": "2025-01-01T00:00:00Z",
},
}).json()
# Create a BigQuery destination
destination = requests.post(f"{AIRBYTE_API}/destinations/create", json={
"workspaceId": workspace_id,
"name": "BigQuery Warehouse",
"destinationDefinitionId": "22f6c74f-5699-40ff-833c-4a879ea40133",
"connectionConfiguration": {
"project_id": "my-project",
"dataset_id": "raw_stripe",
"credentials_json": os.environ["GCP_CREDENTIALS"],
"loading_method": {"method": "GCS Staging", "gcs_bucket_name": "airbyte-staging"},
},
}).json()
# Create connection (source → destination)
connection = requests.post(f"{AIRBYTE_API}/connections/create", json={
"sourceId": source["sourceId"],
"destinationId": destination["destinationId"],
"syncCatalog": {
"streams": [
{
"stream": {"name": "subscriptions", "namespace": "stripe"},
"config": {
"syncMode": "incremental",
"destinationSyncMode": "append_dedup",
"cursorField": ["created"],
"primaryKey": [["id"]],
},
},
],
},
"schedule": {"scheduleType": "cron", "cronExpression": "0 */2 * * * ?"},
"namespaceFormat": "raw_${SOURCE_NAMESPACE}",
}).json()
Custom Connectors (CDK)
# Build a custom source connector with Airbyte CDK
from airbyte_cdk.sources import AbstractSource
from airbyte_cdk.sources.streams import Stream
from airbyte_cdk.sources.streams.http import HttpStream
class InternalAPIStream(HttpStream):
url_base = "https://api.internal.company.com/v1/"
primary_key = "id"
cursor_field = "updated_at"
def path(self, **kwargs) -> str:
return "events"
def parse_response(self, response, **kwargs):
for record in response.json()["data"]:
yield record
class Source(AbstractSource):
def check_connection(self, logger, config):
# Verify API credentials work
return True, None
def streams(self, config):
return [InternalAPIStream(authenticator=self.get_auth(config))]
Installation
# Docker Compose
curl -o docker-compose.yaml https://raw.githubusercontent.com/airbytehq/airbyte/master/docker-compose.yaml
docker compose up -d
# Python CDK for custom connectors
pip install airbyte-cdk
Best Practices
- Incremental syncs — Use incremental mode for large tables; full refresh only for small reference tables
- CDC for databases — Use Change Data Capture (logical replication) for real-time PostgreSQL/MySQL syncs
- Staging area — Configure GCS/S3 staging for BigQuery/Snowflake destinations; direct insert is slow for large volumes
- Schema evolution — Airbyte handles new columns automatically; configure
auto_propagationin connection settings - Alerting — Set up webhook notifications for sync failures; integrate with Slack/PagerDuty
- Namespace per source — Use
raw_${SOURCE}namespace pattern; keeps raw data organized before dbt transforms - Self-host for cost — Airbyte Cloud charges per row synced; self-hosting is free for unlimited data
- Custom connectors — Use CDK for internal APIs; publish to Airbyte's connector marketplace for community use