Bright Dataとは何か?エンジニアが使うプロキシ・スクレイピングAPIの全体像【2026年版】

Bright Dataとは何か?エンジニアが使うプロキシ・スクレイピングAPIの全体像【2026年版】

Bright Dataの住宅用プロキシ・Scraping Browser・Web Unlockerを徹底解説。ScraperAPI・Apifyとの料金比較、Pythonコードサンプル、AI学習データ収集・競合価格監視のユースケースまでエンジニア視点でまとめた2026年版ガイド。

※ 本記事にはプロモーションが含まれています。記事内リンクから申し込みがあった場合、筆者に紹介報酬が発生します。内容は独自調査に基づいており、報酬によって評価が変わることはありません。 #PR

エンジニアのゆとです。

データ収集の仕事をしていると、必ずといっていいほど「Bright Data」の名前が出てくる。

プロキシサービスの文脈で聞いたことがある人もいれば、スクレイピングAPIとして知っている人もいる。「高いらしい」という噂だけ耳に入っていて、実態を把握していないケースも多い。

正直に言うと、Bright Dataは「プロキシを売っているサービス」というより「ウェブデータ収集インフラ全体を提供するプラットフォーム」に進化している。住宅用プロキシ(レジデンシャルプロキシ)を入り口に、スクレイピングAPIやデータセットまで一気通貫でカバーするようになった。

この記事では、Bright Dataの全体像を整理して、どういうユースケースに向いているか・競合とのコスト差はどこで発生するかを、エンジニア目線でまとめる。

Bright Dataとは何か

Bright Dataは2014年設立のイスラエル発のデータインフラ企業。元々は「Luminati Networks」という名前で住宅用プロキシネットワークを提供していたが、2021年に現在の社名に変更し、スクレイピングAPI・データセット・AIエージェント向けツールへと事業を拡大した。

現在の主な数字はこのあたり:

  • 住宅用プロキシIP数:4億以上(195ヵ国)
  • データセンタープロキシ:770万以上
  • 累計顧客:2万社以上
  • 対応ウェブサイト:Web Scraper APIで120以上の主要サイトに特化対応

「プロキシ屋さん」という印象が強い人は多いと思うが、今のBright Dataはそれだけじゃない。CAPTCHA自動突破・JavaScriptレンダリング・AI対応ブラウザまでを一つのエコシステムとして提供している。

主要プロダクト5つの全体像

Bright Dataは製品ラインが多い。一覧で整理する。

1. 住宅用プロキシ(Residential Proxies)

4億以上の実際のデバイスIP(一般ユーザーのスマホやPC)を経由するプロキシ。IPローテーションが自動で、地理的ターゲティング(国・州・市・郵便番号単位)も無料でできる。

アンチボット検知が強いサイトに対して最も有効で、データセンターIPではブロックされるケースでも通ることが多い。ただし、単価はデータセンタープロキシの数倍になる。

用途:価格スクレイピング、SNSデータ収集、地域別コンテンツ取得

2. データセンタープロキシ(Datacenter Proxies)

クラウドサーバーのIPを使うプロキシ。速度が速く、単価が安い。「住所不定のクラウドIP」なので、人間の家庭から来たトラフィックとは区別されやすいが、その分速度と価格のトレードオフが成立する。

共有(Shared)と専有(Dedicated)の2種類があり、専有は他社と同じIPを使わないため検知リスクが下がる。

用途:APIアクセス、大量データ取得、検索エンジンの大規模クロール

3. ISPプロキシ(ISP Proxies)

住宅用プロキシとデータセンタープロキシのいいとこどりを狙ったもの。実際のISP(インターネットプロバイダー)から割り当てられた固定IPを使うため、住所が確認できてかつ速度も安定している。

スニーカーサイトの自動購入や、ソーシャルメディアの自動化など「検知されたくいが安定性も欲しい」案件で使われる。

4. Web Unlocker

エンドポイントが一つで「とにかくそのURLのHTMLをくれ」と投げると、背後でプロキシ切り替え・CAPTCHA解決・ブラウザフィンガープリント偽装を全部やってくれるAPIだ。

リクエストが成功したときのみ課金される(失敗はタダ)というモデルなのが特徴で、スクレイピングの成功率保証が欲しいときに使う。

2025年初頭に料金が50%値下がりしており、従量課金は$3/1K(成功リクエスト)前後。

5. Scraping Browser

PuppeteerやPlaywrightのスクリプトをそのまま使えるクラウドブラウザサービス。自前でブラウザを立ててIPを準備してCAPTCHAを解いて…という工程が全部不要になる。

playwright.connect()で接続するだけで、あとはBright Data側がプロキシ管理・CAPTCHAバイパス・フィンガープリント偽装を全部やってくれる構成だ。Seleniumにも対応している。

ローカルのブラウザを動かすとサーバーリソースがかかるので、マネージドに投げたい場合の選択肢として有力。

料金体系(2026年版)

正直なところを言うと、Bright Dataは「小規模には高い」。最低契約が月額$499(Proxy Starterプラン)から始まるプランが多く、個人開発者が気軽に試す価格帯ではない。

従量課金(Pay As You Go)はあるが、単価が高くなる。使い方に合わせてプランを選ぶのが重要。

住宅用プロキシ

プラン月額GB単価含むGB
Pay As You Goなし$4.00/GB
Proxy Starter$499$3.50/GB141GB
Proxy Professional$999$3.00/GB332GB
Proxy Business$1,999$2.50/GB798GB

※2026年6月時点。プロモーション割引(50%オフ)適用後の金額。

データセンタープロキシ

IP数単価と帯域幅単価の2パターンある。

IP数課金(共有プール)

IP数IP単価月額
10 IPs$1.40/IP$14
100 IPs$1.00/IP$100
1,000 IPs$0.90/IP$900

帯域幅課金

プラン月額GB単価
Pay As You Goなし$0.60/GB
1TB含む$499$0.51/GB
2TB含む$999$0.45/GB

Web Unlocker

失敗リクエストには課金されない。成功リクエストのみ。

プラン月額1K リクエスト単価
Pay As You Goなし$3.00/1K
Starter$499$2.10/1K
Professional$999$1.80/1K

Scraping Browser

帯域幅課金。月額$499〜。

プラン月額GB単価
Pay As You Goなし$8.00/GB
71GB含む$499$7.00/GB
166GB含む$999$6.00/GB

エンジニアが使う具体的なユースケース

AI学習データの収集

LLMやマルチモーダルモデルの学習データを大規模に収集するケースで、住宅用プロキシ+Web Unlockerの組み合わせが使われる。Instagramや各種ECサイトの画像・テキストを地域を変えながら取得するとき、単一のIPでは即ブロックされる。

Bright Dataはこの用途で「AIデータ収集インフラ」と明示的に売り出していて、2026年はAIエージェント向けのMCPサーバー(月5000リクエスト無料)も提供し始めた。

競合価格監視(Price Intelligence)

ECサイト・SaaS企業・旅行代理店等で、競合他社の価格を毎日自動収集するシステムを組む。Amazon・楽天・Booking.com などは特にアンチスクレイピングが厳しく、ナイーブなIPでは数百リクエストで弾かれる。

住宅用プロキシ+地域ターゲティングを組み合わせると、特定の国や地域の表示価格を取得できる。旅行・航空券系のダイナミックプライシング監視で特に有効。

市場調査・広告モニタリング

自社の広告が正しく表示されているか・競合の広告クリエイティブはどう変化しているかを追跡するケース。ISPプロキシで特定地域のIPを固定して、ブランドセーフティや地域別表示確認をする。

マーケティングエージェンシーが自社ダッシュボードに組み込むことが多い。

実際のコードサンプル(Python)

住宅用プロキシ経由でリクエスト

import requests

# Bright Data住宅用プロキシ設定
proxy_host = "brd.superproxy.io"
proxy_port = 22225
username = "brd-customer-<CUSTOMER_ID>-zone-residential"
password = "<ZONE_PASSWORD>"

proxies = {
    "http": f"http://{username}:{password}@{proxy_host}:{proxy_port}",
    "https": f"http://{username}:{password}@{proxy_host}:{proxy_port}",
}

# 日本のIPでアクセスしたい場合はusernameにcountry=jpを追加
username_jp = f"brd-customer-<CUSTOMER_ID>-zone-residential-country-jp"
proxies_jp = {
    "http": f"http://{username_jp}:{password}@{proxy_host}:{proxy_port}",
    "https": f"http://{username_jp}:{password}@{proxy_host}:{proxy_port}",
}

response = requests.get(
    "https://example.com/product/pricing",
    proxies=proxies_jp,
    timeout=30,
    verify=False,  # SSL検証をスキップする場合
)
print(response.status_code, len(response.text))

Web UnlockerでJSレンダリングが必要なページを取得

import requests

# Web Unlocker エンドポイント
UNLOCKER_HOST = "brd.superproxy.io"
UNLOCKER_PORT = 33335
USERNAME = "brd-customer-<CUSTOMER_ID>-zone-unblocker"
PASSWORD = "<ZONE_PASSWORD>"

proxies = {
    "http": f"http://{USERNAME}:{PASSWORD}@{UNLOCKER_HOST}:{UNLOCKER_PORT}",
    "https": f"http://{USERNAME}:{PASSWORD}@{UNLOCKER_HOST}:{UNLOCKER_PORT}",
}

# 課金されるのは成功時のみ(404や接続失敗は無課金)
response = requests.get(
    "https://www.amazon.co.jp/dp/XXXXXXXXXX",
    proxies=proxies,
    verify=False,  # Bright DataのSSL証明書を使うため
)

if response.status_code == 200:
    print("取得成功:", len(response.text), "bytes")
else:
    print("失敗(課金なし):", response.status_code)

Scraping BrowserをPlaywrightで使う

from playwright.sync_api import sync_playwright

# Bright Data Scraping Browserの接続URL
SBR_WS_CDP = "wss://brd-customer-<CUSTOMER_ID>-zone-scraping_browser:<ZONE_PASSWORD>@brd.superproxy.io:9222"

def scrape_with_scraping_browser(url: str) -> str:
    with sync_playwright() as p:
        # CDPエンドポイントに接続するだけ。プロキシ・CAPTCHA処理は向こう持ち
        browser = p.chromium.connect_over_cdp(SBR_WS_CDP)
        page = browser.new_page()
        page.goto(url, wait_until="networkidle", timeout=60000)

        # CAPTCHA解決を待つ(自動で解決される)
        page.wait_for_selector("body")

        content = page.content()
        browser.close()
        return content

html = scrape_with_scraping_browser("https://example.com/protected-page")
print(html[:500])

自前のPlaywrightスクリプトにconnect_over_cdpを差し込むだけで動く。既存コードの変更量が最小限なのが利点。

ScraperAPI・Apifyとの比較

「Bright Dataは高い」という評判は正しいが、「何が高いのか」を整理しておく。

コスト比較(月あたりの実態)

サービス入門プラン100万ページ相当のコスト目安
Bright Data(住宅用プロキシ)$499/月〜$1,500〜(大量になるほど割安)
ScraperAPI$49/月〜(Business $299)$299〜$449
Apify$29/月〜(Scale $199)$199〜(CU消費次第)

スモールスケール(月50万ページ未満)ではScraperAPIが最もコスパがいい。Apifyはプリビルドスクレーパーが豊富で「すぐに特定サイトを取れる」手軽さがある。

Bright Dataが真価を発揮するのは大量取得フェーズか、アンチボット対策が極めて厳しいサイトへのアクセスが必要な場合。月100万ページを超えてくると、GB単価が下がってScraperAPIより安くなるケースもある。

機能面の差

機能Bright DataScraperAPIApify
住宅用プロキシ品質最高クラス中程度中程度
プリビルドスクレーパーあり(120+サイト)限定的豊富(1,500+)
Playwright/Puppeteer対応Scraping BrowserJSレンダリングAPIで対応Actor経由
失敗無課金Web Unlockerのみ全プランで成功課金CU消費ベース
最低契約$499/月〜$49/月〜$29/月〜
日本語サポート英語のみ英語のみ英語のみ

選ぶ基準を一言で

  • 月数万ページ・予算が限られる:ScraperAPI
  • プリビルドスクレーパーで手早く始めたい:Apify
  • 最高品質のプロキシが必要・大規模:Bright Data

Bright Dataのデメリット

公平に書く。

価格の入り口が高い:最低$499/月からというのは、個人開発者や小規模スタートアップには重い。試してみて「思ったより使わなかった」となるとコストが無駄になる。従量課金はあるが単価が高い。

プロダクトの複雑さ:住宅用プロキシ・データセンタープロキシ・ISPプロキシ・Web Unlocker・Scraping Browser・SERP API・データセット…と製品ラインが多すぎる。何を使えばいいかが初見ではわかりにくい。

コンプライアンスの論争:住宅用プロキシのIP調達方法(エンドユーザーのデバイスを経由させることへの同意)を巡って、過去にFTCから訴訟を受けたことがある。2023年に和解しているが、プロキシの倫理的・法的グレーゾーンは意識しておくべきポイント。

サポートが英語のみ:日本語対応はない。ドキュメントは充実しているが、問い合わせは全て英語が前提。

始め方

公式サイトからアカウントを作ると、最初のデポジット($500以上)に対して最大$500のマッチングクレジットが付与されるキャンペーンを実施している(時期によって変動あり)。

実質的に初月は2倍の予算でテストできる。スモールスタートで自分のユースケースに合うか試してみるのが現実的な入り方だ。

get.brightdata.com

まとめ

Bright Dataは「ちょっとスクレイピングしたい」向けではない。大量データ・高いアンチボット対策が必要なプロダクション環境向けのインフラだ。

どういう人に向いているかを整理するとこうなる:

  • AI学習データを大量に集めたい(数TB/月規模)
  • 競合価格を毎日自動で100万件単位で取りたい
  • Amazonや主要ECのデータを安定して取れる仕組みが欲しい
  • 地域別のIPで表示コンテンツを変えながらテストしたい

逆に、月数万ページ・個人開発・予算$100以下なら、ScraperAPIかApifyを先に検討したほうがいい。

プロキシ品質と住所地域の細かさは、業界トップクラスなのは間違いない。「安いプロキシで足りてる」うちはいいが、そのプロキシでブロックが増えてきたタイミングで候補に入ってくるサービスだと思っている。

← 記事一覧に戻る