Documentation has been updated: see help center and changelog in one place.

域名、区域、结果语言

本页指导你如何配置 domain, locale,以及 结果语言 用于抓取 Amazon、Google 和 Bing 的参数。这些设置有助于自定义市场或顶级域名(TLD)、界面语言以及搜索结果,以实现准确的、特定地区的数据抽取。

Amazon

域名

使用 domain 参数,用于指定你要抓取的 Amazon 市场。

域名
市场

ae

阿拉伯联合酋长国

ca

加拿大

cn

中国

co.jp

日本

co.uk

联合王国

com

美国

com.au

澳大利亚

com.be

比利时

com.br

巴西

com.mx

墨西哥

com.tr

土耳其

de

德国

eg

埃及

es

西班牙

fr

法国

ie

爱尔兰

in

印度

it

意大利

nl

荷兰

pl

波兰

sa

沙特阿拉伯

se

瑞典

sg

新加坡

区域设置

使用 locale 参数,用于设置界面语言。

并非所有 Amazon 市场都允许设置界面语言,且各市场支持的语言不同。下表列出了支持的 domainlocale 取值组合。部分语言标记为默认。如果你希望获取默认界面语言,则无需发送 locale 参数一起使用时该参数才有用。

域名
区域设置
界面语言

ae

en_AE

英语(英国)(默认)

ae

ar_AE

阿拉伯语

ca

fr_CA

法语

ca

en_CA

英语(英国)(默认)

co.jp

ja_JP

日语(默认)

co.jp

en_US

英语(英国)

co.jp

zh_CN

中文

co.uk

en_GB

英语(英国)

com

en_US

英语(英国)(默认)

com

es_US

西班牙语

com

ar_AE

阿拉伯语

com

de_US

德语

com

he_IL

希伯来语

com

ko_KR

朝鲜语

com

pt_BR

葡萄牙语

com

zh_CN

中文

com

zh_TW

台灣中文

com.au

en_AU

英语(澳大利亚)

com.be

fr_BE

法语

com.be

nl_BE

荷兰语

com.be

en_GB

英语(英国)

com.br

pt_BR

葡萄牙语(巴西)

com.mx

es_MX

西班牙语(墨西哥)

com.tr

tr_TR

土耳其语

de

de_DE

德语(默认)

de

en_GB

英语(英国)

de

cs_CZ

捷克语

de

nl_NL

荷兰语

de

pl_PL

波兰语

de

tr_TR

土耳其语

de

da_DK

丹麦语

eg

ar_AE

阿拉伯语(默认)

eg

en_AE

英语(英国)

es

es_ES

西班牙语(默认)

es

pt_PT

葡萄牙语

es

en_GB

英语(英国)

fr

en_GB

英语(英国)

fr

fr_FR

法语(默认)

in

en_IN

英语(英国)(默认)

in

hi_IN

印地语

in

ta_IN

泰米尔语

in

te_IN

泰卢固语

in

kn_IN

卡纳达语

in

ml_IN

马拉雅拉姆语

in

bn_IN

孟加拉语

in

mr_IN

马拉地语

it

en_GB

英语(英国)

it

it_IT

意大利语(默认)

nl

nl_NL

荷兰语(默认)

nl

en_GB

英语(英国)

pl

pl_PL

波兰语(默认)

sa

ar_AE

阿拉伯语(默认)

sa

en_AE

英语(英国)

se

sv_SE

瑞典语(默认)

se

en_GB

英语(英国)

sg

sg_EN

英语(新加坡)(默认)

Google

区域设置

使用 locale 参数,用于设置 Google 搜索网页界面语言。该参数 不会 影响 搜索结果语言.

例如,如果你使用域名 com 和区域设置参数 de-DE,结果仍将是美国地区的,但 Accept-Language 请求头的取值将被设置为 de-DE,de;q=0.8。这将模拟一位来自美国的人在 com 域名上搜索,但其浏览器 UI 语言设置为德语。

如果你不使用该参数,我们会将“Accept-Language”参数设置为与域名匹配(即 en-US 用于 com).

以下是一些区域设置取值示例:

# 区域设置描述,domain:域名后缀

"locale":
    "en-ai", # 安圭拉 - 英语,domain: com.ai
    "es-pr", # 波多黎各 - 西班牙语,domain: com.pr
    "nl-sr", # 苏里南 - 荷兰语,domain: sr
    "fr-ml", # 马里 - 法语,domain: ml
    "en-lb", # 黎巴嫩 - 英语,domain: com.lb
    "fr-bf", # 布基纳法索 - 法语,domain: bf
    "en-fm", # 密克罗尼西亚联邦 - 英语,domain: fm
    "es-mx", # 墨西哥 - 西班牙语,domain: com.mx
    "fr-bj", # 贝宁 - 法语,domain: bj
    "ru-ee", # 爱沙尼亚 - 俄语,domain: ee
    "en-mv", # 马尔代夫 - 英语,domain: mv

结果语言

当抓取 Google 时,你可以选择指定获取结果的语言。你可以在 JSON 格式中查看支持语言及其对应取值的完整列表 此处.

例如,要在抓取 Google SERP 时将结果语言设置为阿拉伯语,请添加以下键和值:

{
    "key": "results_language",
    "value": "ar"
}

域名

使用 domain 参数,用于指定你要抓取的 Google 顶级域名(TLD)。Google 可用域名的完整列表可在此处找到 此处.

Bing

区域设置

使用 locale 参数将允许你更改 Bing 搜索页面的网页界面语言(非结果)。

例如,如果你使用域名 com 和区域设置参数 de-DE,结果仍将是美国地区的,但 Accept-Language 请求头的取值将被设置为 de-DE,de;q=0.8。这将模拟一位来自美国的人在 com 域名上搜索,但其浏览器 UI 语言设置为德语。

如果你不使用该参数,我们会将“Accept-Language”参数设置为与域名匹配(即 en-US 用于 com).

下载完整的 locale JSON 格式取值 此处.

最后更新于

这有帮助吗?