Domínio, locale, idioma dos resultados
Aprenda a configurar os parâmetros de domínio, locale e idioma para fazer scraping de dados precisos do Amazon, Google ou Bing.
Esta página orienta você na configuração dos parâmetros de localização de conteúdo para fazer scraping da Amazon, Google e Bing. Essas configurações ajudam a personalizar o marketplace ou domínio de nível superior (TLD), o idioma da interface e os resultados de busca para uma extração de dados precisa e específica por região.
Amazon
Domínio
Use o parâmetro domain para especificar qual marketplace da Amazon você gostaria de fazer scraping.
ae
Emirados Árabes Unidos
ca
Canadá
cn
China
co.jp
Japão
co.uk
Reino Unido
com
Estados Unidos
com.au
Austrália
com.be
Bélgica
com.br
Brasil
com.mx
México
com.tr
Turquia
de
Alemanha
eg
Egito
es
Espanha
fr
França
ie
Irlanda
in
Índia
it
Itália
nl
Países Baixos
pl
Polônia
sa
Arábia Saudita
se
Suécia
sg
Singapura
Localidade
Use o locale parâmetro para definir o idioma da interface.
Nem todos os marketplaces da Amazon permitem definir o idioma da interface, e os idiomas suportados variam em cada marketplace. A tabela abaixo lista as combinações suportadas de parâmetro domain e locale valores. Alguns idiomas são marcados como padrão. Se você quiser obter o idioma padrão da interface, não precisa enviar o locale parâmetro.
ae
en_AE
Inglês (Reino Unido) (padrão)
ae
ar_AE
Árabe
ca
fr_CA
Francês
ca
en_CA
Inglês (Reino Unido) (padrão)
cn
zh_CN
Chinês (simplificado, RPC)
co.jp
ja_JP
Japonês (padrão)
co.jp
en_US
Inglês (Reino Unido)
co.jp
zh_CN
Chinês
co.uk
en_GB
Inglês (Reino Unido)
com
en_US
Inglês (Reino Unido) (padrão)
com
es_US
Espanhol
com
ar_AE
Árabe
com
de_US
Alemão
com
he_IL
Hebraico
com
ko_KR
Coreano
com
pt_BR
Português
com
zh_CN
Chinês
com
zh_TW
Taiwanês
com.au
en_AU
Inglês (Austrália)
com.be
fr_BE
Francês
com.be
nl_BE
Holandês
com.be
en_GB
Inglês (Reino Unido)
com.br
pt_BR
Português (Brasil)
com.mx
es_MX
Espanhol (México)
com.tr
tr_TR
Turco
de
de_DE
Alemão (padrão)
de
en_GB
Inglês (Reino Unido)
de
cs_CZ
Tcheco
de
nl_NL
Holandês
de
pl_PL
Polonês
de
tr_TR
Turco
de
da_DK
Dinamarquês
eg
ar_AE
Árabe (padrão)
eg
en_AE
Inglês (Reino Unido)
es
es_ES
Espanhol (padrão)
es
pt_PT
Português
es
en_GB
Inglês (Reino Unido)
fr
en_GB
Inglês (Reino Unido)
fr
fr_FR
Francês (padrão)
ie
en_IE
Irlandês (gaélico)
in
en_IN
Inglês (Reino Unido) (padrão)
in
hi_IN
Hindi
in
ta_IN
Tâmil
in
te_IN
Télugo
in
kn_IN
Canarês
in
ml_IN
Malaiala
in
bn_IN
Bengali
in
mr_IN
Marata
it
en_GB
Inglês (Reino Unido)
it
it_IT
Italiano (padrão)
nl
nl_NL
Holandês (padrão)
nl
en_GB
Inglês (Reino Unido)
pl
pl_PL
Polonês (padrão)
sa
ar_AE
Árabe (padrão)
sa
en_AE
Inglês (Reino Unido)
se
sv_SE
Sueco (padrão)
se
en_GB
Inglês (Reino Unido)
sg
en_SG
Inglês (Singapura) (padrão)
Google
Localidade
Use o locale parâmetro para definir o idioma da interface da página de pesquisa do Google. Este não afeta o idioma dos resultados da pesquisa.
Por exemplo, se você usar o com parâmetro domain e locale de-DE, os resultados ainda serão americanos, mas o Accept-Language valor do cabeçalho será definido como de-DE,de;q=0.8. Isso imitaria uma pessoa dos EUA pesquisando em com domínio, com a interface do navegador definida para o idioma alemão.
Se você não usar este parâmetro, definiremos o parâmetro 'Accept-Language' para corresponder ao domínio (ou seja, en-US para com).
Baixe a lista completa de locale valores em JSON aqui.
Aqui está um exemplo de valores de locale:
Idioma dos resultados
Ao fazer scraping do Google, você tem a opção de especificar o idioma dos resultados obtidos. Você pode encontrar a lista completa de idiomas suportados e seus respectivos valores em formato JSON aqui.
Por exemplo, para definir o idioma dos resultados como árabe ao fazer scraping do Google SERP, adicione esta chave e valor:
Bing
Localidade
Usar o locale parâmetro permitirá que você altere o idioma da interface da página de pesquisa do Bing (não os resultados).
Por exemplo, se você usar o domínio com e o parâmetro locale de-DE, os resultados ainda serão americanos, mas o Accept-Language valor do cabeçalho será definido como de-DE,de;q=0.8. Isso imitaria uma pessoa dos EUA pesquisando em com domínio, com a interface do navegador definida para o idioma alemão.
Se você não usar este parâmetro, definiremos o parâmetro 'Accept-Language' para corresponder ao domínio (ou seja, en-US para com).
Baixe a lista completa de locale valores em formato JSON aqui.
Atualizado
Isto foi útil?

