Formação de Requisições
Aprenda a formar requisições da Web Scraper API para mecanismos de busca, marketplaces e outros sites. Inclui exemplos de código e orientação sobre parâmetros.
Leia guias detalhados sobre como começar e fazer requisições usando Web Scraper API para diferentes sites.
Mecanismos de busca
Primeiros passos
Selecione o mecanismo de busca que você quer rastrear: Google, Bing, Outros mecanismos de busca.
Exemplo de requisição
curl 'https://realtime.oxylabs.io/v1/queries' \
--user 'USERNAME:PASSWORD' \
-H 'Content-Type: application/json' \
-d '{
"source": "google_search",
"query": "adidas"
}'import requests
from pprint import pprint
# Estruturar payload.
payload = {
'source': 'google_search',
'query': 'adidas',
}
# Obter resposta.
response = requests.request(
'POST',
'https://realtime.oxylabs.io/v1/queries',
auth=('USERNAME', 'PASSWORD'),
json=payload,
)
# Imprimir resposta formatada no stdout.
pprint(response.json())Usamos o método de integração Realtime síncrona em nossos exemplos. Se você quiser usar Proxy Endpoint ou integração assíncrona Push-Pull consulte os métodos de integração na seção.
Formando uma requisição
Escolha seu método de integração: síncrono (Realtime, Proxy Endpoint) ou assíncrono (Push-Pull).
Ao formar uma requisição, inclua os seguintes elementos:
Endpoint:
Nome de usuário e senha (Autenticação HTTP). Crie credenciais de usuário API durante seu cadastro de avaliação ou compra do produto.
Se você precisar de mais de um usuário de API para sua conta, por favor contate nosso suporte ao cliente ou envie uma mensagem ao nosso suporte via chat ao vivo 24/7.
Content-type. Ao enviar jobs, sempre adicione este cabeçalho:
Payload:
source- Este parâmetro define o scraper que será usado para processar sua requisição.URLouquery- Forneça oURLouquerypara o tipo de página que você quer rastrear. Consulte a tabela abaixo e as sub-páginas alvo correspondentes para orientações detalhadas sobre quando usar cada parâmetro.Parâmetros adicionais: Opcionalmente, você pode incluir parâmetros adicionais como
geo_location,user_agent_type,parse,rendere mais para personalizar sua requisição de scraping.
Endpoint:
Ignorar certificados. Em
cURL, é-kou--insecure.Nome de usuário e senha (Autenticação HTTP). Crie credenciais de usuário API durante seu cadastro de avaliação ou compra do produto.
Se você precisar de mais de um usuário de API para sua conta, por favor contate nosso suporte ao cliente ou envie uma mensagem ao nosso suporte via chat ao vivo 24/7.
Payload:
URL- Forneça oURLpara a página que você quer rastrear.Parâmetros adicionais: Opcionalmente, você pode incluir parâmetros adicionais como
geo_location,user_agent_type,parse, e envie-os como cabeçalhos.
Endpoint:
Nome de usuário e senha (Autenticação HTTP). Crie credenciais de usuário API durante seu cadastro de avaliação ou compra do produto.
Se você precisar de mais de um usuário de API para sua conta, por favor contate nosso suporte ao cliente ou envie uma mensagem ao nosso suporte via chat ao vivo 24/7.
Content-type. Ao enviar jobs, sempre adicione este cabeçalho:
Payload:
source- Este parâmetro define o scraper que será usado para processar sua requisição.URLouquery- Forneça oURLouquerypara o tipo de página que você quer rastrear. Consulte a tabela abaixo e as sub-páginas alvo correspondentes para orientações detalhadas sobre quando usar cada parâmetro.Parâmetros adicionais: Opcionalmente, você pode incluir parâmetros adicionais como
geo_location,user_agent_type,parse, e mais para personalizar sua requisição de scraping.
Ao enviar uma requisição, você receberá prontamente uma resposta JSON contendo todos os detalhes do job, incluindo parâmetros do job, ID do job e URLs para download dos resultados do job:
google
google_search,
google_ads,
google_lens,
google_maps,
google_travel_hotels,
google_trends_explore
Marketplaces
Primeiros passos
Selecione o marketplace online que você quer rastrear: Amazon, Google Shopping, Walmart, Best Buy, Etsy, Alvo, Outros sites.
Exemplo de requisição
Usamos o método de integração Realtime síncrona em nossos exemplos. Se você quiser usar Proxy Endpoint ou integração assíncrona Push-Pull consulte os métodos de integração na seção.
Formando uma requisição
Escolha seu método de integração: síncrono (Realtime, Proxy Endpoint) ou assíncrono (Push-Pull).
Ao formar uma requisição, inclua os seguintes elementos:
Endpoint:
Nome de usuário e senha (Autenticação HTTP). Crie credenciais de usuário API durante seu cadastro de avaliação ou compra do produto.
Se você precisar de mais de um usuário de API para sua conta, por favor contate nosso suporte ao cliente ou envie uma mensagem ao nosso suporte via chat ao vivo 24/7.
Content-type. Ao enviar jobs, sempre adicione este cabeçalho:
Payload:
source- Este parâmetro define o scraper que será usado para processar sua requisição.URLouquery- Forneça oURLouquerypara o tipo de página que você quer rastrear. Consulte a tabela abaixo e as sub-páginas alvo correspondentes para orientações detalhadas sobre quando usar cada parâmetro.Parâmetros adicionais: Opcionalmente, você pode incluir parâmetros adicionais como
geo_location,user_agent_type,parse,rendere mais para personalizar sua requisição de scraping.
Endpoint:
Ignorar certificados. Em
cURL, é-kou--insecure.Nome de usuário e senha (Autenticação HTTP). Crie credenciais de usuário API durante seu cadastro de avaliação ou compra do produto.
Se você precisar de mais de um usuário de API para sua conta, por favor contate nosso suporte ao cliente ou envie uma mensagem ao nosso suporte via chat ao vivo 24/7.
Payload:
URL- Forneça oURLpara a página que você quer rastrear.Parâmetros adicionais: Opcionalmente, você pode incluir parâmetros adicionais como
geo_location,user_agent_type,parse, e envie-os como cabeçalhos.
Endpoint:
Nome de usuário e senha (Autenticação HTTP). Crie credenciais de usuário API durante seu cadastro de avaliação ou compra do produto.
Se você precisar de mais de um usuário de API para sua conta, por favor contate nosso suporte ao cliente ou envie uma mensagem ao nosso suporte via chat ao vivo 24/7.
Content-type. Ao enviar jobs, sempre adicione este cabeçalho:
Payload:
source- Este parâmetro define o scraper que será usado para processar sua requisição.URLouquery- Forneça oURLouquerypara o tipo de página que você quer rastrear. Consulte a tabela abaixo e as sub-páginas alvo correspondentes para orientações detalhadas sobre quando usar cada parâmetro.Parâmetros adicionais: Opcionalmente, você pode incluir parâmetros adicionais como
geo_location,user_agent_type,parse, e mais para personalizar sua requisição de scraping.
Ao enviar uma requisição, você receberá prontamente uma resposta JSON contendo todos os detalhes do job, incluindo parâmetros do job, ID do job e URLs para download dos resultados do job:
amazon
amazon_product,
amazon_search,
amazon_pricing,
amazon_sellers,
amazon_bestsellers,
amazon_questions
Outros sites
Primeiros passos
Rastreie qualquer URL com nossa universal source. Você também pode adicionar parâmetros adicionais.
Exemplo de requisição
Usamos o método de integração Realtime síncrona em nossos exemplos. Se você quiser usar Proxy Endpoint ou integração assíncrona Push-Pull consulte os métodos de integração na seção.
Formando uma requisição
Escolha seu método de integração: síncrono (Realtime, Proxy Endpoint) ou assíncrono (Push-Pull).
Ao formar uma requisição, inclua os seguintes elementos:
Endpoint:
Nome de usuário e senha (Autenticação HTTP). Crie credenciais de usuário API durante seu cadastro de avaliação ou compra do produto.
Se você precisar de mais de um usuário de API para sua conta, por favor contate nosso suporte ao cliente ou envie uma mensagem ao nosso suporte via chat ao vivo 24/7.
Content-type. Ao enviar jobs, sempre adicione este cabeçalho:
Payload.
source- Este parâmetro define o scraper que será usado para processar sua requisição.URL- Forneça oURLdo alvo que você quer rastrear, por exemplo:Imobiliário: Idealista, Redfin, Zillow, Zoopla
Viagens: Airbnb, Agoda, Booking, TripAdvisor
Automotivo: Crunchbase, ZoomInfo, AngelList, Product Hunt
Dados de empresas: Netflix, SoundCloud, YouTube, IMDb
Entretenimento: AutoEurope, Autotrader, RockAuto, Halfords
Qualquer outro.
Parâmetros adicionais: Opcionalmente, você pode incluir parâmetros adicionais como
geo_location,user_agent_type, e mais para personalizar sua requisição de scraping.
Endpoint:
Ignorar certificados. Em
cURL, é-kou--insecure.Nome de usuário e senha (Autenticação HTTP). Crie credenciais de usuário API durante seu cadastro de avaliação ou compra do produto.
Se você precisar de mais de um usuário de API para sua conta, por favor contate nosso suporte ao cliente ou envie uma mensagem ao nosso suporte via chat ao vivo 24/7.
Payload:
URL- Forneça oURLpara a página que você quer rastrear, por exemplo:Imobiliário: Idealista, Redfin, Zillow, Zoopla
Viagens: Airbnb, Agoda, Booking, TripAdvisor
Automotivo: Crunchbase, ZoomInfo, AngelList, Product Hunt
Dados de empresas: Netflix, SoundCloud, YouTube, IMDb
Entretenimento: AutoEurope, Autotrader, RockAuto, Halfords
Qualquer outro.
Parâmetros adicionais: Opcionalmente, você pode incluir parâmetros adicionais como
geo_location,user_agent_type, e envie-os como cabeçalhos.
Endpoint:
Nome de usuário e senha (Autenticação HTTP). Crie credenciais de usuário API durante seu cadastro de avaliação ou compra do produto.
Se você precisar de mais de um usuário de API para sua conta, por favor contate nosso suporte ao cliente ou envie uma mensagem ao nosso suporte via chat ao vivo 24/7.
Content-type. Ao enviar jobs, sempre adicione este cabeçalho:
Payload.
source- Este parâmetro define o scraper que será usado para processar sua requisição.URL- Forneça oURLdo alvo que você quer rastrear, por exemplo:Imobiliário: Idealista, Redfin, Zillow, Zoopla
Viagens: Airbnb, Agoda, Booking, TripAdvisor
Automotivo: Crunchbase, ZoomInfo, AngelList, Product Hunt
Dados de empresas: Netflix, SoundCloud, YouTube, IMDb
Entretenimento: AutoEurope, Autotrader, RockAuto, Halfords
Qualquer outro.
Parâmetros adicionais: Opcionalmente, você pode incluir parâmetros adicionais como
geo_location,user_agent_type, e mais para personalizar sua requisição de scraping.
Ao enviar uma requisição, você receberá prontamente uma resposta JSON contendo todos os detalhes do job, incluindo parâmetros do job, ID do job e URLs para download dos resultados do job:
Se você precisar de assistência para fazer sua primeira requisição, sinta-se à vontade para nos contatar via chat ao vivo disponível 24/7.
Todas as informações aqui são fornecidas "tal como" e apenas para fins informativos. Não fazemos nenhuma declaração e isentamos toda responsabilidade com relação ao seu uso de qualquer informação contida nesta página. Antes de se envolver em atividades de scraping de qualquer tipo, você deve consultar seus conselheiros jurídicos e ler cuidadosamente os termos de serviço do site específico ou obter uma licença de scraping.
Atualizado
Isto foi útil?

