For the complete documentation index, see llms.txt. This page is also available as Markdown.

Qualquer Domínio

Encontre guias dedicados e universais da Oxylabs Web Scraper API para qualquer site público.

Descubra nossos guias dedicados da Web Scraper API para sites de e-commerce, motores de busca, LLMs e IA, dados de vídeo, imóveis plataformas, ou extraia qualquer site público com nossa universal source usando o guia abaixo. Ele aceita URLs junto com parâmetros adicionais.

Exemplos de solicitação

Neste exemplo, a API vai recuperar uma página de produto de e-commerce.

curl 'https://realtime.oxylabs.io/v1/queries' \
--user 'USERNAME:PASSWORD' \
-H 'Content-Type: application/json' \
-d '{
        "source": "universal",
        "url": "https://sandbox.oxylabs.io/products/1"
    }'
Exemplo de saída
{
    "results": [
        {
            "content": "<!DOCTYPE html><html lang=\"en\">
            CONTENT
            </html>",
            "created_at": "2024-07-01 11:35:14",
            "updated_at": "2024-07-01 11:35:15",
            "page": 1,
            "url": "https://sandbox.oxylabs.io/products/1",
            "job_id": "7213505428280329217",
            "status_code": 200
        }
    ]
}

Usamos o método de integração Realtime síncrona em nossos exemplos. Se você quiser usar Proxy Endpoint ou a integração assíncrona Push-Pull , consulte a seção métodos de integração .

Valores dos parâmetros da solicitação

Genérico

Parâmetro
Descrição
Valor padrão

source

Define o scraper.

universal

url

URL direta (link) para qualquer página.

-

callback_url

URL para seu endpoint de callback. Mais informações.

-

- parâmetro obrigatório

Adicional

Estes são os parâmetros das nossas recursos.

Parâmetro
Descrição
Valor padrão

geo_location

Define a localização geográfica do proxy para recuperar dados. Encontre os locais suportados aqui.

-

render

Habilita a renderização de JavaScript quando definido como html. Mais informações. OBSERVAÇÃO: Se você estiver observando taxas de sucesso baixas ou recuperando conteúdo vazio, tente adicionar este parâmetro.

-

browser_instructions

Defina suas próprias instruções de navegador que serão executadas durante a renderização de JavaScript. Mais informações.

-

parse

Retorna dados analisados quando definido como true, desde que exista um parser dedicado para o tipo de página da URL enviada.

false

parsing_instructions

Defina sua própria lógica de parsing e transformação de dados que será executada em um resultado de scraping de HTML. Leia mais: Exemplos de instruções de parsing.

-

context: headers

Passe seus próprios headers. Saiba mais aqui.

-

context: cookies

Passe seus próprios cookies. Saiba mais aqui.

-

context: session_id

Se você quiser usar o mesmo proxy com várias requisições, pode fazer isso usando este parâmetro. Basta definir sua sessão para qualquer string de sua preferência, e atribuíremos um proxy a este ID e o manteremos por até 10 minutos. Depois disso, se você fizer outra requisição com o mesmo session ID, um novo proxy será atribuído a esse session ID específico.

-

context: http_method

Defina como post se você quiser fazer uma POST requisição para a URL de destino via E-Commerce Scraper API. Saiba mais aqui.

get

user_agent_type

Tipo de dispositivo e navegador. A lista completa pode ser encontrada aqui.

desktop

context: content

Codificado em Base64 POST corpo da requisição. Isso só é útil se http_method está definido como post.

-

content_encoding

Adicione este parâmetro se você estiver baixando imagens. Saiba mais aqui.

base64

context: follow_redirects

Defina como true para permitir que o scraper siga redirecionamentos. Por padrão, os redirecionamentos são seguidos até o limite de 10 links, tratando toda a cadeia como um único job de scraping.

true

context: successful_status_codes

Defina um código de resposta HTTP personalizado (ou alguns deles), com base no qual devemos considerar o scraping bem-sucedido e retornar o conteúdo para você. Pode ser útil se você quiser que retornemos a página de erro 503 ou em outros casos fora do padrão.

-

Todos os parâmetros

Neste exemplo, todos os parâmetros disponíveis estão incluídos (embora nem sempre sejam necessários ou compatíveis na mesma requisição), para dar uma ideia de como formatar suas requisições.

Atualizado

Isto foi útil?