Target genérico

Veja como suas requisições ficariam com a fonte universal.

Raspagem de outros sites (Home Depot, Idealo, Zillow, Yandex, Baidu, etc.) com nosso universal fonte. Aceita URLs juntamente com parâmetros adicionais.

Amostras de requisição

Neste exemplo, a API irá recuperar uma página de produto de e-commerce.

curl 'https://realtime.oxylabs.io/v1/queries' \
--user 'USERNAME:PASSWORD' \
-H 'Content-Type: application/json' \
-d '{
        "source": "universal",
        "url": "https://sandbox.oxylabs.io/products/1"
    }'
chevron-rightExemplo de saídahashtag
{
    "results": [
        {
            "content": "<!DOCTYPE html><html lang=\"en\">
            CONTEÚDO
            </html>",
            "created_at": "2024-07-01 11:35:14",
            "updated_at": "2024-07-01 11:35:15",
            "page": 1,
            "url": "https://sandbox.oxylabs.io/products/1",
            "job_id": "7213505428280329217",
            "status_code": 200
        }
    ]
}

Usamos o método de integração síncrono Realtime em nossos exemplos. Se você quiser usar Proxy Endpoint ou integração assíncrona Push-Pull consulte os métodos de integração da seção.

Valores dos parâmetros da requisição

Genérico

Parâmetro
Descrição
Valor Padrão

source

Define o scraper.

universal

url

URL direta (link) para qualquer página.

-

callback_url

URL para o seu endpoint de callback. Mais info.

-

- parâmetro obrigatório

Adicional

Estes são os parâmetros do nosso recursos.

Parâmetro
Descrição
Valor Padrão

geo_location

Define a localização geográfica do proxy para recuperar dados. Encontre locais suportados aquiarrow-up-right.

-

render

Ativa a renderização JavaScript quando definido como html. Mais info. NOTA: Se você estiver observando baixas taxas de sucesso ou obtendo conteúdo vazio, tente adicionar este parâmetro.

-

browser_instructions

Defina suas próprias instruções de navegador que são executadas ao renderizar JavaScript. Mais info.

-

parse

Retorna dados parseados quando definido como true, desde que exista um parser dedicado para o tipo de página da URL enviada.

false

parsing_instructions

Defina sua própria lógica de parsing e transformação de dados que será executada sobre o resultado da raspagem HTML. Leia mais: Exemplos de instruções de parsing.

-

context: headers

Passe seus próprios headers. Saiba mais aqui.

-

context: cookies

Passe seus próprios cookies. Saiba mais aqui.

-

context: session_id

Se você quiser usar o mesmo proxy em várias solicitações, pode fazê-lo usando este parâmetro. Basta definir sua sessão como qualquer string que desejar, e nós atribuíremos um proxy a esse ID e o manteremos por até 10 minutos. Depois disso, se você fizer outra solicitação com o mesmo ID de sessão, um novo proxy será atribuído a esse ID de sessão em particular.

-

context: http_method

Defina como post se você quiser fazer uma POST solicitação para sua URL de destino via E-commerce Scraper API. Saiba mais aqui.

get

user_agent_type

Tipo de dispositivo e navegador. A lista completa pode ser encontrada aqui.

desktop

context: conteúdo

Codificado em Base64 POST corpo da solicitação. Só é útil se http_method está definido como post.

-

content_encoding

Adicione este parâmetro se estiver baixando imagens. Saiba mais aqui.

base64

context: follow_redirects

Defina como true para permitir que o scraper siga redirecionamentos. Por padrão, redirecionamentos são seguidos até um limite de 10 links, tratando toda a cadeia como um único trabalho de raspagem.

true

context: successful_status_codes

Defina um código de resposta HTTP personalizado (ou alguns deles), sobre o qual devemos considerar a raspagem bem-sucedida e retornar o conteúdo para você. Pode ser útil se você quiser que retornemos a página de erro 503 ou em outros casos não padrão.

-

Todos os parâmetros

Neste exemplo, todos os parâmetros disponíveis estão incluídos (embora nem sempre necessários ou compatíveis na mesma solicitação), para lhe dar uma ideia de como formatar suas solicitações.

Atualizado

Isto foi útil?