OxyCopilot

Automatize a raspagem com OxyCopilot. Aprenda a gerar payloads da Web Scraper API, custom parsers e instruções do navegador usando prompts simples em linguagem natural.

OxyCopilot é um recurso gratuito Web Scraper API que facilita a integração e ajuda os usuários a encontrar soluções eficazes para casos de uso complexos, tudo sem precisar de conhecimento de programação. OxyCopilot atualmente inclui três recursos separados:

  • Construtor de scraper

  • Custom Parser construtor

  • Construtor de instruções do navegador

Construtor de scraper

OxyCopilot ajuda você a configurar um scraper (e montar o payload da requisição) para a Web Scraper API sem precisar entender a documentação ou a lógica dos campos.

Como funciona

Etapa 1: Forneça uma URL e um prompt

  • URL: Forneça a URL que você quer raspar.

  • Prompt: Descreva seus requisitos (por exemplo, localização, renderização por JS etc.).

Etapa 2: Parsing

Você tem três opções para lidar com o parsing:

  1. Custom Parser: Selecione "Adicionar instruções de parsing" para criar sua própria lógica de parsing usando o Construtor de Custom Parser.

  2. Dedicated Parser: Se a URL for de um site para o qual fornecemos um parser dedicado e você quiser usá-lo, selecione "Continuar com Dedicated Parser".

  3. Sem parsing: Escolha prosseguir sem parsing se dados estruturados não forem necessários.

Se não tivermos um parser dedicado
Se tivermos um parser dedicado

Etapa 3: Revisar a requisição

Com base no seu prompt, o OxyCopilot preencherá automaticamente os parâmetros necessários no Web Scraper API Playground. Você verá o código da requisição e os parâmetros específicos para o seu caso de uso, e poderá ajustar os parâmetros se necessário.

Etapa 4: Enviar a requisição e copiar

Se estiver tudo certo, envie a requisição para ver como a saída fica e verificar se funciona como esperado. Em seguida, copie o código da requisição para usar nas suas próximas tarefas de scraping com a Web Scraper API.

Exemplo

URL

Prompt

Parâmetros gerados por IA (JSON)

Códigos de requisição gerados por IA

Construtor de Custom Parser

Aproveite o recurso de Custom Parser com o OxyCopilot para criar um parser sem precisar escrever código ou analisar manualmente a estrutura do site.

Como funciona

Etapa 1: Forneça URL(s) e um prompt

  • URL(s): Você pode fornecer até 3 URLs para as quais você quer gerar instruções de parsing. OxyCopilot usa o HTML das URLs fornecidas para determinar a melhor lógica para extrair os campos necessários.

Quanto mais URLs você fornecer, mais robustas serão as instruções de parsing, pois o OxyCopilot identifica padrões comuns entre páginas semelhantes. Observe que URLs adicionais podem aumentar o tempo de espera pelos resultados.

  • Prompt: O prompt é o componente principal na criação de um schema em linguagem natural, que serve de base para gerar as instruções de parsing reais. O prompt deve descrever claramente os campos que precisam ser analisados.

Etapa 2 [Opcional]: Ajustar o schema de parsing

Esta etapa permite refinar o schema de parsing para atender melhor às suas necessidades ou solucionar quaisquer problemas.

Visão geral do schema de parsing

Esta tabela visualiza a entrada usada pela IA para gerar instruções de parsing. O schema define quais campos precisam ser analisados e consiste em vários tipos de object (explicados na tabela abaixo).

Cada item no schema deve ter:

  • NomeIsso será usado como a chave do object nas instruções de parsing e ficará visível nos dados analisados.

  • Descrição (opcional, mas recomendado): Ajuda a melhorar a precisão do parsing.

Ajustes do schema

  • Reordenar itens: Arraste e solte os itens usando os pontos no lado esquerdo para alterar a ordem (somente itens no mesmo nível de aninhamento podem ser movidos).

  • Editar itens: Clique no ícone de edição para modificar qualquer campo.

  • Excluir itens: Você pode excluir qualquer item no nível pai.

  • Adicionar novos itens: Adicione novos itens ao nível pai.

Depois de atualizar o schema, clique no "Refresh output" botão para regenerar as instruções e visualizar os dados analisados.

Explicações dos tipos de object

Tipo de object
Descrição
Exemplo de dados analisados

String

Uma única saída de texto

“title”: “Título de produto de exemplo”

Número

Um único número

“price”: 9.99

Array de strings

Uma lista de saídas de texto

“products”: [“produto 1”, “produto 2”, “produto 3”]

Array de números

Uma lista de números

“pages”: [1, 2, 3]

Array de objects

Uma lista de objects/itens, cada um com seus próprios objects dentro (_items bloco nas instruções de parsing)

Trabalhando com array de objects

  1. Selecione "Array de objects": Esta opção adiciona um object filho e um botão.

  1. Preencha os nomes dos objects: Para salvar o item no schema, você deve preencher os nomes dos objects pai e filho. Quando terminar, a marca de verificação ficará verde.

  1. Requisito de object filho: Um "Array de objects" deve ter pelo menos um filho.

Testando as instruções

Por padrão, os dados analisados são baseados na primeira URL fornecida na Etapa 1. Você também pode fornecer uma URL diferente para testar as instruções de parsing:

Etapa 3: Copiar/salvar instruções e integrar aos jobs de scraping

Depois que as instruções estiverem satisfatórias:

  • Use o "Copy" botão para copiar as instruções e colá-las no código do seu scraper.

  • Como alternativa, salve as instruções na sua sessão do Web Scraper API Playground, ajuste outros parâmetros da requisição, teste e depois copie o código completo da requisição na linguagem de programação de sua preferência.

Exemplo

URL

Prompt

Schema de parsing

Tipo de object
Nome*
Descrição

String

product_title

Título do produto

Número

price

Preço do produto

Array de strings

related_products

Títulos de produtos relacionados abaixo das informações principais do produto

Instruções de parsing

Dados analisados

Gerando instruções de parsing via uma API

Se você quiser gerar muitos conjuntos diferentes de instruções de parsing para cobrir a variedade de sites com os quais trabalha, você pode criar instruções de parsing via uma API – veja API geradora de instruções de parsing para ver como isso é feito.

Construtor de instruções do navegador

Você pode usar o OxyCopilot para criar scripts complexos de interação com páginas sem analisar a estrutura do site ou escrever manualmente a configuração para seus Browser Instructions.

Como funciona

Etapa 1: Forneça uma URL e um prompt

  • URL: Forneça uma única URL para gerar instruções do navegador. OxyCopilot usa o HTML da URL fornecida para determinar como scriptar as interações da página web de que você precisa.

  • Prompt: O prompt é crucial para criar as instruções do navegador. Descreva claramente quais ações você gostaria que fossem executadas na página da web assim que ela abrir (por exemplo, "Role até o final, aguarde o botão 'próxima página' carregar, clique no botão 'próxima página'").

Etapa 2 [Opcional]: Ajustar as instruções do navegador

Esta etapa permite refinar a sequência de instruções do navegador para atender melhor às suas necessidades ou solucionar quaisquer problemas.

Visão geral das instruções do navegador

Quando o OxyCopilot terminar de processar sua entrada, ele exibirá a sequência de instruções do navegador que criou.

Você pode ajustar a sequência editando, adicionando ou removendo etapas.

Etapa 3: Copiar/salvar instruções e integrar aos jobs de scraping

Quando as instruções estiverem satisfatórias, você pode salvá-las na sua sessão do Web Scraper API Playground, ajustar outros parâmetros da requisição, testar e então copiar o código completo da requisição na linguagem de programação de sua preferência.

Atualizado

Isto foi útil?