For the complete documentation index, see llms.txt. This page is also available as Markdown.

Python SDK

Aprenda a usar o AI Studio Python SDK.

Oferecemos um SDK Python simples para interagir de forma contínua com a API do Oxylabs AI Studio serviços, incluindo AI-Scraper, AI-Crawler, AI-Browser-Agent e outras ferramentas de extração de dados.

Requisitos

  • python 3.10 e superior

  • chave da API do AI Studio

Instalação

pip install oxylabs-ai-studio

Uso

Rastreamento (AiCrawler.crawl)

from oxylabs_ai_studio.apps.ai_crawler import AiCrawler

crawler = AiCrawler(api_key="<API_KEY>")

url = "https://oxylabs.io"
result = crawler.crawl(
    url=url,
    user_prompt="Encontre todas as páginas com preços de produtos de proxy",
    output_format="markdown",
    render_javascript=False,
    return_sources_limit=3,
    geo_location="US",
)
print("Resultados:")
for item in result.data:
    print(item, "\n")

Parâmetros de entrada

  • url (str): URL inicial para rastrear (obrigatório)

  • user_prompt (str): Prompt em linguagem natural para orientar a extração (obrigatório)

  • output_format (Literal["json", "markdown"]): Formato de saída (padrão: "markdown")

  • schema (dict | None): esquema OpenAPI para extração estruturada (obrigatório se output_format for "json")

  • render_javascript (bool): Renderizar JavaScript (padrão: False)

  • return_sources_limit (int): Número máximo de fontes a retornar (padrão: 25)

  • geo_location (str): localização do proxy no formato ISO2.

Extração (AiScraper.scrape)

Parâmetros de entrada

  • url (str): URL de destino para extrair (obrigatório)

  • output_format (Literal["json", "markdown"]): Formato de saída (padrão: "markdown")

  • schema (dict | None): esquema OpenAPI para extração estruturada (obrigatório se output_format for "json")

  • render_javascript (bool): Renderizar JavaScript (padrão: False)

  • geo_location (str): localização do proxy no formato ISO2.

Browser Agent (BrowserAgent.run)

Parâmetros de entrada

  • url (str): URL inicial para navegar (obrigatório)

  • user_prompt (str): Prompt em linguagem natural para extração (obrigatório)

  • output_format (Literal["json", "markdown", "html", "screenshot"]): Formato de saída (padrão: "markdown")

  • schema (dict | None): esquema OpenAPI para extração estruturada (obrigatório se output_format for "json")

  • geo_location (str): localização do proxy no formato ISO2.

Pesquisa (AiSearch.search)

Parâmetros de entrada

  • query (str): O que pesquisar (obrigatório)

  • limit (int): Número máximo de resultados a retornar (padrão: 10, máximo: 50)

  • render_javascript (bool): Renderizar JavaScript (padrão: False)

  • return_content (bool): Se deve retornar o conteúdo em markdown nos resultados (padrão: True)

  • geo_location (str): localização do proxy de busca no formato ISO2.

Mapa (AiMap.map)

Parâmetros de entrada

  • url (str): URL inicial para rastrear (obrigatório)

  • user_prompt (str): Prompt em linguagem natural para orientar a extração (obrigatório)

  • render_javascript (bool): Renderizar JavaScript (padrão: False)

  • return_sources_limit (int): Número máximo de fontes a retornar (padrão: 25)

  • geo_location (str): localização do proxy no formato ISO2.

Exemplos de uso

Veja a pasta examples no nosso GitHub para exemplos detalhados de uso de cada método (cada método tem uma versão assíncrona ).

Atualizado

Isto foi útil?