Python SDK

了解如何使用 AI Studio 的 Python SDK。

YouTube

我们提供一个简单的 Python SDK,用于无缝与 Oxylabs AI Studio API 服务交互,包括 AI-Scraper、AI-Crawler、AI-Browser-Agent 以及其他数据提取工具。

要求

  • python 3.10 及以上

  • AI Studio API 密钥

安装

用法

爬取 (AiCrawler.crawl)

输入参数

  • url (str): 开始爬取的 URL (必需)

  • user_prompt (str): 用于指导提取的自然语言提示 (必需)

  • output_format (Literal["json", "markdown"]): 输出格式(默认: "markdown")

  • schema (dict | None): 用于结构化提取的 OpenAPI schema(如果 output_format 为 "json" 则必需)

  • render_javascript (bool): 是否渲染 JavaScript(默认: False)

  • return_sources_limit (int): 返回的最大来源数量(默认: 25)

  • geo_location (str): 以 ISO2 格式表示的代理位置。

抓取 (AiScraper.scrape)

输入参数

  • url (str): 要抓取的目标 URL (必需)

  • output_format (Literal["json", "markdown"]): 输出格式(默认: "markdown")

  • schema (dict | None): 用于结构化提取的 OpenAPI schema(如果 output_format 为 "json" 则必需)

  • render_javascript (bool): 是否渲染 JavaScript(默认: False)

  • geo_location (str): 以 ISO2 格式表示的代理位置。

浏览器代理 (BrowserAgent.run)

输入参数

  • url (str): 开始浏览的 URL (必需)

  • user_prompt (str): 用于提取的自然语言提示 (必需)

  • output_format (Literal["json", "markdown", "html", "screenshot"]): 输出格式(默认: "markdown")

  • schema (dict | None): 用于结构化提取的 OpenAPI schema(如果 output_format 为 "json" 则必需)

  • geo_location (str): 以 ISO2 格式表示的代理位置。

搜索 (AiSearch.search)

输入参数

  • query (str): 要搜索的内容 (必需)

  • limit (int): 返回的最大结果数量(默认: 10,最大值: 50)

  • render_javascript (bool): 是否渲染 JavaScript(默认: False)

  • return_content (bool): 是否在结果中返回 markdown 内容(默认: True)

  • geo_location (str): 以 ISO2 格式表示的搜索代理位置。

地图 (AiMap.map)

输入参数

  • url (str): 开始爬取的 URL (必需)

  • user_prompt (str): 用于指导提取的自然语言提示 (必需)

  • render_javascript (bool): 是否渲染 JavaScript(默认: False)

  • return_sources_limit (int): 返回的最大来源数量(默认: 25)

  • geo_location (str): 以 ISO2 格式表示的代理位置。

使用示例

请参见 示例 文件夹中包含每个方法的使用示例。

每个方法都有对应的异步版本。

最后更新于

这有帮助吗?