For the complete documentation index, see llms.txt. This page is also available as Markdown.

Markdown 输出

通过在负载中设置 `"markdown": true`,向 Oxylabs 网页爬虫API 请求 Markdown 格式输出——非常适合 AI 工作流和轻量内容。

此功能允许你获取网页的 markdown 表示,作为 HTML 或解析后的 JSON 的替代选项。Markdown 输出提供易读格式,便于集成到各种内容工作流中。

Markdown 格式在使用 LLM 时尤其有用,因为它轻量且语法清晰。对于 RAG(检索增强生成)用例,它是事实上的标准,尤其是在摄取网页数据时。

用法

要在响应中获取网页的 markdown 内容,请在 "markdown": true 放入你的请求载荷中。默认情况下,此参数设置为 false.

请求示例

下面是提交 markdown 输出请求的方法:

POST https://data.oxylabs.io/v1/queries
{
    "url": "https://example.com",
    "markdown": true
}

你也可以在 ?type=raw,markdown Real-Time API 端点 URL 中添加它,以同时获取 markdown 和原始 HTML 结果。

POST https://realtime.oxylabs.io/v1/queries?type=raw,markdown
{
    "url": "https://example.com",
    "markdown": true
}

响应示例

响应将以字符串形式包含格式化为 markdown 的网页内容。此字符串将包含标题、段落、列表、链接、图片以及页面中存在的其他结构化元素所使用的标准 markdown 语法。

这有帮助吗?