Markdown 输出

通过在负载中设置 "markdown": true 请求 Oxylabs Web Scraper API 返回 markdown 格式的输出——适用于 AI 工作流和轻量内容。

此功能允许您接收网页的 Markdown 表示,作为 HTML 或解析后 JSON 的替代选项。Markdown 输出提供易读格式,简化与各类内容工作流的集成。

在与大型语言模型(LLM)协作时,Markdown 格式尤其有用,因为它轻量且语法清晰。它是 RAG(检索增强生成)用例的事实标准,尤其是在摄取网页数据时。

用法

要在响应中获取网页的 Markdown 内容,请在请求负载中设置 "markdown": true 默认情况下,此参数设置为 false.

请求示例

以下是提交以获取 Markdown 输出的请求方式:

POST https://data.oxylabs.io/v1/queries
{
    "url": "https://example.com",
    "markdown": true
}

您还可以添加 ?type=raw,markdown 到 Real-Time API 端点 URL 中,以同时获取 Markdown 和原始 HTML 结果。

POST https://realtime.oxylabs.io/v1/queries?type=raw,markdown
{
    "url": "https://example.com",
    "markdown": true
}

响应示例

响应将包含以字符串格式呈现的网页内容的 Markdown。该字符串将包含页面中存在的标题、段落、列表、链接、图片和其他结构化元素的标准 Markdown 语法。

最后更新于

这有帮助吗?