Markdown 输出

在负载中设置 "markdown": true 来请求 Oxylabs 网页爬虫 API 返回 markdown 格式输出——适合 AI 工作流和轻量内容。

此功能允许您以 Markdown 表示形式接收网页内容,作为 HTML 或 已解析 JSON 的替代选项。Markdown 输出提供易于阅读的格式,简化了将内容集成到各种工作流中的过程。

由于轻量且语法清晰,Markdown 格式在与大型语言模型(LLM)协作时特别有用。它是 RAG(检索增强生成)用例的事实标准,尤其适用于摄取网页数据的场景。

用法

若要在响应中获取网页的 Markdown 内容,请在请求负载中设置 "markdown": true 该参数默认设置为 false.

请求示例

以下示例演示如何提交请求以获取 Markdown 输出:

POST https://data.oxylabs.io/v1/queries
{
    "url": "https://example.com",
    "markdown": true
}

您也可以在 Real-Time API 端点 URL 中添加 ?type=raw,markdown 以同时获取 Markdown 和原始 HTML 结果。

POST https://realtime.oxylabs.io/v1/queries?type=raw,markdown
{
    "url": "https://example.com",
    "markdown": true
}

响应示例

响应将包含以字符串形式格式化的网页 Markdown 内容。该字符串会包含用于标题、段落、列表、链接、图像以及页面上其他结构化元素的标准 Markdown 语法。

最后更新于

这有帮助吗?