其他域名
这种数据类型是通用的并且可以应用于任何域名。它接受带有附加参数的 URL。您可以在下表中找到可用参数的列表。
查询参数
参数 | 描述 | 默认值 |
---|---|---|
| 数据源。更多信息。 |
|
| 转到通用页面的直接 URL(链接)。 | 不适用 |
| 设备类型和浏览器。单击此处查看完整列表。 |
|
| 用于检索数据的代理的地理定位。单击此处查看支持位置的完整列表。 | 不适用 |
| 区域设置,正如接受语言标头所预期的一样。 | 不适用 |
| 启用 JavaScript 渲染。更多信息。 | 不适用 |
| 如果正在下载图像,请添加此参数。单击此处了解更多相关信息。 |
|
| Base64 编码的 | 不适用 |
| 传递自己的 cookies。 | 不适用 |
| 表明您是否希望爬虫程序遵循重定向(带有目标 URL 的 3xx 响应)以获得重定向链末端的 URL 内容。 | 不适用 |
| 传递自己的标头。 | 不适用 |
| 如果您希望通过 网络爬虫 API 程序向您的目标 URL 发出 |
|
| I如果要在多个请求中使用同一个代理,则可以通过使用该参数来实现。只要将您的会话设置为您想要的任何字符串,我们就会为该 ID 分配一个代理,并最长保留 10 分钟。之后,如果使用相同的会话 ID 提出另一个请求,我们将为该特定会话 ID 分配一个新代理。 | 不适用 |
| 定义一个或几个自定义的 HTTP 响应代码,我们将根据此代码确定爬取是否成功,并将相关内容返回给您。如果您希望我们返回 503 错误页面,则该参数可能很有用,同时也适用于其他一些非标准的情况。 | 不适用 |
| 转至回调端点的 URL。更多信息。 | 不适用 |
- 必须提供的参数
代码示例
在这个示例中,API 将检索一个电子商务产品页面。包括所有可用参数(尽管在同一个请求中并不总是必要的或兼容的),以便让您知道如何格式化您的请求:
以上示例使用了 Realtime 集成方法。如果您想在您的查询中使用一些其他集成方法(如推拉或代理端点),请参考集成方法部分。
Last updated