谷歌索引可用性检查API 帮助开发人员、SEO人员和网站所有者确保页面符合谷歌索引的包含资格。发送一个URL并获取一个干净的JSON结果(indexability),以及每个检查的人类可读解释:HTTP状态、软404检测、robots指令(HTTP + HTML)、robots.txt的允许/拒绝、元刷新陷阱和重定向行为。将其用于限制部署、监控大型网站或快速调试产品/目录页面的索引问题。
一次调用结果: indexability = indexable, conditionally_indexable 或 not_indexable(见下面的指南)。
丰富的诊断: checks[] 包含用普通英语写的 passed 布尔值及其说明。
重定向意识:完整的 redirect_hops 以及 redirect_count 和 final_url。
随处可见的机器人:评估 X-Robots-Tag 头、HTML元机器人和 robots.txt。
软404测试:标记伪装成200的薄/空页面。
一致的模式:固定、易于解析的字段,用于审核仪表板和CI机器人。
响应字段词汇表:
final_url (字符串) — 重定向后的解析URL。
status_code (数字) — final URL的HTTP状态。
status_code_name (字符串) — 标准原因短语(例如:“OK”,“永久移动”)。
status_code_meaning (字符串) — 人类可读的解释。
is_soft_404 (布尔值) — 对于看起来像404/空内容的页面(尽管状态为200)的启发式。
redirect_count (数字) — 跟随的重定向数量。
redirect_hops (数组) — 每个跳转:{ hop, url, status_code }。
checks (数组) — 各个检查:
name (字符串) — 标识符(例如, status_code, soft_404_test, x_robots_tag, meta_robots, robots_txt, meta_refresh_0)。
passed (布尔值) — 如果要求满足则为真。
explanation (字符串) — 您可以直接在UI中显示的简短理由。
indexability (字符串) — 整体裁决:
indexable — 所有关键检查通过。
conditionally_indexable — 一般可以,但检测到一些小问题(例如,不寻常的规范模式,非阻塞的元刷新带延迟等。[根据您何时包含此类检查,自定义您的后端逻辑])。
not_indexable — 一个或多个关键阻塞因素(noindex,disallow,4xx/5xx,立即元刷新,软404)。
error_message (字符串|null) — 如果因抓取/解析错误导致检查失败,则填充。
{"final_url":"https://www.example.com/","status_code":200,"is_soft_404":false,"status_code_name":"OK","status_code_meaning":"Request succeeded.","redirect_hops":[{"hop":1,"url":"https://www.example.com/","status_code":200}],"redirect_count":0,"checks":[{"name":"status_code","passed":true,"explanation":"Status code = 200"},{"name":"soft_404_test","passed":true,"explanation":"Soft 404 not detected"},{"name":"x_robots_tag","passed":true,"explanation":"X-Robots-Tag permits indexing"},{"name":"meta_robots","passed":true,"explanation":"Meta robots permits indexing"},{"name":"robots_txt","passed":true,"explanation":"robots.txt allows crawling"},{"name":"meta_refresh_0","passed":true,"explanation":"No immediate meta refresh"}],"indexability":"indexable","error_message":null}
curl --location --request GET 'https://zylalabs.com/api/10687/google+indexability+checker+api/20241/indexability+checker?url=https://www.example.com/' --header 'Authorization: Bearer YOUR_API_KEY'
| 标头 | 描述 |
|---|---|
授权
|
[必需] 应为 Bearer access_key. 订阅后,请查看上方的"您的 API 访问密钥"。 |
无长期承诺。随时升级、降级或取消。 免费试用包括最多 50 个请求。
这意味着没有检测到关键阻塞因素(HTTP 200/正常,未设置noindex,robots.txt允许,没有软404,没有即时meta刷新),因此该页面可以被谷歌索引
不 索引最终是谷歌的决定 我们验证符合资格的常见技术前提
是的。我们在redirect_hops中报告每一个跳转,redirect_count和final_url。
HTTP X-Robots-Tag头和HTML <meta name="robots">标签
是的 我们获取并解析主机的robots.txt以确定提交的URL是否允许爬取
查看checks[]以查找失败项(例如meta_robots noindex robots_txt disallow soft-404)解释将告诉你原因
我们跟随他们到达最终目的地。如果链的末端是可索引的,你会看到可索引 = 可索引
目前我们不支持批量请求,请暂时针对每个网址发送单独的请求。大批量输入即将到来😊
平均响应时间为1至3秒,具体取决于网站的加载速度和重定向链的长度 复杂页面或慢速服务器可能需要稍长时间
间接地,是的。虽然它并不会直接影响排名,但确保页面在技术上可被索引是良好SEO的基础。API帮助您捕捉那些会阻止Google完全索引您内容的阻碍因素
索引可检性检查器端点返回一个包含有关URL索引可检性状态的信息的JSON对象,包括HTTP状态、软404检测、机器人指令和重定向行为
关键字段包括`final_url`、`status_code`、`is_soft_404`、`redirect_count`和`checks[]`,这些字段提供有关URL可索引性的详细诊断
响应被构建为一个JSON对象,具有顶层的可索引性判定,随后是像`checks[]`这样的详细字段用于单个诊断,便于解析和分析
该API提供有关HTTP状态代码、软404检测、爬虫指令(X-Robots-Tag和meta robots)及重定向行为的信息,帮助用户评估页面的可索引性
用户可以通过向端点提交不同的 URL 来自定义请求,从而根据特定页面或网站的部分进行量身定制的检查
像 `status_code_name` 这样的字段提供标准的原因短语(例如,“成功”),而 `checks[].explanation` 则为每个检查提供可读的人类理由,帮助快速诊断
典型的用例包括监控大型网站的索引问题 调试特定页面 以及确保新的部署符合谷歌的索引标准
通过对提交的URL进行实时检查来保持数据的准确性,确保API反映Google所看到的页面的当前状态
索引性检查器评估多个方面,包括HTTP状态码、软404检测、X-Robots-Tag头、HTML元机器人、robots.txt规则和即时元刷新陷阱。每个检查提供布尔结果和可读的解释
`checks[]` 数组包含个别检查,具有 `name`、`passed` 和 `explanation` 等字段。每个条目指示特定要求是否满足,并提供简要说明,帮助您快速识别潜在问题
`is_soft_404` 字段是一个布尔值,用于指示页面是否似乎是一个软404 这意味着它返回200状态但包含很少或没有内容 这有助于识别可能误导搜索引擎关于其实际内容的页面
该API通过`redirect_hops`数组跟踪重定向,该数组列出了每个跳转的URL和状态码。`redirect_count`指示跟随了多少个重定向,以确保您了解最终URL的可索引状态
`final_url`字段显示在所有重定向都已跟随后解析的URL。这对于理解最终被评估为可索引的URL至关重要,尤其是在涉及多个重定向的情况下
是的,API 允许您通过检查 `checks[]` 数组来识别特定的索引问题。每个检查提供有关潜在阻碍因素的见解,例如 noindex 指令或不允许的 robots.txt 规则,从而实现有针对性的故障排除
`error_message` 字段提供了在由于获取或解析错误导致检查失败时的信息。这有助于诊断 URL 提交过程中的问题,使您在必要时采取纠正措施
您可以提交任何公开可访问的 URL 进行分析 该 API 旨在评估标准网页 确保它们符合 Google 的索引标准 基于所执行的检查
服务级别:
100%
响应时间:
1,320ms
服务级别:
100%
响应时间:
601ms
服务级别:
100%
响应时间:
786ms
服务级别:
100%
响应时间:
1,301ms
服务级别:
100%
响应时间:
3,519ms
服务级别:
100%
响应时间:
889ms
服务级别:
100%
响应时间:
2,760ms
服务级别:
100%
响应时间:
1,993ms
服务级别:
100%
响应时间:
6,234ms
服务级别:
100%
响应时间:
194ms