鹿泽笔记 - 记录互联网技术知识,工作与生活点滴的个人博客

seo网页优化策划方案分析页面被发现但未编入索引的原因

我们重新设计了网站,并添加了一些新页面。有些页面已成功索引,有些则未成功。我在谷歌上尝试了多次,但没有成功。现在,当我将 URL 提交到索引时,它通过 Google Search Console 显示此错误:已发现 – 当前未编入索引。

此警告来自 Google Search Console 中“索引”报告的“页面”部分。该报告让用户深入了解 Google 已抓取和索引哪些页面以及在执行此操作时可能遇到的问题。

该报告将提供已成功爬网和索引的页面的详细信息。它还列出了网站上的页面未被索引的原因。本文分享一下seo网页优化策划方案分析页面被发现但未编入索引的原因是什么。

如果页面未编入索引会出现问题吗?

大多数网站都有未编入索引的页面,不需要担心。

例如,某个页面可能会通过页面上的HTML“noindex”标签故意从搜索引擎索引中排除,或者可能在 robots.txt 文件中被阻止爬行。故意从索引中排除的 URL 以及存在索引问题的页面将显示在此报告中。

一般来说,对网站上的新页面进行爬网和索引可能需要一些时间。新页面需要一段时间才能显示在报告的“索引”页面中并不总是存在问题的迹象。

并非“为什么页面未编入索引”报告中的所有原因都需要解决。

索引问题

Google 不会抓取并索引它找到的每个 URL 。作为网站管理员,主要关心的是希望作为搜索结果提供的页面是否被索引。

本质上,如果它们没有被索引,它们将没有资格成为搜索结果。

“为什么页面没有被编入索引”报告中有几个原因确实表明网站上存在应该修整的问题。例如,“服务器错误 (500)”和“ 404”。

如果不希望将这些标志编入索引,那么这些标志对于各个 URL 来说不一定是问题,但它们可能表明该网站存在更广泛的问题。

什么是“已发现 – 目前未编入索引”?

“已发现 – 目前未编入索引”是 Google 为它知道但尚未编入索引的 URL 标记的错误。

需要记住的重要一点是,如果 URL 可以放入报告中的另一个存储中,则它们不会出现在该存储中。

例如,从技术上讲,带有 noindex 标签的页面可能已被 Google 发现且未编入索引,但它会出现在“被‘noindex’标签排除”存储中,因此“已发现 – 当前未编入索引”存储中的页面就在那里出现。

对于显示为“已发现 -当前未编入索引”的URL,Google 给出的解释是:

“谷歌发现了该页面,但尚未抓取。通常,Google 想要抓取该 URL,但预计这会导致网站超载;因此 Google 重新安排了抓取时间。这就是为什么报告上的上次抓取日期为空。”

谷歌试图让其机器人认真地爬行。

也就是说,由于 Googlebot 不是网站的唯一访问者,并且可能是抓取该网站的众多机器人之一,因此它不希望通过向服务器发送太多“请求”而导致网站崩溃。

是什么可能导致 URL “被发现 – 目前未编入索引”?

某个页面被 Google 识别但未编入索引有两个主要原因。

本质上,除了考虑服务器承受爬行的能力之外,还考虑页面质量。

现在,如果一个页面没有被抓取,谷歌如何知道它的质量呢?它可以做的是根据网站其它地方页面的质量做出假设。

没错 – 网站其它地方的重复、低价值页面可能会影响核心页面的索引。

如何解决这个问题

没有快速修复方法可以将页面从“已发现 – 当前未编入索引”移动到“已编入索引”,但可以尝试多种解决方案。

检查页面是否确实被索引

第一个目的是确定 Google Search Console 报告是否准确且最新。

在报告的右上角,将看到“上次更新”日期。这可以了解该报告是否可能已过时。

接下来,转到 Google 并执行site:[yourwebsitedomain] inurl:[要索引的页面的 URL slug]搜索。

如果该页面作为搜索结果返回,那么就知道它实际上已被索引。

给报告一些时间来更新,它将开始出现在“已索引”部分下,而不是出现在“已发现 – 当前未索引”报告中。

检查网站的页面质量

接下来,可能需要考虑网站的整体质量,因为这可能是 Google 不为页面编制索引的原因。

请记住,质量不仅仅是衡量网站上的关键词、它们与搜索查询的相关性以及显示的整体“EEAT”。

“当谈到内容的质量时,我们指的不仅仅是文章的文字。这确实是整个网站的质量。这包括从布局到设计的一切。比如,如何在页面上呈现内容、如何整合图像、如何快速工作,所有这些因素都会在那里发挥作用。”

因此,请记住这些标准来检查网站。与竞争对手相比,网站质量如何?彻底的网站检查是一个很好的起点。

检查重复页面

有时,网站可能有网站管理员不知道的低质量或重复的页面。

例如:

  • 可以通过多个 URL 访问一个页面。
  • 如果 Googlebot 可以访问带有“尾部斜杠”的 URL 和不带“尾部斜杠”的 URL,则它们会被视为单独的页面,并且服务器会返回 200 状态代码。也就是说,它们都是实时页面。
  • 所有页面都有可能以同样的方式重复。
  • 网站上可能还存在许多不知道的URL 参数。这些是包含“查询字符串”的 URL。
  • 它们通常是由网站上的过滤和排序选项引起的。在电子商务网站中,这可能看起来像一个产品类别页面,该页面按颜色等标准进行过滤,并且能够按价格排序。

因此,页面的主要功能不会因这种过滤和排序而改变,只是列出的产品会改变。这些在技术上是独立的、可抓取的页面,可能会在网站上造成大量重复。

可能认为网站上只有 100 个高质量页面。然而,由于这些技术问题,Googlebot 可能会看到数十万个近乎重复的页面。

修复“已发现 – 目前未编入索引”的方法

一旦确定了 URL 未编入索引的可能原因,就可以尝试修复它。如果网站存在重复页面、低质量、抄袭内容或其它质量问题,那么就从这里开始。

作为一个附带好处,当努力解决这些问题时,可能会看到页面排名有所提高。

表明页面的重要性

我建议尝试提高页面在搜索引擎眼中的重要性。给他们一个抓取它的理由。

将页面添加到网站的 XML 站点地图

向 Google 表明这是一个值得抓取和索引的重要页面的一种方法是将其添加到网站的 XML 站点地图中。这本质上是认为搜索机器人应该抓取的所有 URL 的路标。请记住,Googlebot 已经知道该页面存在;它只是不相信对其进行爬行和索引有什么好处。

添加内部链接到页面

显示页面重要性的另一种方法是从网站的内部页面链接到该页面。例如,将页面添加到主导航系统(如主菜单)。或者从网站其它页面的文本中添加上下文链接。这些将向 Googlebot 表明它是网站上的重要页面。

添加外部链接到页面

反向链接——它们是搜索引擎优化的基本组成部分。我们早就知道谷歌会使用其它网站的链接来确定页面与主题的相关性和权威性。

如果很难向 Google 展示页面质量足以建立索引,那么拥有来自信誉良好的相关网站的外部链接指向该页面可以进一步保证该页面的价值。

提交以供抓取

对网站进行更改后,请尝试重新提交要通过 Google Search Console 进行抓取的页面。

如果在 Google Search Console“索引”报告中注意到,一段时间后该 URL 仍然位于“已发现 – 当前未抓取”存储中(Google 可能需要几天到几周的时间才能抓取提交的页面) ),那么就知道该页面可能仍然存在一些问题。

总之

优化网站以进行抓取和索引。如果这样做,可能会看到这些页面从“已发现 – 当前未编入索引”移动到“已编入索引”。优化特定网站需要深入分析网站的整体质量,并确定如何向 Googlebot 传达“已发现 – 目前未编入索引”页面的重要性。

👋 感谢您的观看!

© 版权声明
THE END
喜欢就支持一下吧
点赞0 分享