爬虫位非常优秀的专家添加了使用 Google Search Console 以及 Google 搜索引擎本身对 GoogleBot 活动和索引分析进行日志分析的功能。在本文中,我将向您展示进行网站审核时要寻找的内容以及如何使用简单的搜索运算符。这篇关于技术网站审核的文章发表在 杂志第 17 期上。检查报价并 订购您的订阅!
网站运营商:

通过在 URL 之前使用 site: 命令,您可以将搜索范围缩小到给定的域、子域或目录。这使得您可以轻松地仅在您自己的站点内搜索项目。例如,当被问及为什么当地汽车经销商的网站上“电动汽车”一词没有出现在较高位置时,我可以使用此命令显示这些词没有出现在网站标题或 H1 中的任何位置,有时,让网站所有者感到惊讶的是,它们根本没有出现在网站上。

Google 只能获取特定内容将链接更多地视为内容所在位置的指示而不是页面

的实际内容,并且用于索引我们网站的资 医院电子邮件列表 源有限。因此,使用 site: 命令进行的分析将向您显示 Google 在您的网站上实际发现的内容以及您缺少的内容。

请记住,Google 上列出的结果数量只是一个近似值。如果您的站点地图中有数千个页面,并且 site: 提供相似的值,您可以使用 Google Search Console 中的索引报告执行最准确的分析,该报告会分析索引和排除的子页面。
示例1:
在 Google 中输入。通过这种方式,您将发现 Allegro 多年来创作的数千篇内容营销文章。如果缩小搜索日期,您会发现 Allegro 至少从 2014 年起就一直在进行类似的活动。很容易得出简单的结论,这是一种获取不显示为产品或类别标题的关键字的方法。据 Semstorm 称,这些文章占 Allegro 前 10 名中至少有

100,000 个关键词。网站审核网站审核:重复检测和抓取预算优化输入命令站点使用星号插入任意字符,并使用符号从搜索结果中排除内容。这样,您会发现网站的很多索引子域,其中 域是整个网站的 1:1 副本。

Semstorm 中的可见性分析表明该域已被索引,取得了良好的结果。此类重复内容对网站可见性的稳定性构成重大威胁请查看随机子域为您提供的状态。

它应该是 404 状态或 301 重定向到主域。谷歌也非常适合检测重复内容。输入句子的一部分以发现它还出现在哪里。

考虑到 Google Analytics Universal 中比较维度的报告页面标题和 URL 将清楚地显示重

复的标题,并且可能超出爬虫在页面上看到的 ASB目录 内容,不幸的是,它可以在内部链接结构之外的 Google 中建立索引。

您将发现数千个索引搜索结果。这不是一个错误,许多网站都通过这种方式产生大量的高转化流量。但请记住,值得检查此类索引。

不断调整新关键词并避免蚕食/重复。如果您的商店有与索引搜索结果同名的产品,您可能会浪费资源。同样,如果您的搜索仅返回 1-2 个结果。

这一切都取决于抓取预算,即 Google 在为您的网站建立索引时花费的资源。如果您希望每个新产品/条目快速出现在索引中,则需要注意将 Google 访问的页面减少到几乎为零,并且不对索引做出任何贡献。您可以在索引的报告中找到它们。