2024 年 SEO 满分网站的开发实践 Part1 - 确保 Google 收录到你的网站

2024年2月16日

💎 加入 E+ 成長計畫 與超過 350+ 位軟體工程師一同在社群中成長,並且獲得更多的軟體工程學習資源

在网路世界里,SEO(搜索引擎优化)是每个经营网站都人都必须重视的课题。SEO 做得好,可以让你的网站获得更多曝光和流量,进而提升品牌知名度和营收。

在 ExaplainThis 网站经营初期,我们并没有将太多精力放在 SEO 上。但事实上,即使内容再好,如果 SEO 效果不佳、网站没被搜索引擎收录,也就不会有人看到。

此外,随着 AI 发展,获取资讯的方式也发生变化。虽然 AI 可以迅速汇总各种资讯,但这些资讯的来源往往是 SEO 排名靠前的网站。因此,如果你的网站排名不够靠前,就很有可能被 AI 忽略。

在 2023 年中,ExplainThis 进行了一次网站内容大改版,在这次改版中,我们花了很多时间重新检视并优化了我们的 SEO。根据数据结果显示,即使是相同的网站和内容,我们的曝光和点击量也增长了 40%,此外,在 SEO 的评分也是满分 (见下图)。

ExplainThis 网站 SEO 成效
ExplainThis 网站 SEO 成效

《2024 Google 最新 SEO 入门手册,别再用过时的 SEO 观念了!》这篇文章中,我们讨论到随着 Google SEO 不断改版,过去的某些做法已不再是最佳实践,因此不值得花时间在这些过时的方法上。这几篇文章会将重点放在应该做什么上。

接下来几篇文章,我们将从“软体工程师”的角度出发,分享我们如何实作、优化、打造出一个 SEO 成效佳的网站。而我们的实践和技巧都是参考了 Google SEO 手册中提到的要点。

但需要强调的是,我们并不是 SEO 专家,SEO 涉及到很多方面,可能有些地方是我们没有提到的,建议大家在实作时,可以同时参考 Google 官方手册。

以下是我们系列文的第一部分:确保 Google 收录到你的网站

确保 Google 收录到你的网站

检查网站是否被收录

Google 是一个完全自动化的搜寻引擎,它使用爬虫程式不断探索网络,寻找要添加到索引中的页面。因此,要让你的网站在 Google 搜寻中出现,首先要做的是检查 Google 是否已收录了你的网站。

检查网站是否被收录的方法很简单,只要在 Google 搜寻框输入:

site:[你的网址] // 例如:site:explainthis.io

测试结果会如下方图片所示,如果查得到相关结果,就代表 Google 已为网站建立索引。下图中的这些搜寻结果,代表的就是 ExplainThis 网站中被收录在 Google 搜寻中的网页。

site 搜寻结果
site 搜寻结果

如果你的网站出现在搜索结果中,则代表 Google 已经为你的网站建立了索引。如果未出现,可能是因为网页刚刚上线,或者存在技术问题阻碍 Google 爬取网站内容。(如果是技术问题排查,可以参考这一页的资讯)

提交 Sitemap

一般来说,假设你的网站没有技术上的问题、没有阻碍爬虫爬取内容等,你不需要采取任何行动,Google 会自动爬取你的网站内容,让你的网站能出现在搜寻引擎中。

但是,有另一种做法可以确保 Google 能找到你的网站,最理想的做法就是“提交 Sitemap”。Sitemap 是网站用来向搜寻引擎传达资讯的一种档案,搜寻引擎可借此得知网站上新增或更新了哪些网页。

虽然根据 Google 的文件,Sitemap 并不是必要的措施,我们自己的经验也是如此。但在 ExplainThis 网站建立初期,为了确保 Google 有收录 ExplainThis 网站的页面,我们有提交 Sitemap,并且在每次更新网页内容时,更新 Sitemap。

后期虽然没有继续更新,但并不影响我们的 SEO。建议初次建立网站时,为了确保被检索,可以提交 Sitemap 或手动检索网站。

提交 Sitemap 的方法包括使用 Google Search Console 或 API。如果需要逐步教学,可以参考以下 Google 的文件:

允许爬虫检索

最后,还需确保你的网站代码中的 robots.txt 档案和 meta 标签允许爬虫检索到你的网站。要检查的档案和 meta 值如下:

  • robot.txt:是一个位于网站根目录下的文本档案,它告诉搜寻引擎的爬虫哪些网页可以被访问,哪些网页应该被忽略。robots.txt 通常被用来阻止爬虫访问特定的页面或目录,或是限制爬虫的访问频率。
  • meta (参考文件)
    // all 是预设值,代表不限制建立索引,换句话说,可以被索引
    <meta name="googlebot" content="all" />
    // 指示 Google 不要在搜寻结果中显示某个网页
    <meta name="googlebot" content="noindex" />
    
🧵 如果你想收到最即時的內容更新,可以在 FacebookInstagram 上追蹤我們