网站日志是做SEO时网站管理员和搜索引擎对话沟通的途径。通过日志,了解搜索引擎蜘蛛的访问情况。在很多时间,我们需要查看网站日志。以获得了解搜索引擎如何爬取咱们的网站。
通过FTP访问网站的根目录。可以看到一个包含log的文件夹,这是存放日志的地方。
下载、解压、打开日志文件,日志文件内容如:
日志文件样板全文下载:
蜘蛛名称:百度->baiduspider、Google->Googlebot、Msn->msnbot、yahoo->Slurp、yodao->YoudaoBot、sogou->Sogougetspider。在日志文件里,搜索以上蜘蛛名称。就可以看到蜘蛛抓取的痕迹。
我们分析的主要点是,HTTP状态码,如以上的200和301。
"2005162"代表正常抓取,这次抓取了5162个字节。
不同的服务器或虚拟主机设置的日志记录内容不同。
有的如:200033834237953我们通过多看几条记录,观察规律,可以判断第三个数字代表字节数。
有的如:20000或200064这是没有记录抓取字节数。注意:20000和200064没代表什么问题。所谓200064代表要被K的言论没有根据,一般的网站都有64代码。
在日志里,发现比较多的HTTP状态码是,200(正常)、304(没变化)、404(错误链接)。
304代表,自从上次抓取后,该内容没有更新。一般情况下,网站的图片经常会返回该值。
404代表,访问的这个链接是错误链接。这个错误链接,一方面来自原本存在后来删除了网页,另一方面可能来自本来就不存在,但其他人外链了这么个死链接。
扫描二维码推送至手机访问。
3浏览自媒体运营与推广
2浏览网站结构优化
2浏览外部链接建设
2浏览自媒体运营与推广
本文地址:https://www.badfl.com/article/b894a7131883d4470f15.html