SEO探索

中文网站搜索引擎优化技术研究


存档: 2006/11

Sitemaps将使用统一标准

2006/11/16

  从常规意义上讲,某个网页只有存在指向它的反相链接时——包括网页的内部链接或来自网站外的链接——才能被搜索引擎发布、收录及索引。Google的网站管理员工具(原Google Sitemaps)则可视作对这一常规流程的有益补充:通过网站管理员创建的一个涵盖网站内页面url及相应url附加信息(诸如网页最后更新时间、更新频率、优先度等)的XML文件,以让Google的robots更清楚的了解网站提供的内容及内容间的组织关系,以更有效地完成对网站内页面的索引与收录。这也是之前我们将Google Sitemap称为Google“后门”的原因。——当然,必须明确的是,向Google提供Sitemaps并不能保证Sitemaps内的网页一定会被收录或索引,这取决于许多其他因素,但至少Sitemaps在一定程度上能够加强Google对网站的了解。

  之前Sitemaps最大的问题在于,它只可用于Google,或者更准确地说,只可用于Google网站管理员工具。而其他搜索引擎,如Yahoo!或Live搜索(MSN搜索),则不支持这种特定的格式。因此,之前许多网站管理员在为网站创建了可用于Google的sitemaps后,还必须想办法为Yahoo!或Live Search创建实现类似功能但格式不同的文件,十分繁琐。 (more…)

露怯的雅虎搜索Antispam小组

2006/11/13

  看到Robin的雅虎搜索Antispam小组谈链接群发一文后,才知道原来Yahoo中文也建了个名为“雅虎搜索日志”的中文Blog,初步看了看,感觉与Google黑板报类似,更多地倾向于介绍自己的产品、技术、活动,对网站建设者而言有价值的信息并不多。但无论如何,从一个角度体现出雅虎正在试图加强与用户的沟通与交流,无疑是值得提倡的,何况,英文的“www.ysearchblog.com”被屏蔽,按正常方式无法访问,这总算为用户了解Yahoo搜索提供了一个替代渠道。

  不过,客观地评价,雅虎搜索日志要走的路还长得远。以Robin文中介绍的与站长们谈链接群发来说,本来,对链接群发这类低级且泛滥的Spam手段,任何搜索引擎,除非完全不在意搜索质量,都会予以打击的,区别只在于具体的实现策略、方法与打击力度上,这一点恐怕连正在应用这类手段以期达到提升网站排名的Spammer自己也是很清楚的:他们只是相信自己能有比别人更好的运气。而对这么一个相当“成熟”的话题,该篇以“雅虎搜索Antispam小组”名义撰写的文章却因表述的不严谨而让人啼笑皆非,则是相当遗憾的,比如说:

为保证用户的搜索体验,雅虎搜索今年以来,已经对这些通过“人造恶意链接”获得排名的网站,包括对通过留言本、论坛、以及BLOG等群发URL试图获得排名提高的网站进行了降权,以遏制群发作弊软件的泛滥,还互联网一个干净公平的“搜索环境”。

  以及

2、不要在留言簿、BLOG、BBS等页面群发链接,这不但不会从搜索引擎获得排名,还可能会被搜索引擎惩罚!

  从这些表述来看,看不出雅虎搜索采取何种方法来遏制“群发作弊软件的泛滥”:是算法自动完成还是人工干预?如果是算法自动完成,那么,如何判定链接群发?这是实施打击的关键;而如何如果是人工干预的话,如何保证及时、准确地发现这些作弊网站?等等,当然,这些可能是雅虎搜索的机密,不透露情有可原,但是,对篇意图通过这么一个简单话题宣传自己的文章来说,如果不能真正地加强用户对Yahoo搜索质量的信心则无疑是失败,单纯喊一句“还互联网一个干净公平的搜索环境”恐怕没有太大实际意义。

  此外,上面的表述中,至少还有这么几个问题:

  1. 雅虎搜索“今年以来”才对这些通过“人造恶意链接”获得排名的网站进行了降权?是不是想要表达至少今年以前,雅虎搜索并不能有效地“保证用户的搜索体验”?
  2. “已经对”……“进行了降权”!老实说,这是本人头一次在搜索引擎官方表述中看到类似这样“决断”的“完成句式”,而且,用的是泛指“这些”,难道雅虎这么相信自己工作中的准确性,无一遗漏?难道如今或至少在“雅虎搜索Antispam小组”发布这篇文章时,雅虎搜索结果中便已完全排除(之前)链接群发的影响?您信么?反正我不信。
  3. 在上面两段表述中,都提到了“blog”,而据我所知,目前主流的blog平台均默认在留言链接中使用“nofollow”属性,那么,带来的疑问便是:如果链接不能影响最终的搜索排名,雅虎有没有权力“降权”或“惩罚”相应的网站?难道雅虎为“规范互联网秩序”,已经将手伸到搜索引擎与搜索质量之外的范畴?还是,尽管英文Yahoo早就支持了链接的“nofollow”属性(参见2005/1/18发于Ysearchblog中的这篇文章),但中文雅虎却一直将“nofollow”链接视作普通链接?天!

  而更大的问题在于,雅虎一直强调的是对这类spam网站将进行“降权”或“惩罚”,而不是采取其他方式比如说将其获得链接对搜索引擎排名的影响降为0之类,这就必然带来另一个疑问,正如在robin文章中一位署名“呵呵”网友的留言:

如果按YAHOO的说法,我只要天天给竞争对手群发,让他们全部遭到惩罚,我的排名就上来了。

  相信类似的猜测不是“雅虎搜索Antispam小组”撰写该文的初衷,但按雅虎的表述,这样的推断至少在逻辑上是成立的。——但愿这只是个笑料,而不会真的在雅虎搜索中发生。

  从雅虎的本意来看,发布类似的文章应该出于普及搜索引擎优化知识并引导SEO以正当方式运作的目的,这无疑是值得赞赏的。但,如何在不透露关键信息或者掩盖排名机制漏洞与缺陷的前提下,将官样文章说得圆滑,并保证逻辑上的自洽,则是相当重要的,其中,避免误导避免恐吓,不要给出错误的信息则更是重中之重,在这方面,也许“雅虎搜索Antispam小组”该沉下心来,向Google的Matt Cutts好好学学——当然,Google采取以Matt Cutts个人Blog方式,以半官方的身份则更有深义。

Matt Cutts的SEO视频文字版

2006/11/10

  8月初,Matt Cutts发布一系列的视频,详细探讨了从Google对网站质量的认定、网页索引收录与排名、补充结果等方面,其中很多部分对于SEO与网站优化而言是相当有价值的。对此我们已在Matt Cutts的Google SEO视频一文中做过介绍,并提供了相应视频的链接。

  但由于Google Video的服务在国内尚未开通,很多朋友可能看不到,此外,即使能够看到的朋友也可能受限于英文听力的问题而无法细细研读,这是一个遗憾。不过,最近一个网站提供了Matt Cutts这些SEO视频的文字版。——当然,也是英文的,不过对大多数朋友来说,英文读写总是要比听或说要容易得多,是不是? :D

  该网站提供的Matt Cutts SEO视频文字版包括如下内容:

  1. Including qualities of a good site
  2. Some SEO Myths
  3. Should you Optimize for Search Engines or for Users?
  4. Static vs. Dynamic urls
  5. How to structure a site?
  6. All about Supplemental Results
  7. Does Google Analytics play a part in SERPs
  8. Google Terminology
  9. All about datacenters
  10. Lightning Round!
  11. Reinclusion requests
  12. Tips for Search Engine Strategies (SES) San Jose 2006
  13. Google Webmaster Tools
  14. Recap of SES San Jose 2006

IIS中启用WP-cache提高访问速度

2006/11/8

  近段时间以来,随着网站访问量的上升——SEO探索相对还“好”些,上升曲线比较平缓,而Vista天地则有些“让我欢喜让我忧”了。——服务器越来越不堪重负,昨天竟然频繁出现连我自己也无法访问的情况,当然,这与服务器带宽也有关系,不过,相对而言,IT技术点评则由于使用静态网页,情况要好得多。因此,必须考虑对WordPress实施优化了。

  在WordPress的Cache类插件中,最著名的恐怕非WP-cache 莫属了,其通过缓存机制,将相应网页中的内容保存在静态文件中,这样,当其他用户再次访问时即可直接提取缓存文件,免除了WordPress重新编译PHP代码、频繁读取数据库带来的效率低下问题,从某种意义上说,相当于静态化网页一样。

  不过,WP-cache基于Linux/Appache开发,在Windows/IIS平台下并不能按其默认的方法安装,因为其中有些针对Linux/Appache的环境设定。通过Google找到了这篇介绍在Windows中安装WP-cache的文章,依其步骤,果然能够使用WP-cache了。

  不过,试了几个页面后发现,启用WP-cache让网页彻底乱了套,很多网页显示的内容完全一样,比如说“http://seo.highdiy.com/index.php/seo/user-behavior-in-serp/”与“http://seo.highdiy.com/index.php/category/seo-general/”竟然成了同一个页面,诡异!

  再次搜索,找到了这篇文章,Using WP-Cache on Windows /IIS,其中对出现这类问题的原因作了解释,与我们permalinks中含有“index.php”有关,由于在Windows / IIS, $_SERVER[’REQUEST_URI’]不能返回正确值而导致。该文并给出了相应的解决办法。

  如果您的WordPress也架设于Windows/IIS平台,并且使用与本站类似的permalinks设置,可参考这两篇文章。

  不知您在访问SEO探索Vista天地时是否能够感觉到些许的速度提升?或者,是否发现不正常之处?

SERP中的用户行为模式分析

2006/11/7

  所谓SEO(搜索引擎优化),不管将其赋予怎样的涵义设定怎样的目标,但其从根本上说,总是通过一系列的技术与手段,让网站/网页出现在针对关键词搜索结果页面(SERP)靠前的位置实现。因此,用户在SERP中的行为模式对SEO而言是非常重要的,直接影响最终的SEO效果:比如说,出现在SERP第一与第五的位置究竟存在多大的区别?某个网站/网页出现在SERP中的标题、摘要在多大程序上影响用户是否点击等。

  其中,一个有趣但至关重要的问题便是,虽然从一般意义上说,在SERP中排名靠前的链接容易引起用户的关注,但是,用户在浏览搜索结果页面时究竟如何分配注意力?用户在点击某个链接前是否会仔细阅读十项搜索结果的标题与描述?如果不是,那么,用户在点击链接前会仔细查看哪些内容?等等。

  近日,康奈尔大学(Cornell University)的一个关于Eye-Tracking项目的研究小组发布了这方面的研究报告(PDF)。通过分析用户在SERP页面中第一次点击或干脆重新搜索前的用户行为,得出了下面的结果: (more…)