把链接当作投票、重要的站点投出的票价值更高,Google就以此来算出一个页面的PageRank;搜索时Google会再配合相关性来返回结果。这里有个疑问,就是相关性是否用于PageRank的计算呢?
换句话说,就是杨振宁推荐一个学物理的学生到某大学读书估计肯定接收,那他推荐一个学舞蹈的去能有说服力吗?一方面讲,他是重量级人物,说的话自然是重要的;另一方面,好像也没听说他懂舞蹈。就像某副总谈素质教育,某委员讲哲学,大家也都是姑妄听之,一笑置之。
就链接来看,一个在A门类里重要的网站是否会链接一个B门类的网站呢?以往网站都具有相当公众性质的时候,这种大体不会发生,就像Slashdot就只链接它的同门兄弟;但现在情况大大地不同了,更大量的网站是个人网站,人与人之间产生关系的可能性非常多,绝不仅止于专业门类。一个现实生活中很好的朋友找上来说链一个吧,你会说不行吗?也许你对他写的东西并不怎么懂,对她看中的帅哥也不怎么感冒,但你还是毫不犹豫地加了链接,这都是很随手的事,尤其是在个人Blog里面。
于是一个谈Linux的Blog向一个谈电影的Blog投了票,这个票能得几分?是否也像它投向另外的LinuxBlog站有一样的权重呢?
链接除了表明在知识、意义上有两个站点有相关之外,我想还表明一些个人的社会关系。大公司、组织的网站之间可能没有这种关系,但个人的网站怎么可能会没有这种关系呢?
Google的帮助里说它的算法可以区分“自然的链接”和“非自然的链接”,那这种社会关系算是自然还是不自然呢?Google的目标是组织全世界的知识,这种网页背后的人际关系算不算知识的一种呢?
我觉得这当然是自然的链接,用Google的一个判定标准:如果没有搜索引擎,你还会这样做吗?答案当然是肯定的。但这种关系似乎对知识没有太大的帮助,就跟官员管教育就自认懂教育一样没有说服力。
同一个页面上Google还说了,它不会给任何页面手工分派关键字。这也有理。但前一段就有人发现两个不同的例子,显示Google似乎也有
区分页面意义的行动--现在这两个方法似乎都没用了,包括type tiger那个以前确实见过的。当然啦,这应该都是程序做出来的,并不是手工。
我觉得这个工作很重要,也就是杨振宁保荐舞蹈学生没有什么意义,而他保荐物理系学生就绝对重要,如果不能区分物理和舞蹈两个门类,这个判断就没有办法进行。
也许这个考虑已经包含在Google算法里了?计算机都算得那么辛苦的东西,外人很难判断了。