Blog on 27th Floor
主页 随便 电脑 电影 社会 阅读 下载 本站 存档
主页 随便 电脑 电影 社会 阅读 下载 本站 存档

Google开始用人脑了

06/03/05。  cathayan.org版权所有,保留一切权利。转载请保留此说明。谢绝商业转载。


Google的搜索技术独步全球,是靠电脑做出来的,据说是上万台机器,因此它的第二大支出是电费(第一大是带宽)。当然不是说Google就不用人脑,它用得狠着呢,招工程师都要解点什么题目,让电脑干活的程序还是要人来写么。现在Google看来要发动全球网民的人脑直接来干活了。

一个是Google被曝光说有个秘密实验室,在全球雇佣大学生来为他做搜索结果的人工排名,也就是让这些人看到某些关键词搜到的结果,如果有不合适的就手工调整一下,以此达到最终用户的最满意的搜索。

另一个是Sitemap,这个更加手工。以前Google可以看到全世界的公开网页,全是自动的网络爬虫一个个网址搜出来的,这样搜出来的结果自然依赖于爬虫的能力。网站地址千变万化,现在又多数存在数据库里,服务器硬盘上并无这个网页文件存在。现在Google推出的这个项目,就是让站长们画出自己的网站地图,用XML文件提交给它(当然也可以提交给Yahoo),这样这个爬虫工作时就可以按图索骥,效率高,准确度也高,查全率也会高。Google还提供了Python程序也自动生成这个Sitemap,可惜一般虚拟主机上并无这个语言支持。

看来至少目前为止,电脑还是听人话干活的死脑筋,由人类创造出来并体现着人类文明的互联网对电脑来说仍然过于复杂,必须继续由人来干预。其实,想想现在电脑还下不好围棋,没办法对一篇文章进行理解,甚至中文的自动分词技术仍然一塌糊涂,这些也很自然。

06/03/05 22:05:51,由cathayan发表。目录:电脑

3条评论

哈 这个文章标题好,例子举的更好!

一塌糊涂 :)

errorter 于 06/04/05 14:08:21 发表. 

Google sitemaps 用 RSS或XML 也可以。
Google sitemaps 试用:
http://jesse.blogs-china.co...

http://jesse.blogs-china.com/ Jesse 于 06/04/05 20:11:50 发表. 

Wordpress已经有了写了一个文件,可以实现了。

http://www.qiantu.org tsingove 于 06/04/05 23:44:05 发表. 


这篇文章已经关闭,不能添加评论和投票
I am watching and will delete all spam.

我的E-Mail


Copy&Paste Exchange

访问CPeX Group

订阅Feed

订阅Feedburner
Feedsky订阅
本站订阅

请登录

导航

cathayan.org Web

最新贴

RIME 小狼毫/鼠须管的极点及五笔拼音配置
Software that rocks or sucks less
一棵热带的树换新叶的过程
几个有用的Vim招术
论语七 述而
Nomacs 图像浏览器
Windows 文件校验
Windows 10 文件批量命名简单方法
Windows 10 文件删除高级操作
本站也算是有响应式设计了

最新评论

Powered by

Powered by Nucleus CMS

版权声明

Creative Commons License
Blog on 27th floor by Cathayan is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 3.0 Unported License.
Powered by Nucleus CMS v3.71. Best view with Mozilla browsers.