« 5月5日杀档事件 | 主 页 | 还是盗版 »

Google语义网


cathayan.org版权所有,保留一切权利。转载请保留此说明。谢绝商业转载。

前些天我写过一篇打Tag的文章,当时写的时候就想,没准Google那邦聪明家伙已经在做这个了。这不,猜Google只怕慢,不怕快,他们确实已经在做了。下面是两个别人的发现:

一是Type的应用,在Google搜索框里输入“type tiger”,搜索结果的第一项是:

Tiger — Type: Animal
According to http://www.pubquizhelp.34sp.com/animals/adject.html

这里根据这个网页指出Tiger是一种动物,但目前没有依据这一点做更多的工作,因为给每一个网页打Tag不是个小活。其他还有“type china”这类针对国名的。如果这能进入实用的话,就很容易进一步限定搜索结果了,比如输入Apple是找水果还是找电脑等等。

二是more的应用,在传说要推出的Google健康网站上有人见到了,目前的例子是搜索“Tired”,结果中会出现:

Treatment Research papers From medical establishment
Symptoms News Alternative medicine

这样就可以进一步限制搜索结果,让搜索更快捷准确,据说之所以能推出这个功能,是因为有组织做了这个工作,给一些网页打上了标签。而这张图上的显示分类更多,那显然给网站打标签就得更详细些。

我记得有位Blogger曾经设想过今后Google的应用图景:进入一家商店买葡萄酒,一看想要的那种要50美元一瓶,很不甘心,就掏出手机或PDA之类,上Google,给出邮编和酒名,Google直接告诉他在他附近另一个商店中这种酒只卖35美元。结果可想而知,商店几乎要限制在让内使用手机了。要做到这么准确的搜索,只怕以上这些语义的工作是必需的。

2006-05-07 22:23:41,由cathayan发表。目录:电脑  EMail This

评论

biantaishabi:

给每个网页都打上标签太困难了, 而且也不是一个很好的办法。 IBM的网络喷泉计划都给网页打了几年的标签了, 现在的为数不多的成果就是可以追踪某个关键字(比如企业的名字)在网上的名声好坏。

我觉得应该是还有更好的方法。
于 2006-05-07 23:11:20 发表,来自:http://www.donews.net/biantaishabi

cathayan:

Webfountain确实够牛B的,但如果不理解--哪怕是非常粗略的理解--一个网页在说什么,搜索就不会是完全准确的。自然语言理解的论文一堆堆的,不知道有什么成就没有。
于 2006-05-07 23:15:09 发表,来自:http://blog.cathayan.org/member/1

IUSR:

理解网页内容太难了,而且要面对spoof、spam,皑皑,要是没那么多坏人就世界和平了。
于 2006-05-07 23:39:08 发表,来自:

biantaishabi:

我有同学在做模式识别, 包括自然语言的理解和图像的抽取, 似乎现在的大部分这方面的研究都是用统计的模型来做。

李开复的语音识别也是用的隐含的马尔科夫链。 就是通过很多的实验去求那个巨大状态转移矩阵。 很多聊天机器人也是这样做的, 可以自己学习, 完善那个矩阵,到了后来就可以进行比较像样的对话了。
于 2006-05-07 23:52:01 发表,来自:http://www.donews.net/biantaishabi

fastforward:

Actually, your example of Wine is from a book , called "The Search: How Google and Its Rivals Rewrote the Rules of Business and Transformed Our Culture".
Very nice book, I do not like the Google part particularly, but I like his vision for the search future.
于 2006-05-08 00:32:59 发表,来自:http://www.fastforwardmedia.info

ocde:

看看这个服务是如何和搜索引擎接合为pages tag的.
既然
他们能做到,google就不必怀疑了.
http://www.wanabo.com/
---------------
Just place our HTML code on your pages, then you and your visitors can begin to tag each page. We'll build a tag navigator and a tag cloud for your site. Your site can also optionally be automatically tagged based on visitors coming from search engines.
----------------
google或许有比这更好的策略,通过技术的手段实现人性化的搜索.
于 2006-05-08 08:35:42 发表,来自:http://www.ocde.cn

ocde:

我一直以为让用户来打tag,要比作者自己来决定tag更加的好.tag是个性化的需求,要有需者而不是作者来tag.
于 2006-05-08 08:38:30 发表,来自:http://www.ocde.cn

cathayan:

还真是忘了那个例子哪来的了

怎么打Tag,打什么样的Tag,还是让Google的大侠们来思考吧。
于 2006-05-08 09:10:03 发表,来自:http://blog.cathayan.org/member/1

emc:

觉得在谈语义网,智能网时不能撇开人本身来谈网络,网络和人应该是统一的,仅仅通过数学模型和一些智能算法来实现网络的智能化是有难度的。
于 2006-05-08 10:57:48 发表,来自:http://www.huamuyu.com/pblog

爬网志:

让机器去理解人的自然语言确实很难,但毕竟是开始了!
于 2008-10-13 10:55:57 发表,来自:http://hjp.viviti.com/

我来评论








为保护您的隐私,请不要在评论框里填写自己的真实E-mail地址。
广告见之即删。带有任何赢利机构链接的评论都会删除。