Blog on 27th Floor
主页 随便 电脑 电影 社会 阅读 下载 本站 存档
主页 随便 电脑 电影 社会 阅读 下载 本站 存档

Google语义网

05/07/06。  cathayan.org版权所有,保留一切权利。转载请保留此说明。谢绝商业转载。


前些天我写过一篇打Tag的文章,当时写的时候就想,没准Google那邦聪明家伙已经在做这个了。这不,猜Google只怕慢,不怕快,他们确实已经在做了。下面是两个别人的发现:

一是Type的应用,在Google搜索框里输入“type tiger”,搜索结果的第一项是:

Tiger — Type: Animal
According to http://www.pubquizhelp.34sp.com/animals/adject.html

这里根据这个网页指出Tiger是一种动物,但目前没有依据这一点做更多的工作,因为给每一个网页打Tag不是个小活。其他还有“type china”这类针对国名的。如果这能进入实用的话,就很容易进一步限定搜索结果了,比如输入Apple是找水果还是找电脑等等。

二是more的应用,在传说要推出的Google健康网站上有人见到了,目前的例子是搜索“Tired”,结果中会出现:

Treatment Research papers From medical establishment
Symptoms News Alternative medicine

这样就可以进一步限制搜索结果,让搜索更快捷准确,据说之所以能推出这个功能,是因为有组织做了这个工作,给一些网页打上了标签。而这张图上的显示分类更多,那显然给网站打标签就得更详细些。

我记得有位Blogger曾经设想过今后Google的应用图景:进入一家商店买葡萄酒,一看想要的那种要50美元一瓶,很不甘心,就掏出手机或PDA之类,上Google,给出邮编和酒名,Google直接告诉他在他附近另一个商店中这种酒只卖35美元。结果可想而知,商店几乎要限制在让内使用手机了。要做到这么准确的搜索,只怕以上这些语义的工作是必需的。

05/07/06 22:23:41,由cathayan发表。目录:电脑

10条评论

给每个网页都打上标签太困难了, 而且也不是一个很好的办法。 IBM的网络喷泉计划都给网页打了几年的标签了, 现在的为数不多的成果就是可以追踪某个关键字(比如企业的名字)在网上的名声好坏。

我觉得应该是还有更好的方法。

http://www.donews.net/biantaishabi biantaishabi 于 05/07/06 23:11:20 发表. 

Webfountain确实够牛B的,但如果不理解--哪怕是非常粗略的理解--一个网页在说什么,搜索就不会是完全准确的。自然语言理解的论文一堆堆的,不知道有什么成就没有。

http://blog.cathayan.org/member/1 cathayan 于 05/07/06 23:15:09 发表. 

理解网页内容太难了,而且要面对spoof、spam,皑皑,要是没那么多坏人就世界和平了。

http://about:blank IUSR 于 05/07/06 23:39:08 发表. 

我有同学在做模式识别, 包括自然语言的理解和图像的抽取, 似乎现在的大部分这方面的研究都是用统计的模型来做。

李开复的语音识别也是用的隐含的马尔科夫链。 就是通过很多的实验去求那个巨大状态转移矩阵。 很多聊天机器人也是这样做的, 可以自己学习, 完善那个矩阵,到了后来就可以进行比较像样的对话了。

http://www.donews.net/biantaishabi biantaishabi 于 05/07/06 23:52:01 发表. 

Actually, your example of Wine is from a book , called "The Search: How Google and Its Rivals Rewrote the Rules of Business and Transformed Our Culture".
Very nice book, I do not like the Google part particularly, but I like his vision for the search future.

http://www.fastforwardmedia.info fastforward 于 05/08/06 00:32:59 发表. 

看看这个服务是如何和搜索引擎接合为pages tag的.
既然
他们能做到,google就不必怀疑了.
http://www.wanabo.com/
---------------
Just place our HTML code on your pages, then you and your visitors can begin to tag each page. We'll build a tag navigator and a tag cloud for your site. Your site can also optionally be automatically tagged based on visitors coming from search engines.
----------------
google或许有比这更好的策略,通过技术的手段实现人性化的搜索.

http://www.ocde.cn ocde 于 05/08/06 08:35:42 发表. 

我一直以为让用户来打tag,要比作者自己来决定tag更加的好.tag是个性化的需求,要有需者而不是作者来tag.

http://www.ocde.cn ocde 于 05/08/06 08:38:30 发表. 

还真是忘了那个例子哪来的了 :P

怎么打Tag,打什么样的Tag,还是让Google的大侠们来思考吧。

http://blog.cathayan.org/member/1 cathayan 于 05/08/06 09:10:03 发表. 

觉得在谈语义网,智能网时不能撇开人本身来谈网络,网络和人应该是统一的,仅仅通过数学模型和一些智能算法来实现网络的智能化是有难度的。

http://www.huamuyu.com/pblog emc 于 05/08/06 10:57:48 发表. 

让机器去理解人的自然语言确实很难,但毕竟是开始了!

http://hjp.viviti.com/ 爬网志 于 10/13/08 10:55:57 发表. 


这篇文章已经关闭,不能添加评论和投票
I am watching and will delete all spam.

我的E-Mail


Copy&Paste Exchange

访问CPeX Group

订阅Feed

订阅Feedburner
Feedsky订阅
本站订阅

请登录

导航

cathayan.org Web

最新贴

RIME 小狼毫/鼠须管的极点及五笔拼音配置
Software that rocks or sucks less
一棵热带的树换新叶的过程
几个有用的Vim招术
论语七 述而
Nomacs 图像浏览器
Windows 文件校验
Windows 10 文件批量命名简单方法
Windows 10 文件删除高级操作
本站也算是有响应式设计了

最新评论

Powered by

Powered by Nucleus CMS

版权声明

Creative Commons License
Blog on 27th floor by Cathayan is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 3.0 Unported License.
Powered by Nucleus CMS v3.71. Best view with Mozilla browsers.