« 富兰克林的13项美德 | 主 页 | Wikipedia英文条目数超过100万 »

Gmail里的搜索


cathayan.org版权所有,保留一切权利。转载请保留此说明。谢绝商业转载。

Gmail的主页面上说:Search, don't sort. 但在搜索中文时,我已经有数次看着一封邮件却就是搜不到它;而与此同时,英文搜索倒没有失望过。今天正巧看到有人提出这个问题,不妨说说我的经验。

1. 如果搜中文没有结果,不妨试一下把所有字都用空格隔开再来搜。这样通常有结果,但不一定是我们需要的。
2. 如果要查的关键字里有明显的词汇,比如电脑、域名、教材这样的,让它们连在一块,不要再用空格分隔,而把它们同其他字词仍旧用空格分开。
3. 试一下词的其他组合。
4. 如果想到信中可能有的英文词,就搜这个英文词,英文通常是准确的。

Google在网页搜索中对中文据说是不分词的,我也确实见过按字分出来的结果(如果不对请指正),但它依靠其他技术,比如Pagerank总是能得到不错的结果。而在邮件搜索时,它没有Pagerank的帮助,只能字词匹配,这时想来词的作用是重要的。但我们不知道Google所用的词库,只能依常理自己来分词。

本来像“域名”,是一个词,连在一起搜到了结果,那么“域 名”分开之后就没有结果吗?感觉上不应该,可在我信箱里就是如此。只能推测说索引还有改进的空间了。

2006-03-02 00:01:00,由cathayan发表。目录:电脑  EMail This

评论

Fermi:

可见平时养成加Label的习惯是多么重要……

于 2006-03-02 10:45:14 发表,来自:

cathayan:

Label?信少的话还行。现在我的正式信件超过500MB,怎么Label?大量还是从Thunderbird中导入的,全在一个Label下,还只能搜索。其实这个应该是很容易改进的。

于 2006-03-02 11:11:26 发表,来自:http://blog.cathayan.org/member/1

Mystera:

搜索英文词组,用半角引号(“ ”)括起来。
搜索中文词,用全角引号(“ ”)括起来。

这样不仅可以实现英文换词组划分结果,还实现了中文的按词划分结果。

于 2006-03-02 12:18:02 发表,来自:http://blog.sina.com.cn/u/1212342122

Mystera:

晕,我明明打出来的时候是半角引号,为哈发表之后就变成全角了?

再试一把。“”

于 2006-03-02 12:19:40 发表,来自:http://blog.sina.com.cn/u/1212342122

cathayan:

这不是关键点。在Gmail里面,“域名”这个词带不带引号搜索结果相同,中间用空格分开后加不加引号结果也相同。这是一个的分词和索引的问题。

于 2006-03-02 14:05:24 发表,来自:http://blog.cathayan.org/member/1

Mystera:

发现一个很奇怪的现象。
把“域名”中间用空格分开搜索,返回一个无法连接到网络的信息。然后会有持续五分钟的gmail网页无法打开的情况。不带空格的话就没问题。
不解ing...

于 2006-03-02 14:16:17 发表,来自:

Mystera:

其实,我想说的关键点不是gmail所用的词库够不够全面,或者说在多大程度上够不够符合汉语的使用标准。
我的意思是,加上引号之后,我们可以将gmail搜索词库中不存在的词强行地使其得出令我们满意的搜索结果。
比如你所说的“域名”一词,该词加不加引号,得到的搜索结果都是一样的。这一点我没有异议,这说明“域名”一词存在于gmail的词库中。但如果你搜索一个汉语的专有名词的话,那么不加引号就得不出任何结果,这是因为词库中没有这个词。比如在我的邮箱中搜“崔健”,不加引号,不返回结果。加引号后,得到9个结果,都很准确,文中都有“崔健”一词。如果使用空格的方法,得到56个结果,但大部分要么只有“崔”,要么只有“健”。——我想我的意思已经表达得很清楚了吧?!
至于“域名”那个加空格后为什么不返回结果的情况,我严重表示不解!

于 2006-03-02 14:43:43 发表,来自:

cathayan:

我不能确定你说的崔健的情况。我刚试了个例子:核合作,今天FT的邮件标题上的词。

核合作:无结果
“核合作”:无结果
核 合作:有结果,并包含我想要的那一条

我觉得如果“崔健”有结果,那么它应该是在索引中的,这样不加引号也应该有结果才对。

于 2006-03-02 14:52:22 发表,来自:http://blog.cathayan.org/member/1

Mystera:

搜索截图:

无引号:结果为Φ
http://yli116.googlepages.c...

加引号:结果为A
http://yli116.googlepages.c...

加空格:结果为B
http://yli116.googlepages.c...

其中,A是B的子集。

于 2006-03-02 15:20:16 发表,来自:

flyfish:

Gmail搜索是它的软肋.
并不是想象中那么好用!

于 2006-03-03 10:56:06 发表,来自:

我来评论








为保护您的隐私,请不要在评论框里填写自己的真实E-mail地址。
广告见之即删。带有任何赢利机构链接的评论都会删除。