01/18/07

Gmail中文可以搜全文了

cathayan.org版权所有,保留一切权利。转载请保留此说明。谢绝商业转载。

Gmail的中文搜索以前不是这样的,而是只能搜一些词,而这些词的数量似乎不多,现在终于可以随便搜了,到底是哪天改的就不知道了,我是看到Googlechinablog上面在推广,就试了一下,发现什么字都可以搜了。

但是,还是有个问题,就是一个词索引过之后,这个词里面包含的字就不再有单独的索引。还是“域名”这个例子,我的信箱里有个信标题是“域名续费”,我用“域名”来搜一点问题也没有,但在中间加个空格,搜“域 名”这两个字居然就不出这个信了。当然,此时就是再搜单独的“域”字也不会出来这个信。

这似乎是个取舍问题,搜computer有结果,那搜compu会有结果吗?在我的Gmail测试前者有结果,后者没有结果;在Google里面搜会有结果,但compu的结果也不包含computer,而是专门的compu。这样处理英文我觉得是合适的,但这样处理中文是否合适呢?

听说gmail里看doc文档有图片了,不过还没有见到;还有gmail可以Pop其他信箱的功能,我的信箱里也还没有。

Mozilla据说要在北京召人了,可以看这里。不过感觉和咱不是一个星球的。

01/18/07 09:58:59,由 cathayan发表。 本文链接
  

01/16/07

收藏

cathayan.org版权所有,保留一切权利。转载请保留此说明。谢绝商业转载。

这几天办公室要搬家,翻翻柜子、抽屉,发现许多从来没用的东西,有个柜子门甚至有1年多没打开过了;还有个公共的柜子,下半层的门已经完全打不开,问问现存人士,居然没有一个人曾经看过里面的东西。

还有黑屋子一间,内存大型设备两套,从03年以来再没有人碰过它们,从年限和技术上看,也已经早就进入报废行列了。

记得上一次在楼层间搬家的时候,就曾经处理过这个问题,许多东西最后得以保留,出于许多原因,比如老设备可以用来读取老式磁带,老磁带上有许多重要的内容(曾经的),老单据说不定哪天要查到,老书说不好还会用到,软盘说不好哪天U盘没得用网又坏了,这个东西是我们的劳动成果啊,那个东西应该留作部门纪念,这个东西很牛比啊,这么长时间了居然还能转,留着吧--这是一个购于1994年的自动号码机,自俺进来就当作文物供在一个玻璃柜里,跟订书机一样大小,按一下就能印出个号码,再按就自动加1,不过不知道曾经用它做什么。

照理说有些东西应该留作档案的,几十年后还可以查出来这个单位的历史--可是似乎没有这么重要,并且听说俺单位连自己最重要的产品都已经收集不全了,所以还是决定扔掉一大批。感觉上如果管理严格、规则齐全的地方应该有专门的档案管理人员和规定,说明哪些东西要留,留几年,怎么留等等,然后除此之外的东西就可以放心大胆地处理给收废品的。

很小的时候,有一阵儿我对收藏一样东西很着迷,那样东西是火柴盒上的小图片,收集了好几十张,包得严严实实压在枕头下面。最后碰上了一套4张的,是西游记还是水浒传记不清了,总之是千辛万苦只收到3张,最后一张再怎么也搞不到了,实在是让人忧心。然后突然有一天,终于想开了,再也不收了,把那现有的几十张也拿出来送给小伙伴,然后感觉那真是轻松啊。

收藏和归档当然还是有点区别,但情绪是一样的,都是出于对某种东西的缺失的恐惧。其实大多数情况又不是国宝,比如公元前11世纪的带字的青铜器,又当不了Core,当上后你的小学成绩单就是重要文物啦,总之基本上现在没用或是放了一年都没再打开过就但扔无妨了--只要里面没夹着人民币。

不过昨天居然从破烂里发现一张Laser Disc,12寸的直径,2毫米的厚度,是个呼啸山庄的片子,从外表看跟密纹唱片一个样,许多人都没见过吧,准备当成文物,挂到门上当个镜子使。

01/16/07 10:10:51,由 cathayan发表。 本文链接
  

01/14/07

运气

cathayan.org版权所有,保留一切权利。转载请保留此说明。谢绝商业转载。

今天一大早上网看Blog,没看两篇,就看到了一位超级牛人:Drunkpiano女士。这位女士一路保送到了硕士(国内著名考试竟然一次没有参加过),再随便混进清华教工队伍,再半年功夫搞定GRE和哥伦比亚,博士毕业搞定哈佛博士后,然后眼见得运气要尽,老天还是扔下来一个大馅饼-剑桥的教职。

大家看了有什么感想?是不是超牛?留言中有人说差不多是亦舒小说的女主角,又有人说还以为是YY小说,没想到是真人。然后我就想起了那位“史上最牛B的人”,不但能解决8大数学问题,还能治疗癌症和AIDS,最后再解决一下世界和平问题和第一推动问题。

说远了,DP这经历可是真材实料,应该不是杜撰。想想真是不公平啊,有人一辈子追求的东西,另外就有人不求就有,甚至生来就没当回事。这句话似乎是路遥在平凡的世界还是哪本书里说过,他还说,一想到这一点,就觉得得努力干活,不努力对不起这一辈子。我就一直纳闷,我想过这一点之后就很颓废,怎么也想不到努力干活上来,看来还是境界有差别啊。

这个问题似乎不能追问,人比人气死人,再追问下去就要直指世界根本问题了,比如为什么别人行你就不行,为什么非要是他行,而不是另外一人行,难道有人在安排吗?如果没有安排它又为何是这个样子?它可以是其他样子吗?那又为什么不是其他样子?谁在安排这些,这种事是有规律的吗?或者是没有规律的?如果有规律或者没有规律,那又为什么?为什么要知道这些呢?为什么会想知道这些呢?

我想这个问题构成了人生重大不爽的全部。任何的不爽,都可以找到其他更多人在同样问题上相当地爽,有了这种对比,你会更加地不爽;其实,如果认识不到有其他人,便根本不会不爽;但如果根本认识不到其他人,那便是没有自我意识,人就不是人了。

这种问题只有宗教才可以解决。比如黄梁一梦这种故事,都是道家编出来吸引人的,要人认清人生虚幻,不要贪恋荣华富贵,才能得道成仙。又或者像圣经约伯记,约伯平白无故受到打击,财产也没了,家也败了,自己也病得一塌糊涂。约伯就抱怨上帝啊,他的朋友就跑来劝他不要抱怨。上帝是不是应该继续惩罚约伯而奖励他这几位朋友呢?结果不是的,上帝痛骂了这几位朋友,而奖励了约伯。

约伯这故事是否更加莫名其妙?我想圣经写这个故事的本意便是要人因此认清生活之无常,便从此更加崇信上帝。又有人说,不爽时还是不应该抱怨,应该认识到自己不够努力。其实从约伯记看来,还是不必伪善,不爽时就抱怨一下也属正常反应,人本来如此渺小又何必装什么大头呢?

那爽的时侯是否可以得意一下呢?应该可以吧。不过据说大家都这样,老天爷就不爽了,你不爽时是不老天不照顾,不运气,你爽了就说是自己努力,还是跟老天无关,这样老人家的工作岂不全落入无形了?

爽的人就自己爽好了,不爽的倒也不必太难过,许多情况下也不太必要责己过甚,有时不过是上帝跟撒旦打赌玩玩你罢了--真会找理由啊,鄙视!

01/14/07 21:15:01,由 cathayan发表。 本文链接
  

01/12/07

Unicode中文排序

cathayan.org版权所有,保留一切权利。转载请保留此说明。谢绝商业转载。

在Linux下面全面用UTF-8后就曾发现过中文排序有点不理解了,昨天才看到别人讨论,原来Unicode里面的汉字顺序居然是《康熙字典》的偏旁部首顺序。查了一下,康熙字典中的部首共有214个:

一丨丶丿乙亅二亠人儿入八冂冖冫几凵刀力勹匕匚匸十卜卩厂厶又口囗土士夂夊夕大女子宀寸小尢尸屮山巛工己巾干幺广廴廾弋弓彐彡彳心戈戶手支攴文斗斤方无日曰月木欠止歹殳毋比毛氏气水火爪父爻爿片牙牛犬玄玉瓜瓦甘生用田疋疒癶白皮皿目矛矢石示禸禾穴立竹米糸缶网羊羽老而耒耳聿肉臣自至臼舌舛舟艮色艸虍虫血行衣襾見角言谷豆豕豸貝赤走足身車辛辰辵邑酉釆里金長門阜隶隹雨靑非面革韋韭音頁風飛食首香馬骨高髟鬥鬯鬲鬼魚鳥鹵鹿麥麻黃黍黑黹黽鼎鼓鼠鼻齊齒龍龜龠

像在Google Docs里面,如果对Spreadsheet表格排序,中文就依据上面的部首顺序进行,部首在前的字就排在前面,如果部首相同,则算笔划数,笔划数相同的就不知道怎么排了。比如有这样的结果:

刘孙康张李王赵钱齊

它们的部首分别是:刀子广弓木王走金齊。

又有:刈刘则刹剂剔,文和贝同为4划,杀和齐同为6划,而点在竖前,撇在横前,按传统应该是“江山千古”(丶丨丿一乛)的顺序。另外还有“寒来暑往”(丶一丨丿乛),“天上人间”(一丨丿丶乛),札字(一丨丿丶乛)法,礼(丶一丨丿乛)字法等。

这样用Unicode的话,就是不加任何处理,排序出来的汉字也是很有道理的。但如果想排出拼音顺序就还得再想办法。

查Unicode和康熙的时候,还查到了这个海峰五笔超大字符集输入法,一个用于Win系统的五笔输入法,有86和98标准,最厉害的是:收录UNICODE超大字集全部七万多中日韩汉字,同时他们还提供一个exe来安装这个字体

  CJK基本   [4E00-9FFF] 20992码位 实际20924字

  CJK扩展A   [3400-4DBF] 6592码位  实际6582字

  CJK扩展B   [20000-2A6DF] 42720码位 实际42711字

  CJK扩展C   [2A700-2BA7F] 4224码位  实际4219字

  CJK兼容扩展 [2F800-2FA1F] 544码位  实际542字

  CJK部首扩展 [2E80-2EFF] 128码位  实际116字

  CJK康熙部首 [2F00-2FDF] 224码位  实际214字

  CJK笔画   [31C0-31EF] 48码位   实际36字

  CJK兼容 [F900-FAFF] 512个码位 实际474字

01/12/07 13:24:17,由 cathayan发表。 本文链接
  

01/10/07

苹果推出iPhone

cathayan.org版权所有,保留一切权利。转载请保留此说明。谢绝商业转载。

apple iphone
苹果真可以说是众望所归,在大家全都引颈张望的时候拿出来,恰到好处地让大家满足了一把。这种效应比之于大张旗鼓地去搞市场活动,怎么也是事半功倍了。

这个iPhone,GSM 4频,支持EDGE,蓝牙,WiFi,相机,智能手机功能,便携计算能力也有,320×480,只有一个按钮,其他全是Multi-Touch触摸。据称在打电话方面,或者是怎么使用联系人名单方面有重大创新,让打电话更方便。

设计上当然也很酷,只有一个大屏幕,虽然已经有那么多手机巨头,苹果还是能让人眼前一亮。

Fans是要不断地期望而后满足的,如果不能满足,Fan的程度就要减少,三减两减,慢慢就没了。就跟微软好不容易推出来个Vista,也没有在新闻上呆多长时间,谈论很快就弱化了。还有谷歌,真的跟周某人旗下产品战略合作了。

韩寒贴出个文章说他的Blog被引入试卷,当作改错题的题干,要从里面挑出4个错来,真是众望所归啊--几十年了,这种方法就没变过,我想每个考过语文的中国人都不愿意再去看语文书,做语文题,可它就是数十年如一日,就是不改;好像还要写中心思想,写作者表达了什么微言大义,这种东西,只怕全世界一个Fans也找不到了吧。

听说:

集成email/web brower/map/search支持
iPhone的操作系统是OS X,预置了sarafi阿之类

01/10/07 09:09:06,由 cathayan发表。 本文链接
  

01/06/07

罗马

cathayan.org版权所有,保留一切权利。转载请保留此说明。谢绝商业转载。

元旦时看起,刚才终于看完了HBO剧集《罗马》的第10集。有的连续剧是盼着看完,就像《24》,开始了就停不下,但这个《罗马》却是让人不舍得看下去,只怕看完了没得看。

看到HBO的标志性的雪花白屏,不禁想起了Sex and the City。这个片子里的故事虽然发生在2000年前,却依然被HBO加上了自己的特色,随时随地都是Sex,后面几集好像换了导演,直白的成分少了,却上了更重的les :P 不过这些不是重点。最后剧组名单出完,单出一屏上面写 in association with BBC ,这简直就是质量的保证啊。所以这个片子可以说是有剧情的纪录片,还是BBC风格的。

该片的历史顾问,名叫乔纳森·斯坦普,毕业于牛津,罗马研究硕士,在BBC拍了10多年的纪录片。有这样的班子,片子里的布景、服装、道具,甚至人物的长相都确实很有罗马风范。看这一页上面的演员,凯撒,庞培,屋大维,西塞罗,以及赛维利亚,艾提维等几位有点符合我对罗马的想像。

男主角之一的弗伦纳斯,是个典型的职业军人,冷静,强悍,直率,静如处子动如闪电,在凯撒的13军团中任标枪队队长。普罗是另一个重要的军人,他是个士兵,受命跟着弗伦纳斯去找被偷走的13军团的军徽,然后这两位就成了兄弟。由于任务完成得好,就受到凯撒的重视,然后才进入这个剧的所有重要事件之中。

故事一方面讲弗伦纳斯和普罗这样的普通人,一方面讲凯撒布鲁特斯这些贵族。场景上既有元老院,也有贵族的豪宅,不但墙刷得很漂亮,天花板上都涂了漆;当然还有大量的普通街道,狭窄肮脏,黑暗,东西乱七八糟。至少看起来更像是纪录片,而不只是什么大帝那样的戏。

纪录片当然还要讲罗马生活的各个方面。罗马人吃面包,也吃鱼,贝壳类,牛羊之类,喝酒,没见生火做饭;罗马人可以做军人,农民,卖肉的,贵族可以当参议员,进元老院;有演戏的,不过没有唱,也没有白,基本是哑剧,剧情多取材于社会大事,有时相当粗俗,等同于现在我国某些乡镇还有的野班子;罗马人自己至少是个平民,以出身的高下区分,贵族家庭出来的就是贵族;奴隶来自许多地方,高卢人,凯尔特人,也许还有日耳曼人,还有黑人;奴隶可以买卖,也可以租用;有专门的奴隶市场,士兵打仗得到的或买来的奴隶就先寄存在市场上的笼子里,有空了可以去卖;奴隶身份有登记,逃跑的可以抓回来,如果有钱或是主人愿意放也可以到登记处领个证明,从此成为自由人。

弗伦纳斯是罗马人,是个平民,但剧中当他升任治安官时被人称为长得像高卢人;普罗是奴隶的孩子,但进了军队,然后就是个平民了。剧中把凯撒描写成一个极具创新精神的政治家,不断打破传统贵族的习俗,让平民当了治安官,后来干脆让弗伦纳斯也进了元老院,更甚至发布命令要人优先雇用罗马人来干活,而不得先使用奴隶。他甚至让高卢人进了元老院,正是这个促使贵族们动手杀了他。

凯撒自己当然也杀对手,甚至对一些行会的有影响力的人物也不放过;当然也有就专门的搞暗杀的人。这些行会好像也很普遍,有时庆典时就声明面包由面包公会提供,然后还要加句广告词:面包公会只使用最好的面粉,为罗马人做最好的面包 :D。

但就剧中看来,罗马的制度还是松散,和秦始皇时代就开始的郡县制不可同日而语。他们有元老院,贵族们共同讨论一些事;街道上有治安官,也没有办公的地方,就随便摆个椅子当街一坐,有事的人就聚过来说;有法官,允许原告和被告请律师为自己辩护,审判就在大街上,普通民众在下面看,律师说话时还不时叫好或起哄。至于罗马以外其他地方,估计也就是总督了,没有直达基层的制度。

13军团其实也就2万人,军人有工资。凯撒追庞培随便就跑到希腊,再带几百人就跑到埃及,对罗马本身基本不管不顾,以至于敌人的消息也可以随意在元老院门前公开宣布,很没有宣传意识啊。

里面把埃及写得相当不堪,不过那时埃及确实连绘画都学罗马了。凯撒几百人就平了埃及,占有了王后克利奥佩特拉,还居然停留了一年之久,让这位王后生了个小凯撒出来。

当时的罗马还是全面的多神教,朱比特是个大神,其他还有众多小神,普罗信的神似乎又和罗马人不一样。向神献祭,一般是鲜血,贵族就用一头牛,站在高高的架子上,杀掉,让血流到下面的人全身上,士兵或作战时没有这个条件,就用刀划开自己的手,让血流到祭坛上。罗马城里有专门的祭司,他们平时管神庙,有庆典时还要搞些仪式,比如把凯撒涂成大红脸之类。

还有土地是要由凯撒这样的人发的,弗伦纳斯就得到一块,头一回去还要搞些祭祀仪式,其中重要的环节是:男女主要就在地上现场表演。

这个剧的情节未必很紧张,但确实表现得非常全面,绝对值得一看。马上就有第二季上映,这也是最后一季,期待一下。

01/06/07 00:08:41,由 cathayan发表。 本文链接
  

01/05/07

Firefox的Profile

cathayan.org版权所有,保留一切权利。转载请保留此说明。谢绝商业转载。

有时候启动Firefox时会弹出个对话框,说Firefox已经在运行,但是没有反应了,必须先关掉这个进程或是重启才能继续。这个我也遇到过,但看上去像是退出失败,进程还留在系统里,在Windows下面的任务管理器中可以看到,结束它就可以,Linux下面ps一下也可以看到然后杀掉它。

这里是M.C.提供了另一个可能,就是可能没有进程留着,但是Profile被锁定了,提示和上面一样。Mozillazine提供了更多信息,大意是Firefox或其他Mozilla软件运行时,为了防止其他程序修改正在使用的Profile,就设了一个锁定的机制。当使用它的程序退出之后,这个锁定应该是正常地解除,如果没有正常地退出,就有可能Profile的锁定不能解除。

不过看来这个锁定也简单,就是个文件,名为Parent.lock或是lock或是.parentlock,按Win/Linux/Mac系统不同而有差别,但它的位置都在Profile目录下面。如果系统中已经没有运行中的Firefox进程,但Profile还是锁定了,提示说已经在运行,就直接找到这些lock文件,删除它们,应该就好了。

有人为了避免这个问题,还专门写了脚本,发现有这个lock文件就直接删掉,这样是否会删掉正常的lock呢?

从这一页还学了一招,就是在缺省的Profile目录下,有一个profiles.ini文件,这个文件不论你如何改变都在这个位置,它就记述了目前正在使用的profile名字及其路径。如果你改变了profile的存储目录,或者有多个profile,看这个文件还挺有用。

从MC那一页的留言中,还可以看到bookmark的备份在Profile目录下的bookmarkbacups下面,如果Firefox崩溃毁掉了bookmark,就可以从这里恢复;还有如果自己设的工具栏按钮被清理到初始状态了,删掉一个名为localstore.rdf的文件可能会有帮助,正常状态下没有这个文件。

对Firefox或其他Mozilla软件来说,Profile这东西实在太重要了,用户的全部个性化设置和使用时产生的数据全在这个目录下,把它删掉,Firefox就会恢复到出厂状态。有时候使用中出了问题,清理掉当前Profile或是另起一个新的Profile--也就是恢复到Firefox刚安装完的状态,但不用重装Firefox--就可以解决。反之,如果只是重装Firefox,但不清理这个Profile,那就完全没用。

Mozilla firefox的Profile目录的位置如下:

Windows 95/98/Me:
C:\Windows\Application Data\Mozilla\Firefox\Profiles\\
Windows 2000/XP:
C:\Documents and Settings\\Application Data\Mozilla\Firefox\Profiles\\
Windows Vista:
C:\Users\\AppData\Roaming\Mozilla\Firefox\Profiles\\
Linux/*nix:
~/.mozilla/firefox//
Mac OS X:
~/Library/Mozilla/Firefox/Profiles//
~/Library/Application Support/Firefox/Profiles//

通常,Profile name是形如*********.default这样的形式;Thunderbird的话把Mozilla/firefox这一串换成Thunderbird即可,也就是它不带mozilla这一层。

如果要备份自己的个性设置及使用数据,只要拷贝这个Profile目录即可;重装Firefox或到其他机器上恢复这个目录,再让Firefox使用这个目录即可。Thunderbird的所有信件也在这个目录下。

并且,这个目录据经验人士试用,完全可以从Windows下面拷贝到Linux下面去用;这一点我没有试,但我试过把Thunderbird的信箱文件拷贝到Linux下面去,完全没有问题。

这个Profile目录下的数据有:书签、密码、Cookies、浏览历史以及用户设置,也就是about:config的所有数据,写在prefs.js里面,或者是另一个文件user.js。安装的搜索及扩展也全部都在这个目录下。插件会在plugins目录下。这些文件的用途,mozillazine的知识库中也有讲解。

Mozilla程序当然就有专门的Profile管理器来管理这个Profile,启动这个管理器的方法是:

firefox -profilemanager (或者 -P)

当然要找对firefox程序的目录才行。它启动之后,就是个小窗口,里面列出现有的Profile,你可以再创建另外的Profile,为它指定名字,指定它的存储目录,也可以删除一个现有的Profile。创建新的Profile时,完全可以让它存在另外的,任意的可用空间上。

上面说备份Profile就是拷贝这个目录,不过没试过直接把新Profile目录指向一个备份Profile是什么样的效果,以及会不会对这个备份造成什么不良后果。我一般的作法是生成一个全新的Profile,然后退出Firefox或Thunderbird,再从备份中把想用的文件或子目录拷贝到这个全新的Profile目录下,覆盖其中的文件或子目录,这个作法是可靠的。

有多个Profile之后,启动时就会显示这个管理器窗口,要求用户选择一个Profile来用,如果不想选,点中下面的“不要再问”即可。也可以直接生成一个指定要用的Profile的快捷方式:

“C:\Program Files\Mozilla Firefox\firefox.exe” -P “Profile Name”

这里要注意名字是大小写敏感的。

01/05/07 09:46:44,由 cathayan发表。 本文链接
  

01/04/07

新年

cathayan.org版权所有,保留一切权利。转载请保留此说明。谢绝商业转载。

其实元旦对我们似乎还算不上新年,更其实元旦以前就是指的正月初一,而只有正月初一才是一年新的开始。所以过了这个元旦,我们还有一个多月的时间来回顾和展望,时间是足够的。

除了去西藏,这一年似乎没有亮点,生活平平安安,没有揪心的电话要打,工作上没被人骂也没有什么进步;一直希望发生的变化却只发生在过程上,现在也没有结果。也算是悬而未决吧,以前我很害怕这种感觉,但有了一些经历之后却可以安之若素了。

也许有人会在经历一帆风顺之后充满自信地面对一切未决之局,正如长跑好手应该不怕发令枪响前的那几分钟(我瞎猜的,应该也会有肾上腺素增加才对吧);我几年前经历的却是无可奈何。回想过来,居然在重压之下的无可奈何之中又活转过来,并没有精神崩溃,也算是不错的了。

其后再看历史,就往往发现其中的偶然,再不去追究它有什么必然;再去看一些事情,也能把其中的规则看得更清楚。结果就是在最猛烈的网上骂战中也可以飘然前去,兴尽而退--对手如果知道有这样的作风存在,不知道会不会气个臭死:P。

去西藏之前我看了论语,虽然以前也看过;然后又看了圣经,现在也还没看完;回来之后又看了本密宗的书。至少从这三种经典思维来看,人类这两千年没什么变化。我所经历过的所有精神状态,无一不被先贤们以各种方式讲述过,开导过。这样子是不是很无趣呢?不过看书时倒经常是很可乐的。

说起来我还在某人的积极教导鼓励之下积极主动地参与了一些人生活动,比如充满欣赏地逛街和满心欢喜地吃与喝,阅读其他风格的小说,观看不曾看过或看上的电影与戏剧,以及一时冲动就跑出去4000公里等等等。这些活动今后要经常搞,积极、主动地搞,搞成制度化。就像某哲人说的,如果不能扩展生活的宽度,就加强它的深度!!!

不过,新年还是希望有新变化,不为别的,就为再多一些不同的经历吧。

01/04/07 00:39:00,由 cathayan发表。 本文链接