11/28/07

用Linux的请帮忙测试一下Firefoxx 3 beta 1的中文输入问题

cathayan.org版权所有,保留一切权利。转载请保留此说明。谢绝商业转载。

Mozilla Firefox 3.0 beta 1发布后,因为使用上确实快了不少,我就用上了,包括Windows和Linux都装了。我的Linux是Debian Sid,Fcitx输入法,在Firefox 3.0 beta 1(Mozilla官方版)上遇到了很奇怪的中文输入问题:

在任何网页上的Rich text editor中,比如Gmail的写信窗口(非Plain text情况下),其他Web邮箱的写信窗口也是一样,用Fcitx输入中文时,如果有多个字词选项,不论哪种输入法,拼音也好,五笔也好,按 2 都不能选择输入第 2 个中文字词;与此同时,按1/3/4/5都没有任何问题(同时显示5个字的情况)。

以前Fx2.0系列时没有这个问题,其他程序使用Fcitx输入都未见此问题。

网页上的普通Textarea框输入中文也没有任何问题,比如本Blog下的留言框。

如果没有Gmail,也可以到以下网页试一下输入:

http://www.mozilla.org/editor/midasdemo/
http://www.kevinroth.com/rte/demo.htm

在使用这两个网页上的RTE输入时,发现了一个更奇怪的现象,这两个网页的文本编辑窗口下方都有一个“View HTML Source”选项,点选它可以显示当前编辑文字的HTML代码,在HTML显示的状态下,在fcitx输入条上按2可以输入第2个字词,并且此时再转回标准显示模式,仍旧可以按2选择输入中文。

而在在Gmail的写信框上,点一下Plain text然后再输入,或者点完后再回RTF格式下输入,也不会再有问题。

这一招可以作为一个解决或避开问题的方法。

【更新】也可以在输入窗口中使用一下右键菜单,Paste,Undo都可以,比如可以输入一个错字,然后右键Undo一下,这个选字的问题会马上消失;同时同一个Fx窗口内的其他Tab内的同一问题也会消失。就好像什么选项被打开一样。

有用scim或其他输入法的也请测一下,毕竟今后还是要用Fx3的。这个问题似乎还挺特殊,不是Linux中文用户估计也遇不到,可能也很难理解这种输入方式。

怀疑是Fx3里面的keypress事件处理上有问题。这里有个网页可以读取这些事件,显示其结果,看上去按2并没有什么不同,不知道和RTE编辑框混在一起有什么不同。

强烈呼吁有能力的研究一下,如果真是Bug,也可以报一下。

11/28/07 11:48:44,由 cathayan发表。 本文链接
  

11/27/07

奋斗

cathayan.org版权所有,保留一切权利。转载请保留此说明。谢绝商业转载。

奋斗是最近热播的电视剧,说的是80后毕业后的社会奋斗,这个剧有点意思。但是它不是奋斗,它很有点美剧的意思,大的方面没一点对的,小的地方很有可看的。

不知道是不是剧里本身就说了:你这样玩法,让我们的奋斗变得毫无价值──这就是它的大方面。里面的男主角,长得像个正牌的团支书,很不让人喜欢,并且不太会演戏,太做作。他有两个爸,一个是北京规划局长,一个是归来的地产富商,这就是他的奋斗。所以说大的方面基本是扯淡。这一点,就跟美剧一样。

但在小的方面,作者比较勇敢,敢于写出生活细节,比如饭店里服务员要你点贵的茶却偏偏拐弯抹角说这个没有,那个不卖一壶;比如出个点子就跑去要钱;比如小夫妻啥也没想好就结婚,然后吵架离婚;又比如喜欢花钱,有钱要花,没钱更要花,花光了再说;比如还是有很多人很讲朋友义气,好朋友说拿钱就拿钱,橇了朋友的女朋友要一定说清楚再结婚等等。这些都很好,观察认真,写作大胆,说话也很习惯,不是恐怖的人艺腔或者港台腔或者琼瑶腔。就凭这些小东西,这个剧可以让人看得下去,并且还很吸引人,许多人看了一集就忍不住看下一集,很好。然后随着剧情越来越脱离现实,人们就要开始失望了。并且语言上有时太过于北京化,吵架很过分──过分到我觉得早该摔门出去或是打架出手了,人家也没打,估计离北京再远点的就更受不了了。

这些东西也很美剧,三分钟一个小高潮,十分钟一个大高潮,能让人看得心痒痒,追着看,然后到得三季五季,编剧的材料用得差不多了,就开始无聊的,这方面的典型是越狱,现在已经很不好了,还不如24小时更持久。

这个剧还有没怎么看过的士兵突击,都很热,让我觉得编剧们总算开始注意观众的感受了,这真是个很大的进步,不像以往包括现在的中央台,以倪萍为代表的,搞悲壮的时候挠到了脚心,搔痒的时候就像铲子剐在铁锅上,总之不让人舒服。而现在,编剧们开始朝着人们心里想看的东西来做了,其实这也是他们自己心里想看的,但不是他或别人想教给人的东西;这种剧能热起来,说明人们的心理也有变化,大家开始承认自己的小想法,包括享乐的表面的肤浅的想法,并且开始去追求它,而不再被种种教条捂得严实。

看人家许三多,全套装备一上,大头盔护目镜麦克背包突击步枪加战靴,满脸的油彩,看上去跟美国大兵似的,实在是抓住了现代化的精粹,就是全盘美化。但有什么办法呢,还是愿意看一帅哥说这是我的一小步,也不愿意看都穿宇航服到太空了还要开支部会议过组织生活。这一点,老家伙们也有变化,最新的军服已经明显地向美军国军德军学习了。

11/27/07 12:25:21,由 cathayan发表。 本文链接
  

把CHM解开成html来看

cathayan.org版权所有,保留一切权利。转载请保留此说明。谢绝商业转载。

CHM这格式的电子书感觉还不错,用起来挺方便,还只有一个文件。但由于它的全称其实就叫Microsoft Compiled HTML Help,所以从前只有Windows能看,后来Linux上也出了许多查看工具,什么xchm/chmsee/gnochm/kchmviewer等等,但据说效果差异比较大。

后来这个格式就被人反向了,虽然也很复杂,但还是可以解出来,主要内容部分据说和cab文件的压缩算法是一致的,于是就有一些解压工具可以把它解开了,比如著名的开源压缩工具7zip(强烈推荐使用),就可以解开chm。这个工具开源程序很高,所以在Linux上也有,Debian的包叫p7zip/p7zip-full,前面简单点,后者比较全,但是它们都不支持chm格式解压。

后来又发现另一个工具,叫archmage,模仿archive的样子吧(用dict查了下,竟然是个词,archimage,某种大巫师,波斯拜火教的什么的),Python写的,专门来解开或查看chm。基本用法是:

archmage <chmfile> <directory>
把chm文件解开到目录

archmage -p <port> <chmfile>
把自己当成一个http服务器,在指定端口运行,然后就可以在浏览器里看

如果装了apache的python模块,还可以调用它的模块,直接在apache下运行。其实解开就挺好的,这样获取它的文字也比较容易 :p 试了几个,有的完全正常,连旁边的章节什么的都好用,有的正文正常,边栏会乱码,估计转下码就好了。

11/27/07 09:57:41,由 cathayan发表。 本文链接
  

11/26/07

吴晗谈明朝资本主义萌芽

cathayan.org版权所有,保留一切权利。转载请保留此说明。谢绝商业转载。

抄自吴晗讲稿《明史四讲》最后一部分。嘉靖朝是从1522-1567。明朝虽然有很多大问题,但发展还是很先进的,只是运气太不好,又处在时代变化找不着更好出路的堕落心态中。

关于资本主义萌芽问题,现在学术界还在争论,有许多不同的意见。有的人认为资本主义萌芽很早,有的人认为很晚。所提供的史料的时间性都很不肯定,从八世纪到十六、十七世纪都有。特别是关于《红楼梦》的社会背景的讨论展开以后更是如此。是在什么情况下产生了《红楼梦》这部作品呢?它的社会基础是什么?《红楼梦》中的贾宝玉反对科举、尊重妇女的思想是从哪里来的?他骂念书人,骂那些举人、秀才都是禄蠹,说女孩子是水做的,男人是泥做的,这样的思想认识是在什么情况下发生的?对于这一系列的问题提出了各种不同的看法,各有各的论据。而且关于“萌芽”这个词的意义也有不同的理解。比如种树,种子种下去以后,慢慢地露出了头,这叫萌芽;又如泡豆芽菜,把豆子放在水里,长出一点东西,这也叫萌芽。既然只是萌芽,它就不是已经成熟了的东西,还只是那么一点点。假如是整棵的菜,那就不是萌芽;至于开了花、结了果的东西就更不是萌芽了。所以要把这些情况区别开。可是现在在某些讨论中存在有这样的问题:将萌芽看成是已经开花结果的东西。这实际上就不是资本主义萌芽,而是资本主义的成熟阶段了。还有人认为中国资本主义早已经成熟了,中国社会早已经进入了资本主义社会。这样一来就发生了一系列的大问题,中国既然早已进入资本主义社会,那么怎么解释一八四零年以后中国进入了半殖民地半封建的社会?一百年来我们反对封建主义,反对帝国主义的问题怎么解释?

关于这个问题,我自己有些看法,也不一定成熟,提出来大家讨论。我想,要说明某个时期有某个事物萌芽,必须要有一个界限。这个界限是什么呢?就是要具体地指出一些事实,这些事实是以往的时期所不可能发生的和没有发生过的,只有到了这个时候才能发生的。没有这个界限就会把历史一般化了。试问,这个时期发生过,一百年以前发生过,五百年以前也发生过,这怎么能说明问题?而且这些新发生的东西不应该是个别的。仅仅只在某个时期、某个地区出现的个别的东西能不能说明问题呢?不能说明问题。因为我们的国家这样大,经济发展不平衡,有先进的,有落后的,沿海和内地不同,平原和山区也不同。不要说别的地方,就说北京吧,全市面积有一万七千平方公里,市内和郊区就不同,因此,个别时期所发生的个别的事情也会有所不同。所以作为一个事物的萌芽,必须是这个东西过去没有发生过,现在发生了,而且不是个别的。只有这样看才比较科学。

现在我们根据这个精神来看资本主义萌芽问题。我想把问题局限在十四世纪到十六世纪这个人自己已感觉到发生巨大变化的时期,郑重提出那些在这时期以前所没有发生,或虽已发生而很不显著,这个时期以后成为比较普遍、比较显著的一些问题。

第一,关于手工工场。

在明朝初年的时候,有一个人叫徐一夔,他写了一本书叫《始丰稿》。这本书里有一篇文章叫《织工对》。这篇文章讲到元末明初,在浙江杭州地方有许多手工业纺织工场。这些纺织工场的经营方式是怎样的呢?有若干间房子和若干部织机,工人都是雇工,他们不占有生产工具。生产工具是谁的呢?是工场老板的。老板出房子、出机器、出原料。工人出劳动力。工人在劳动以后可以取得若干计日工资,工资随着工人的技术熟练程度不同而有高有低,其中有一些技术水平比较高的,可以得到比一般工人加倍的工资,假如这家工场不能满足他的要求,别的工场可以拿更高的工资把他请去,劳动强度很高,工人弄得面黄肌瘦。这是元末明初(十四世纪)的情况,当时这样的工场在杭州不止一个。

但是,能不能说在十四世纪就已经普遍地有了资本主义萌芽呢?因为只有这一个地区的资料,我看不能。但是从这里可以看出,在十四世纪中期,个别地区已经有了这样相当大的手工工场,老板通过这样的生产手段来剥削雇佣工人的历史事实。这说明当时已经有一部分农村劳动力转化成城市雇佣劳动者。这种情况在十四世纪以前是没有的。

第二,新的商业城市兴起。

在讨论中有不少文章笼统地提到明朝有南京、北京、苏州等三十三个新的商业城市,来说这个时期商业的发展。有三十三个商业城市是不错的,但是时间有问题。因为并不是整个明朝都是这样的情况。事实上,这些城市之成为商业城市是在明成祖以后。当明成祖建都北京以后,为了解决粮食的运输问题,把运河挖深、加宽了。这样,通过水运不仅保证了粮食的运输,其他商品的运输也畅通了,因而促进了南北物资的交流。这样,到了宣宗(十五世纪中期)时期,沿运河一带的许多城市开始繁荣起来。这时候,由于农业、手工业的发展,国内市场扩大了。这是一方面。另一方面,当时为了保证货物的流通,沿长江、运河及布政使司所在地建立了三十三个钞关。

明朝用的货币叫宝钞(纸币)。关于纸币的情况这里不能详细说了,只说明一条,明朝的纸币很不合理,它不兑现,开头拿一张钞票还能换到一些物资,后来就不行了。政府只发钞票,越发越多,超过了实际物资的几百倍。在这种情况下,钞票就贬值了。明朝政府为了提高钞票的信用,采取收回钞票的政策。怎样收回呢?其中一个办法就是增加税额。因此就在各个商业城市设立一个机构,叫做“钞关”。一共设立了三十三个钞关。钞关干什么呢?就是向来往的货物收税。纳税时就用钞票交纳。钞关设在商业城市,有三十三个钞关就有三十三个商业城市,这是不错的。但有些人就根据这个数字说整个明朝只有三十三个商业城市,这就不确切了。因为设立钞关是明宣宗时候的事情,宣宗以前没有。而就商业城市来说,在明成祖的时候就不止三十三个,后来又有所增加。因此不标明确切的时间,以一个时期的情况来概括整个明朝,是不符合当时存在的客观事实的。

随着商业城市的增加,商人、手工业工人也增加了,这就形成了一个市民阶层(这个阶层主要是指手工业者、中小商人)。这些人为了保卫他们自己的利益,建立了很多行会,有事情共同商量,采取一致的行动。在这种情况下就发生了明朝末年的市民暴动。这里应该指出:所谓“市民”这个概念不能乱用。有些人把当时的进士、举人、秀才等官僚都算作市民,这就模糊了阶级界限。这些人都是当时的统治者,不是被统治者。把市民阶层扩大化,混淆统治者与被统治者之间的界限,这是不对的。

第三,倭寇、葡萄牙海盗和沿海通商问题。

明朝中叶,以朱纨为中心的一派人反对对外通商,对海盗采取镇压的政策,因而引起沿海地主阶级的反对,开成一个政治上的斗争。在这个斗争中,朱纨最后失败了。这种性质的斗争在以往的历史上是从来没有过的。汉朝、唐朝、元朝都有过对外通商,有时还很繁盛,大量的中国人到海外去经商;不但如此,国内有不少地方还住有许多外国商人。在唐朝的时候,广州就有数量众多的蕃商。其中主要是阿拉伯人,他们住的地方叫蕃坊。其他如扬州、长安等地方也住了不少的外国商人,对外通商也很频繁。但是像明朝那样,代表通商利益的官僚地主在政治上形成一种力量,和内地一些反对通商的地主进行斗争;这种斗争并影响到政府的政策,这种情况却是以往的历史上所没有的。

为什么明朝会出现这种新的情况呢?因为明朝国内、国外的市场日益扩大,商业资本日益发展,商人地主在政府里有了自己的代言人。商人地主在政治上有了地位,这在历史上是个新问题。关于这个问题,近年来也有人持不同的意见。北京大学有个学生写了一篇文章,说朱纨镇压海盗是爱国的行为。朱纨是个爱国者,这观点是没有问题的,朱纨确实是爱国者,可是不能拿这个来否认当时在政治上存在着不同的意见。当时已经出现了代表沿海通商地主利益的政治活动家,这和朱纨是否爱国是两回事。我们并没有说朱纨不爱国。这点不必争论。问题在于这个时期出现了两种不同的意见,一种意见主张通商;一种意见反对通商,这是历史事实,是过去所没有的。

第四,内地的某些官僚地主也参加商业活动和经营手工工场。

这方面的例子很多,大家所熟悉的《游龙戏凤》中的正德皇帝(明武宗),他就开了许多皇店。这是十六世纪初期的事情。嘉靖时有个贵族叫郭勋(三国演义最早的刻本是他搞的),在北京开了许多店铺。另外有个外戚叫周瑛,在河西务开店肆做买卖。现在这个地方已经很萧条了。可是在明朝的时候,由于南方的粮食、物资运到北方都要经过这里,因此是个很繁华的地方。这样的例子举不胜举。在地方上,明朝四品以上的官到处经商。四品有多大呢?知府就是四品,知县是七品。原来明朝有一条规定,禁止四品以上的官员做买卖。但是行不通,事实上官做的越大,买卖也做的越多越大。特别是像苏州这样的地方,很多退休官员开各种各样的铺子,有的发了大财,成了百万富翁。

官员经商过去也有,但是在明初还多半是武官,到了明朝中叶这种情况就改变了,不但武官经商,文官也经商;不但小官经商,大官也经商;不但经商,而且还经营手工工场。华亭人除阶做宰相时,“家中多蓄织妇,岁计所织,与市为贾”。这种现象也是过去没有过的。过去的官僚认为做买卖有失身份,社会上看不起。士农工商,商放在最后。孟子就骂商人是“垄断”,认为他们不花劳动,出卖别人生产的东西人中取利,是不道德的事情,有身份的人不干这种事。

汉朝以来,各个历史时期都曾不同程度地实行过重农抑商的政策。当时社会上一般是看不起商人的,当然也有个别地区有个别例外的情况。但是到十六世纪以后,这种看法就改变了,不只武官,就连皇帝、贵族、官僚都抢着做买卖,商人的社会地位也提高了。

第五,当时的人对这个时期社会情况变化的总结。

十六世纪中期社会经济情况发生的变化,明朝人看得很清楚,有不少人就各方面变化的情况做出了总结。
[阅读全文]

11/26/07 16:04:51,由 cathayan发表。 本文链接
  

11/24/07

石榴

cathayan.org版权所有,保留一切权利。转载请保留此说明。谢绝商业转载。

IMG_1102

IMG_1099

IMG_1098

11/24/07 20:46:09,由 cathayan发表。 本文链接
  

别拍我,哥们儿

cathayan.org版权所有,保留一切权利。转载请保留此说明。谢绝商业转载。

翻译的新科学家的文章Don't flame me, bro' ,讲了一些可能引起网络口水战的原因,里面引述的研究者们都有更进一步的链接,可以引申阅读。作者是该网站的在线编辑助理。

最近在New Scientist网站上,骂人的话突然间疯狂地增多。不过,这可不是我们的作者水平退化,而是因为我们启用了一个新的评论系统,让人家有机会在整个站点上共享他们的想法和观点。

作为一个版主,我对这个问题很在意,我一直盯着那些评论,并且删掉任何有违住户规约的东西。就是说我读了大量的评论(过去一周共826条),尽管其中大多数彬彬有礼,但也有些死硬的少数派相当粗鲁,故意挑事儿,或者就是纯粹的骂人。看起来人们在网上是会说某些话,在面对面时却根本不会说。

至于人们为什么在网上脾气这么暴,我最喜欢的理论是这样的:大多数人认为在网上进行评论不会很严肃,这里的交往规则是宽松的。然而,只有冷冰冰的文字,却没有与之配合的环境,比如友好的肢体语言,人们很容易就会认定它具有更强的攻击性。于是有些人就恼了,挖坑和拍砖就开始了。

几周前,我被人称为“迟钝的不敢面对现实的自由分子”,之后我决定应该更深入地观察这种网络行为背后的心理。许多网络传播的研究都集中在电子邮件上,然而我发现它的结论通常也能推广一下,应用到聊天室和论坛上。

数十年来,社会心理学家们已经知道如果我们减少一些个人认知,或者叫去个人化,丧失一点自我,我们就会较少地服从社会规范。举个例子,60年代Leon Mann教授就研究过一个恶心的现象,叫做自杀诱导,也就是当有人说要从高楼上跳下时,看热闹的人会鼓动他往下跳。Mann发现如果人们处在一个大的群体当中、跳楼的人在7层以上,以及天比较黑时,旁观者更倾向于这样做。这些因素都可以让这些旁观者失去自我认知。

社会心理学家Nicholas Epley认为,同样的情况也会在在线交流中发生,比如电子邮件。从心理学上讲,这时我们同我们的谈话对象之间相距比较远,同时也更少关注个人身份。结果,就更容易采取进攻性行为。

Epley认为,影响在线交流的另一个因素就是在基于文本的消息中沟通出错的风险,这种方式天生是比较模糊的。同时,他认为电子邮件“有一种不正式的感觉,我们只是把东西发出去”,尽管我们理应严肃地对待它,像手写的邮件一样。大多数人可能都知道,这会给发信人和收信人都造成问题。

Epley解释说:“如果我在一封Email里放一个笑话,你收到它时可能就不是很明确。对我而言这又很难获知:这个笑话很好笑,我只能用我的知识来判断你对它的反应。”而收信人可能根本没有意识到这是个笑话,特别是当他们心情很差的时候,于是就很容易引起一些可怕的反应,诸如“不能相信你竟然那样说”,然后就会引发不必要的争吵。

2005年,Epley指出人们总是过分地高估自己通过Email准确交流的能力。他认为在进行电子交流时,了解其他人的视角是很困难的。与之类似,Kristin Byron一个即将完成的研究发现,与其他交流形式相比,人们倾向于用更负面的态度来解读Email,这就让他们更容易做出有攻击性的反应。

另一个明显的因素是,如果在网上惹恼的某人,你不太可能受到身体上的报复。Epley还比较了隔离在汽车中造成的心理距离,这是另一种让人们容易骂人的情景。

我们能做些什么来减少错误沟通呢,这很难说。但认识到我们可能不如自己认为的那样善于在线交流,可能算是一个好的开始。我知道我经常不得不克制自己加入战斗的欲望。

作者:Michael Marshall

11/24/07 15:31:26,由 cathayan发表。 本文链接
  

11/23/07

推荐Firefox 3.0 beta 1

cathayan.org版权所有,保留一切权利。转载请保留此说明。谢绝商业转载。

Mozilla几天前发布了Firefox 3.0 beta 1,变动比较大,不再是小打小闹,而是升级换代了,用了两天,包括Windows XP和Linux平台,工作得很流畅。这次升级最大的变化就是快,启动快,显示页面快,关闭窗口也很快。另据有人测试,内存使用上有很大提升,说是比Fx 2.0少了不少,比IE7也好──这个问题我没有太多感受。

最重大的变化是,以前遇到的Gmail新版可能滚动慢的问题在Fx3上没有了,开启Compositor效果也没有任何慢的问题,所以我就用下来了。不利因素是大把的扩展都还不支持这个新版,Adblock plus还行,如果扩展比较重要的话,比如搞Web开发的,或者要访问某些JS/Flash比较重的网站的,可能得等等扩展再升级了。

这个版还是Beta版,我已经在Linux上和win上各见识了一次崩溃,都是在没有什么操作的情况下,然后它会弹出个窗口要求向Mozilla报告,然后重启Firefox;而在显示某些图片时,会出现图片和它应在位置出现错位的情况(仅在Linux上)。

另外还有一些小的变化,比如显示FTP站点变漂亮了,保存密码的提示显示在页面上方了,地址栏后有个五角星可以直接Bookmark了,搜索栏宽度可以直接拖动了,点击地址栏里的网站图标可以显示网站信息了,下载窗口更好用了,书签管理也升级了,据说支持色彩管理了等等,都还不错。

下载页面。

11/23/07 20:33:36,由 cathayan发表。 本文链接
  

11/12/07

新版Gmail在Iceweasel里滚动慢的问题

cathayan.org版权所有,保留一切权利。转载请保留此说明。谢绝商业转载。

Iceweasel就是Debian编出来的Firefox,代码上基本是一样的,只是为了商标问题不能叫Firefox的名字了。Gmail出来新版之后,就发现在一台机器上页面滚动特别地慢,有明显的卡的感觉,同时已经降频到1.3G的CPU会立即回到2G,时间略长一点风扇就开始响。想来这还是个扣肉双核,应该不至于。

问了一些网友,发现没有这些情况。今天又试了两台其他机器,包括一台PIII上XP+Fx和一台T40上的Debian+Iceweasel,机器都差多了,也没有问题。清理缓存什么的没有效果。

刚才突然想到新近比较火的X上的Compositor技术,曾经在T40上就很慢,后来给关了;而新机器感觉比较新,Intel的显卡支持又好,就开了,问题可能就在此处了。于是关了Compositor,这一点Xfce4做得不错,自己集成了一点效果和开关选项,关了之后就发现Gmail页面滚动基本恢复正常了。

然后看xorg.conf里的设置,加速选项用了EXA,当时看网上说这是更好的加速框架;试了下还是用原来的XAA,再打开Compositor,居然没有再卡。

所以,要想这个Gmail新版不卡,要么不用Compositor,要么用XAA+Compositor。至于Firefox的哪种技术和X这个新特性有冲突,就不知道了。

11/12/07 19:25:07,由 cathayan发表。 本文链接
  

Firefox内存其实是破碎?

cathayan.org版权所有,保留一切权利。转载请保留此说明。谢绝商业转载。

Pavlov.net这篇文章说Firefox占用很大的内存其实不是泄露,而是内存使用上的碎片,它造成虽然实质上并没有占用那些内存块,但由于隔三差五又占了一点,造成没有连续空间,显得这一大片看上去都被占了,系统在分配内存时也不能再用。

文章中还有图显示这一点,看上去很有意思。但这么CS的话题就不懂了,有能力的同学可以深究。作者还发布了一个叫RAMBack的扩展,据说可以解决一点这种问题。

但现在也要说Firefox是有内存泄露的,许多开发者用各种工具进行了研究,他们有了不少发现,有一些Bug也被修复了。他们用的主要方法是随机调用各种页面,比如Yahoo dir中随机找着看,从del.icio.us中找着看,以及看全球前500大网站等等,在这些过程中,他们发现了一些网站和一些扩展确实会有内存泄露。这就是说,如果你碰巧没有那些扩展,也没有上过那些会引发问题的网站,你就不会遭遇内存问题,这纯属个人习惯问题了。我发现自己人品还不错,Fx一般一开就是一天,没见过内存几百占用MB甚至上G的问题。

电脑问题还是很神秘的,新版的Gmail在我的新机上居然很慢,主要是页面滚动很慢,在这么慢的同时CPU占用也会升高,风扇开始猛转,显得很吃力的样子。这台机器还是扣肉双核2G,1GB的内存;同样的新版Gmail却在老机器上相当顺畅,这包括一台PIII 866和一台T40(PM 1.3G),都才只有半G的内存,很是邪门。在Gmail help的Group里也有好几人报告同样问题。

11/12/07 11:34:07,由 cathayan发表。 本文链接
  

在Linux上查字典

cathayan.org版权所有,保留一切权利。转载请保留此说明。谢绝商业转载。

平时查字典,我主要用的是水木社区提供的在线字典,这里查不到的就用浏览器上Google,用define:word这样的方法查,如果看不懂,就用dict.cn,以前也用过在线的金山词霸iciba.com,但速度远不如dict.cn,页面也比较复杂。一般查英文词就是看个意思,要辨析精妙词义的时候很少,碰到这种情况一般用m-w.com,应该没有这里更强的地方了,Google define一般情况下也够了。

水木词典成为第一选择,全是因为它在终端窗口里工作,速度快,操作方便,只要有网,随时可用(有时会提示连接过多)。我希望词典都这样简单。

前一段又想起来dict.org,它不光有在线词典,同时它是一个DICT协议,分Server和Client,词典数据放在特殊格式的文件内,由服务器提供服务,客户端发出查询接受结果。它收集了一些可以免费自由使用的字典,其中包括两个英汉字典,分别是伏建军的xdict和马苏安的Stardic,它们最初发布的时候就都是GPL授权,xdict更是有17万词汇。但是这些词典原始来源如何就不太清楚了,但似乎没有过异议。水木的词典也很好用,但也不知道版权如何。

在Debian下装dict很简单,装dictd dict-xdict dict-stardic即可,后两个以dict开头的只是字典文件,而在本机上运行也需要启动一个dictd服务。装完就可以在终端上用命令来查词了:
# dict mail
8 definitions found

From XDICT the English-Chinese dictionary [xdict]:
Mail
n. 邮件,邮政,邮递,盔甲
vt. 邮寄,给…穿盔甲 ;
电子邮件,(在unix操作系统另有一个名为mail的信件处理程序)

From Stardic English-Chinese Dictionary [stardic]:
n. 邮件,邮政,盔甲;
v. 邮寄,~盔甲;

From The Collaborative International Dictionary of English v.0.48 [gcide]:
Mail \Mail\ (m[=a]l), n.
A spot. [Obs.]
[1913 Webster]

最后一个词典是另外一个dict-gcide,the GNU version of the Collaborative International Dictionary of English,很强大,包括了1913年的韦氏字典,Wordnet的一些词还有其他许多来源的东西,有释义词性例句等等。有这三个词典,一般就够了。

在Debian系统上,dictd的配置文件在/etc/dictd下面,其中的dict.conf控制查哪些服务器,第一个是localhost,这个比较快,另外的dict.org就只有网好才行了;dictd.conf控制哪些机器可以用本机的Dict服务以及从哪读取字典数据。这个字典文件的描述在/var/lib/dictd/db.list,这个文件由dictdconfig这个程序来操作。还有一个dictd.order文件,里面控制字典使用的顺序,一般中文放前面,就是那两个stardic/xdict;但似乎只改这个文件dictd并不认,此时就需要用dictdconfig - w来把改变后的次序写入db.list文件。再重启dictd就好用了。

还有一些图形界面的Dictd前端,比如kdict/gdict等等,gdict就不是很好用,还是终端吧。

其他:
http://www.dicts.info/uddl.php
一些字典的下载,但这些字典通通只能自己用,不能分发。

英文的网站,汉字数据
http://interstitiality.net/hanziData.html

http://www.mandarintools.com/cedict.html
汉英字典,47000条以上

http://freedict.org/howto/ch06.html
Freedict,自由双语字典项目,尚无中文

11/12/07 08:43:09,由 cathayan发表。 本文链接
  

11/10/07

Blog三不主义

cathayan.org版权所有,保留一切权利。转载请保留此说明。谢绝商业转载。

话说有位正在求职的大学生,在自己的Blog中写了霸王面──没有通知而强行参加面试并最终得到那一职位的经历,被该公司的人力资源经理追到Blog上留言说不要她了。真是神奇的网络,那个blog已经关闭,并且从网友的讨论很可能是真事。

所以重申一下很早的时候Blog界的一些根本原则,就是三不主义:

不写自己;不写单位;不写工作。

那Blog写些什么呢?还是要看Blog这个词的来历,它就是Web浏览的记录,你在网上看到些有趣的,就记下来,评论一下,它是个业余爱好,不是朋友们参加的沙龙,也不是叫卖隐私的身体写作。

11/10/07 11:22:54,由 cathayan发表。 本文链接
  

阿来《尘埃落定》

cathayan.org版权所有,保留一切权利。转载请保留此说明。谢绝商业转载。

没看过《尘埃落定》改编的电视剧,但却是从这个电视知道的这本书和阿来,说明我实在是后知后觉,非常土;但又因为拍了电视剧的缘故,很长时间不想看这本小说,因为拍电视剧的小说通常不是什么好小说。但是,这本小说是个好小说,提升了茅盾文学奖的层次。刚才还搜到阿来自己也不看这个电视剧,因为害怕失望。

这本小说讲的是四川藏区土司家的故事,时间上是解放前一段时间。先是国民政府的官员来到,给他们带来了大烟种子,他们这一家土司种了之后,大大的发了财,然后就买了更多更好的枪,一时在四土司管理的地面上称霸;但种大烟太多,有一年就没有粮食吃,土司家的二儿子,也就是小说的叙述者──傻子,在自己家土地的边境上以粮食为主大搞贸易,建立起一个小镇,同时也赢得了民心。然后在他大哥被仇人杀死,他就要当上土司的时候,解放了,于是一切土司都消失了,傻子也在迎接解放军的当天被仇人杀死。

故事是用傻子的观察来讲的,但是这个傻子很明显地不是真傻,他只是很有自己的看法,并且做为第二继承人的身份让他不得不显得傻一些,有些大智若愚的意思。他自己思考为什么要当土司的问题,就很有点人生无奈的感叹,说大家都认为当土司好,那就好吧。与此同时,他总是做出正确的决定,包括在种大烟正红火时种粮食,在边界上做生意,好运气总是跟随着他,所以也就显得很神秘。

这个故事正如它的发生地一样,确实很神秘,打仗前要占卜,打仗的过程中要有巫师做法,巫师要头戴几十斤重的大面具,这个东西只有在进入状态时才能戴得起来。有趣的时土司家的巫师虽然自称喇嘛,但他并不是真的喇嘛,他只是巫师,管做法占卜和治病;另外还有真的寺庙里的活佛,他也为土司服务。这一点也让这个地区不同于政教合一的藏区。

说起来阿来出生的阿坝地区,应该算是康区,包括四川云南的藏区;另外还有安多,就是青海甘肃地方,现在西藏那块称为卫藏,又分成前藏后藏和阿里三部分。从小说中看,土司的传说中他们自己是从卫藏来的,和当地的土著混合在一起,以至于说话都成了当地话,而和拉萨地方不同;他们的土司的名号是皇帝封的,他们都有自己的印信。既同汉地不一样,也并不和西藏特别亲切。当然,到最后,军队来的时候,他们还是向着西方跑,虽然也和国军一起战斗。

说起来这个地方应该有大量的羌的成分,也有说法是他们是藏化的民族,并不一定就是藏族,有些文化的意思在里面,后来分民族时也很乱,也搞不清楚。总之他们的生活是以土司的官寨为中心的,而不是以寺庙为中心。

这本小说的意境是很不错的,但对我来说,却限于自己的生活经历,有许多不能感受,而觉得阿来写得有些粗线条,显得语言过分地简练;可能有许多东西对他来说是萦绕心头的气氛,而对我来说虽然努力想像,包括用几天拉萨行程的经历来想像却也只能得到些皮毛。

阿来对于生活的描写非常高明,虽然说起来是傻子的想法,但相比许多其他文章来说还是要准确多了,这也许也是一种文化因素,只是生活,没有辩解。土司生来就是土司,行刑人一代又一代就是行刑人,下层人家的孩子即使当过少爷的仆人也仍然只能回到下面去,想得到自由人的身份都是很不容易的。

但不能说就一定要保持这种生活。阿来没有明说各类人对于这个问题的想法,傻子的两个小厮也只有一个希望能立下战功获得自由人的奖励;被土司杀死的头人的后代要报仇因为土司种大烟而没有粮食吃的饥民饿死也没有去骂人或抢东西。然后就解放了,一切都变了样,这样的制度没有了,这个突然的转变会有什么样的冲击?傻子他爹说他是最后一代土司了,他们这样说的时候到底是什么心理?怎样才算是或者要不要保持原有文化?

随着傻子死去,他自己是优待对象,他死在仇人的刀下,一切就尘埃落定了。他们的生活中来了大烟,来了枪炮,来了梅毒,来了赚钱的贸易,最后失去了土司,他的叔叔在成都支持革命,他的姐姐在英国成了一个夫人,回来一次只为了要嫁妆,这种事已经发生了好几百年,但对于真正的当事人来说,巨大的变化无非刚开始,不知阿来后面的作品有无涉及。

阿来没有搞得特别宏大,但也不缺乏历史的气魄,这本书可以当得上民族的秘史了。

11/10/07 11:16:22,由 cathayan发表。 本文链接
  

11/01/07

Google OpenSocial——社交网站的基础架构

cathayan.org版权所有,保留一切权利。转载请保留此说明。谢绝商业转载。

Google似乎是已经宣布要推出OpenSocial,英文Blog里报道很多,但因为正式的东西还没有出现,所以看了一圈,说得也不是很详细,大体是几点:
  • 开发者将会得到3个Javascript和Gdata的API;
  • 这3个API的分别是:用户资料,朋友关系和活动信息;
  • 在Orkut上将会有一个sandbox.orkut.com,开发者可以做测试;
  • 社交网站将得到一个工具帮助他们实现OpenSocial的功能;
  • Google会开通一个论坛做为支持;
  • API发布的网址是:http://code.google.com/apis/opensocial,但现在还是返回404;
  • 目前加入的社交网站有Orktu,LinkedIn,Ning,Plaxo,Friendster,Hi5,Viadeo,XING,甚至还包括Salesforce和Oracle。


基本意思就是有了这些API,所有加入的社交网站就能共享这些用户、朋友及活动的信息,开发者也可以在这些信息的基础上开发自己的应用,包括为这些社交网站开发和为自己的网站开发;有一篇文章甚至提到Google会为开发者存储这些信息,那样的话如果再开办一个交友网站,甚至可以没有自己的大服务器——这里的详细信息没有提及,也不清楚那些加入的网站会和Google以什么的方式合作,Google会存储所有这些用户及交友和活动信息?那些网站同意这样干?如果是各网站分开的,这些API怎么调用这些信息?都还不清楚,但看上去这些API似乎是要成为基础架构了,而Google是这些东西的标准制定者(也许其他几家网站早就参与了?)。

我很少上这些网站,但有时确实感觉它是有必要的;比如同时标明身份,建立朋友圈,共享文章、照片、讨论问题,发布通知等等,比如同班同学(联系比较好的,上学过程中某些阶段已经不想联系了)。但把所有同学都抓到一家网站实在是一件难事,有了这个东西应该就好得多了,也许以后就是a@orkut.com为主,邀请b@freindster以及c@ning.com加入,同样形成一个圈子,各人还不用离开自己习惯的网站和界面。

Email天生是互通的,Jabber系列(包括Gtalk)的即时通讯设计的基础就是互通,MSN和Yahoo Messenger是互通的,据说MSN还要和Gtalk互通,甚至要开放API(见cnbeta),现在终于轮到社会交往。社会交往最重要的是用户身份,这是一切网止活动的基础,抓住了这个,应该说就占了网络活动的先机,而现在Google是它的标准制定者了。

这些网上活动能统一起来之后,其实不如开发一个专用的客户端,应该比浏览器+Javascript/Flash要强点吧。

参考资料:
Google’s OpenSocial API?
Google’s OpenSocial: What it means
Details Revealed: Google OpenSocial To Launch Thursday
Google OpenSocial: The Third Place

11/01/07 12:34:30,由 cathayan发表。 本文链接