01/21/06
常见到某些ID由字母和数字混杂构成,如果仔细看的话,这个数字也许还代表字母,和字母一起组成一个有意义的单词。但一直没看到常用的对应关系,猜想一下:
1, l
2,
3, e
4, a
5, s
6,
7, t
8, g
9, q
0, o
以后可以应用一下。
美国政府要求Google提供一些用户资料,以便从中找出支持自己法案的证据,被Google很牛B地拒绝了。这种作法同另两大网络/IT公司的作法很不相同,在去年,Yahoo和微软都只因政府的要求而提供了全面的合作(有可能Yahoo接到过法院的命令?)。
有个人说过,在我国历史上,从来不缺敢挺腰子的人,哪朝都有,但挺了之后还能活着的,只有宋朝,因此宋朝引起了众多有痣青年的向往。历史记载上确实有些事件表明,宋朝大臣可以在朝堂上走来走去,高谈阔论--其实明朝也可以;有时候说的皇帝没话说,但居然也不杀人,最多流放了事。
之所以当大臣的敢这样做,而皇帝又不敢那样做,是因为在那时皇帝并非绝对正确,他仅仅是天子,而不是天,更不是天理,而天和天理是由学者们来解释的,就是皇帝也只能服一点软。也就是说,那时权利并非一个统一体。
但在伟大的康熙帝时期,这位有为的皇帝在朝堂上发了次火,彻底统一了天子与天的关系,天理归由皇帝老子解释,于是皇帝就是永远正确的了。这个结论宣传出来,影响非常坏,至少再没有人可以挺腰子并且好好活着了,再后来便没有敢于挺腰子的人了。
Google所面对的这个力量,只不过几种权利中的一家而已,它的命令你可以听,也可以不听,你不听,他还没办法,只能跑去法院,请法官协助,再下一个命令。而这个命令是可以上诉的,如果Google还继续不服的话。想当年WP以及NYT连续跟政府难看,发表全文的五角大楼报告,法官也下了禁令,但官司打下来,报告还是可以发表。
所以,现在Google的律师就很骄傲地宣布,他们“将积极地抵制这一要求”。
01/17/06
不管你是否认可版权制度,它都是到目前看来最好的激励创新的手段。也有研究表明,人类社会建立版权制度的400年来创新并不比以前多出太多,我想它的研究方法和尺度可能有些问题。
更多情况下,版权是一种短期利益行为,也许真和大的创新没有更多关系,但它的短期效果已经足以激发出一个经济,知识经济就是建立在这个基础之上的。这个基础不牢靠,就不可能有知识经济。近日,国内媒体没见报道,而
金融时报中文网很激动的连续报道了几个消息,包括意大利糖果公司费列罗(Ferrero)起诉仿制其巧克力的中国公司,星巴克在上海起诉使用它名字的一家咖啡店,一些国际著名奢侈品品牌起诉新秀水市场,这三次诉讼全部在中国发生,并得到胜诉的判决。虽然败诉者还在上诉,但已经可以明了法院的态度了。
其实说起来,巧克力的样子,星巴克的牌子确实和创新没有关系,但它们一样是知识产权,不保护就没有这个产业,你想进入这个产业,就得遵守这个规则。而我们必须进入这个产业,这是目前产业链的高端,进入高端就能吃低端,就能游山玩水也来钱。日本有漫画和游戏,韩国有电影电视剧,都在向我们输出,更不要说好莱坞了。如果看新闻联播的公关稿的话,我们可以知道,上头是要这样搞的。
这其实对国内所有依靠知识吃饭的人来说都是一件好事。虽然我们还有比日韩要多的禁忌,但经济活跃起来,禁忌是抵挡不住的。
01/16/06
纪念日是1月15日,地球上还有些地方停留在这个日子里,所以还不算晚。
目前,
Wikipedia英文条目已经达到92万,预计将于下个月底超过100万条。Wikipedia共有接近200种语言,包括中文。全部语言算在一起,已经有310万条条目。目前在互联网上是流量第20大的网站。
中文条目:维基百科目前有53,492个条目。
这个数量不包括对话页,没有内部链接的条目、重定向页以及其他名字空间的页面,如果加上这些页面,我们总共有158,058个页面。
自2002年7月以来,用户共编辑页面1,372,295次,每页平均编辑8.68次。
目前按照条目数排列,中文版为第11名,位于俄语版之前,西班牙语版之后。
目前按照内部链接数排列,中文版为第11名,位于希伯来语之前,葡萄牙语之后。
数据库总大小:123.0Mb
总字数:1730.0万字
页面日索取量:1000
平均日流量:100000
维基百科共有171台服务器,位于美国佛州坦帕,另外在巴黎、阿姆斯特丹和汉城有辅助服务器集群。
2005年,它引起了很多关注,也有批评在内,但更多的是赞许,《自然》认为,它的条目质量不低于大英百科。
1月15日还是另一个有趣的系统的5周年纪念,
Drupal,一个超级灵活的CMS系统。一同纪念一下。
01/15/06
英语当然是强势语言,几亿人的母语,一、二十亿人的第二语言,事实上的国际语言。FT中文网还从联合国教科文组织的《
翻译索引》上找出了一点足以让英语人口
自鸣得意的数据:最受欢迎的作家,根据是被翻译次数最多。根据这个数据,3/5是英美作家,英国的贡献可以同整个剩下的欧洲相比。
里面没有任何非欧美作家(除去圣经)。
教科文组织认为这是国际政治同商业合谋共同制造英语强势的一个成功,但该文作者,英国的金融时报的作者对之不以为然,他认为也许有更内在的原因。
他所认为的原因包括:英语词汇量更大,吸收其他词汇更自由,这就造成了英语的表现力可以从德国人骂人到法国人求爱,因此英语文学更优秀;其次是英语国家人士更乐于写作,其国民也乐于阅读,以英语为乐。
其中颇有自鸣得意之处吧。其实英语词多,多数是无聊的专业词汇,对语言本身贡献并不多,据说邱吉尔不过2万多词汇,就已经可以得文学奖了。其它任何语言在这方面都没有问题,这很难成其为理由;倒是听说过一个英语更流行的解释,说是当年英国国王是法国人的时候,王室和上层那里是说法语的,而英语只流行于下层,一直处于一个自由发展的状况,从而变成了今天这种自由的风格,起码乱七八糟的格啦性啦比其他欧洲语言要少得多。后来经莎士比亚在文学作品中一番规范化整理,成就了一种极为流行的语言。
从这方面讲,现代汉语的经历决不比英语差,这种口头语在民间自由发展了2000多年吧,一直同书面语分离,我感觉比英语要自由得多,词汇也并不少。我们所缺的,似乎是一种以汉语为乐的气氛。作家们出产也少,也没有时代气息;或者也有风行一时、一处之作,但过不了两三年也就消失无踪了;传奇话本之类虽然精彩,却时代太久远了点。
01/08/06
首先要摒弃的一个概念是,汉字简化是近几十年的强行推广的结果,这是大错而特错的。方舟子曾经写过一篇文章“汉字简化简史”,里面很好地说明了这个问题,建议有兴趣的看看。同时就不给链接了,相信朋友们搜索和突破的能力。
谈起这个是因为周末居然在Linux版上遇上了这么一篇跑题的文章,里面说汉字简化后实在给计算机处理带来很多问题,主要问题是不能方便地把简体通过计算机转化为繁体。我觉得这个说法十分无聊。开始大力推行简体时计算机还在美国实验室里,中国人更早写简体字的时候,二进制在法兰西科学院里还没提出呢,当然也没有法兰西。所以这个问题不是因简体字产生的,而是因计算机产生的。所以,如果觉得这是个问题,首先应该继续发展计算机或者是抛弃计算机。
这样说当然比较扯淡 :mrgreen: 但这确实不能成为反对简体字的理由。真正值得懂行的人反对的简体字,其实不多,如后和後,干和乾,发和髪,这也不算是简化,而是一定程度上的归并。这些字特别注明一下也就可以了。方舟子还有一篇“汉字简化和字源”,里面讲到其实不少简化本身就比繁体更科学,甚至更古老,因为那是甲骨文写法 :P
我觉得是现代汉语发展的方向,就是用更长的语句,更多的字数来顶替那些被减掉的难字繁字。那种繁字难字是适合于文言的,对现代汉语来说,它们已经没有存在的必要了。文言时代(除去诗经时代),写作同口语经常是分离的,写作的人惜字如金,能用一个字的大体不会用一个句子。这就当然地要求有许多意义精妙,分别细微的字,而不能用更简单或是同音的字来代替。而现在汉语是如何?我们写的就是我们所想的,口语同写作完全结合在一起,我们可以用更多的字数来表达复杂的意思,用词来区分细微的意义,也就不再需要用一个字来做这件事了。也就是说,我们会用到的汉字会越来越少,绝不会越来越多。近来有人说把的得地三个字合并成一个“的”算了,我会举手赞成的。
据说苏美尔人早期在泥版上画符时也是符号多多,后来画得累了就简化成了600多个,后来离他们比较近的地中海那块就更进一步搞出几十个字母,不也用得很好?我不敢说汉字也会减到600多个,但2000左右是基本够用了。而与此同时,我们会发明发展出更多的词汇,双字的或多字的。在这里,字相当于英语中的音节,而词相当于英语中用空格分隔的那个东西。我们叫单词,对岸从繁体的意思出发叫做“单字”,也是反映了这种差别。
再回到计算机处理上来,就有大侠勇猛地指出:
brep (哪个虫儿敢做声) 于 (Sun Jan 8 23:51:07 2006) 提到:
实际上就是有一小撮人在妄自菲薄,安照这些人的逻辑,不仅仅要批判简体字,使用中文都是错误。
拼音文字是用空格来隔开单词的,这给搜索带来了很多好处。但中文的词汇之间是没有空格分隔的,必须采用分词技术才能进行中文搜索。那些对简繁转换问题喋喋不休的人,发展下去就会要求大家写文章的时候,
在 词汇 之间 加上 空格,便于 他们 编写 搜索 软件。
这种拉不出屎来就怪茅坑的人,现在有很多。
01/04/06
微软Geek Blogger,著名的Scoble关注了一下MSN删除Blog的事件。在
第一个贴子里,他表示他个人认为这是错误的。在
第二个贴子里,他又说微软就是这样的,条款中说得明白,一样要“at government request”而拿下一些东西,比如“儿童色情和非法的东西”。
Scoble是个聪明人,他说的是要求,而不是法律。当然,在第13条评论中有人说,如果布什要求拿下反战的Blog,微软会怎么办呢?这方面微软倒是一点都不必担心,他们有法律,什么修正案,五角大楼文件之类的判例都可引用。
又说起电脑,有人认为电脑这么好东西放在那里,就一定要物尽其用,不但要敲字,还要跑大游戏,还要编译程序,还要做图片,做三维的,还要编视频,做音乐,总之最好让它随时保持80%以上的CPU利用率,内存能占满就让他满上。这是这位仁兄所认为的为什么要用Windows而不用Linux的理由。
且不说CPU 80%、内存占满时Windows的表现有多糟,这种用法已经不符合时代的要求。时代要求我们干事要讲效率,所以要保持随时有大量的空闲内存,CPU利用率不能超过10%,最好专机专用,专人专事,编程的不要去折腾人家视频的工作,写网页的也不要顺手去折腾美工,当然,本来的Photoshop高手也不要以为会点Frontpage就说自己会做网页。
这不但符合分工合作的时代精神,也算是给别人活路,保存自己体力的不二法门。当然事实并非如此,比如凤凰卫视用闾丘露微,什么地方都让她出镜,把个美女累得像个农家妇女,别的人估计想出镜想得眼绿吧。
又说用电脑打电话,好在Skype有Linux版,用起来效果一流,总算不输于Windows一次。其实也就是现在IP设备不足,总有一天大家会用上Skype手机的。看人家银行,电脑也是Dell的,屏幕上就一个字符界面,这才叫用电脑哪。
这句话表明我一辈子都将是一个农村人,这种状况不会因为我有城市户口而发生任何改变。而作为一个农村人,1000人的村子里有起码有500人是亲戚,另500人也都依各种辈份都有不同的称呼。也有的亲戚同父母双方都有亲戚关系,如果以母亲一方来排,也许是叔伯辈,但如果依父亲一方来排,却只不过是个大哥。我小时候就搞不懂这些,总是记不清楚,见了人也不爱叫,因此在村子里留下了孤傲、不爱说话的印象。
有个同学出国后,曾经说起出国的缘由或好处,说是这样一来,跑得远远的,村子的四大姑八大姨都不联系了。记得他说这话没多久,就有他家里寄给我一封信,让我帮忙发出去。其中有几封里写道:听说国外电视机便宜,什么时候搞几台回来。记得是他二姑写的。这才是真正的麻烦。
中国城市与乡村的区别,我相信比北京与纽约之间的差别要大,虽然我没去过。我至今记得第一次从北京站出来时那种恍惚的感觉,它给我的冲击半年甚至一年后才慢慢消退。所以我想我的乡亲们仍然有对城市的超现实想像是正常的。在他们的想像里,我应该有直通中央的能耐--是的,我曾经跨在自行车上看着长长的车队在校园里飞驰而过。
我爸爸当然是明白他儿子的水平的,一个孤傲不爱说话的农村人在城里也就是个民工嘛,但他磨不开面子,尤其是当亲戚朋友们上门或是请他去,拜托他让我来帮什么忙。最近的一次是希望我能找一个厉害的律师,暗地里是希望我能同最高法院拉上关系,影响一个一审死刑犯的命运(从Google结果来看,这是我们村子唯一一次出现在互联网上,还是件坏事)。农村里仍然是“人之将死,其言也善”,其实他们都忘了当初此人嚣张时他们在想些什么。
然后我当然也不能--甚至已经不会有这样的想法--去顶撞我的父亲,我于是应下来,然后哀声叹气一番,打几个电话。当然我也没有完全骗他们,而是确实找到了两位在律师事务所工作的朋友,问了这种情况。然后回电话告诉他们某某大律师说不行,有后续情况我会打电话云云。最后好心安慰一番,还不能说将死的人的坏话。