05/31/06

Slashdot要换新装

cathayan.org版权所有,保留一切权利。转载请保留此说明。谢绝商业转载。

这是原来的,也是现在的,还没换:

old slashdot

这是在设计比赛中获奖的,也就是要用的:

new slashdot

老的还是90年代后期风格,平面化,比较老实朴素,新的在标题栏上加了背景图,做出了凹凸感,比较现代化一点,也是现在的流行吧,并且跟OSTG同系的sf.net等有点靠近了。在色彩上倒没有大的变化,还是不错的。

05/31/06 09:34:22,由 cathayan发表。 本文链接
  

100美元笔记本的详细规格

cathayan.org版权所有,保留一切权利。转载请保留此说明。谢绝商业转载。

One Laptop per Child,即OLPC,或者是100美元的笔记本的规格如下,据说还在不断变动之中

* 尺寸: 193mm × 229mm × 64mm (as of 3/27/06—subject to change)
* 重量: Less than 1.5 KG (target only—subject to change)
* CPU: AMD Geode GX2-533@1.1W 400 Mhz
* Chipset: AMD CS5536 South Bridge
* 显示: Geode CPU集成
* 内存: 128MB DDR266
* BIOS: 512KB SPI-interface flash ROM; LinuxBIOS open-source BIOS
* 存储: 512MB SLC NAND flash
* 显示器: 7.5” 双模式 TFT display
* 分辨率: 1200 (H) × 900 (V) (200 dpi)
* 键盘: 80 keys, 1.2mm stroke
* 触摸板: Dual capacitance/resistive touchpad; 支持手写
* Audio: Analog Devices AD1888, AC97
* Wireless: Marvell 83W8388, 802.11b/g compatible;
* USB: 3 Type-A USB-2.0
* 最大功耗: 500 mA (total)
* 电池: 5芯,2280 mAh,按上面的功率,应该能用4个半小时

看起来确实是非常地不错。

05/31/06 00:01:00,由 cathayan发表。 本文链接
  

05/30/06

Linux版Google Earth也即将出现?

cathayan.org版权所有,保留一切权利。转载请保留此说明。谢绝商业转载。

LinuxToday报道的消息,来源还是相当地可靠。并且据说Earth不会再用Wine,而将使用QT和GL,好消息。

正好想起Google的语言工具,它对这个报道的翻译还是相当地有趣,统计模型还是有问题的:P :

Linux用户和搜索鸟星期四晚间接受治疗,突然宣布观山,晚上八时解除了公司的Linux版Picasa图片管理工具.
软件被悄悄释放于五月二十五日上午十一时,(但是)即使公布网路搜索.
星期五早上,不少有兴趣的美国以外的用户报告说他们不能进入Linux的网页Picasa--至少没有利用美国的傀儡服务器.

……

这样做的理由,DiBona解释,就是让Picasa版本的Linux开发小组著名酒依赖工程仿真技术. 具体地说,Picasa将利用国内葡萄酒以Linux运作. 在这样做的时候,他说:“我们取得了一些相当大的增加酒” 这样一来会增加工程马上回到酒. 著名的225个大棚,可从酒的新酒在Code.google.com版网站.
DiBona解释引擎工作得以广泛实施CodeWeaversPicasa港口与酒. 这些新的葡萄酒法规,DiBona说:“我们应该有很多其他项目更容易得到应用Linux携来”

05/30/06 11:02:33,由 cathayan发表。 本文链接
  

AI以及终极搜索

cathayan.org版权所有,保留一切权利。转载请保留此说明。谢绝商业转载。

终极搜索,是Google创始人经常被报道的一句话,他们(或其中某一人)认为现在的搜索引擎还有极大的进步空间,而Google的目标就是终极搜索,起码要达到问什么问题都有答案的境界吧。

如果没有问题,是不是要达到没有问题创造问题也要问的境界呢?那就是人工智能了,估计他们很有可能考虑了这个问题。比如这个贴子就说,Google确实雇用了一些AI方面的专家。比如他们搜索质量方面的指导就是一位,而大量数据的搜索也算是AI的一个重要方面。

AI这东西,虽然我对CS所知甚少,但也听到过说这东西没前途,或者一直没有进展,多少年了,也还是那么点东西,在CS领域内似乎地位也不高了等等。通常说起AI的时候,大家都认为如果计算机足够快,就有希望,这个贴子也举了很多例子,比如到2018年,地球上所有计算机的计算能力将可以等于一个人脑;像蓝色基因这样的大系统,有可能在下一个10年就达到这个水平(前面说的是PC?);还有人预测到2019年一台1000美元的笔记本就有一个人脑的计算力。

可是这种计算力有什么用呢?如果他们还只是用来统计、模仿、按指定规则办事的话。正如作者说的,这不是AI,而是IA,也就是智力放大器。它们算得再快,也只能增强人已有的智力,扩展它的范围和深度,而不能发展出新的智力。

这其间必有一个大大的障碍没有突破,甚至看不到突破的可能,因为对人的意识的研究还很初步,更谈不到如何去创造一种意识。也许这是老天才能做的事?

阿西莫夫的作品中,他大量地写到机器人,它们都已经比人还聪明,高级的已经能调整人的意识,但它们仍然缺乏人的直觉。当然它们已经先进得大大超过我们现在的理性思考了。它们的秘诀在于一种线圈(不知道记得对不对了),一种模拟线路,状态不定,其中的电流有很强的自我创新的能力,这就是它们的意识的来源了。当然,最初这个线圈也是某科学家无意中的发现。在这没有重大科学突破的时代里(炸药奖年年发,就是记不住),不如期待一下阿西莫夫的机器人吧 :P

05/30/06 09:01:30,由 cathayan发表。 本文链接
  

05/29/06

曾德昭《大中国志》

cathayan.org版权所有,保留一切权利。转载请保留此说明。谢绝商业转载。

看到篇名为华夷之辨的文章,里面讲了这个葡萄牙人曾德昭和他写的《大中国志》,下面是书中的一些话,我读了也很惊奇,尤其是倒数第2段。现在我们都不敢称赞许多东西。

曾德昭是耶稣会士,1613年到达中国南京,1636年返回欧洲,在旅途上完成了《大中国志》。

“我曾在流往杭州的南京河的一个港湾停留8天,……,一个砂漏时辰过去,仅仅数数往上航行的船,就有三百艘。那么多的船都满载货物,便利旅客,简直是奇迹。船只都有顶篷,保持清洁。有的船饰以图画,看来是作为游乐之用的,不是运货的”

“所有的省都不乏长寿和愉快的人,可以看见许多精力旺盛和健壮的老人”

“他们的住房因设计良好而便于住宿,整洁舒适”“他们种植许多蔬菜,供百姓常年食用”“他们在各地,即使小村镇,都有充足的肉食,全年最常食用的是猪肉,牛肉去骨售卖,他们的鹿肉很少,也不怎么爱吃它”

“中国人特别喜欢花,他们有非常美丽,但不同于我们的花。我们有的,他们也有。有一种没有甚么味道的丁香紫罗兰。他们极力在园子里种植全年各个季节的花,在园里,它们看来很希奇。”

“中国人是如此之多,我在那里生活了22年,离开时和刚到时一样,拥挤的人群令人惊叹。情况确是这样,决非夸张,不仅城镇及公共场所(有的地方,如不用力推攘就不能通行),甚至在大道上,也汇集了大群的人,很象欧洲通常过大节或群众集会,如果我们查看总户籍簿,其中只登录纳税人口,而不记载妇女儿童、太监、文武教师(人数几乎无穷),共有5805万5180人人(引者注:明末中国人口至少在两亿以上,应该接近三亿。这也可以和曾德昭这里的记载相印证,5千多万的人口不包括女性,不包括儿童,也不包括文官阶层,应该还不包括一大部分的流民和商人阶层,所以接近三亿应该是保守的估计)”

“这个国家的财富值得称羡,从上述可以看出,除盛产各种谷物以及一切生活所需东西以外,他们还把所有东方最好最贵重的商品售卖给外国人。”

“中国大部分最好的商品都由此处(引者注:这里指的是广州)运往各地,因为它是中国最开放和自由的交易地点。且不说6个邻国的土著和异邦人运走的各种货物,仅葡萄牙运往印度、日本和马尼拉的货物,每年约有5300箱各类丝绸,每箱装有100匹真丝,天鹅绒花缎和缎子、轻料如半花缎、彩色单层线段,还有250块金子,及每块重12盎司的2200块金锭,此外的货物还有瓷盘,镀金器皿,糖,中国木,大黄,麝香,……即使长篇开列也不能尽举其名”

“(福建省)这个省滨海,是中国输出大量商品又一个优良港口,当地的勤劳百姓,把货物运往马尼拉、日本等地区”

“在海关……有更多的方便。没有堆放、过磅和检查货物的房间,也不需从船上取出货物,只察看一下并根据商人的簿册,征收一笔适当的税。若旅客不是商人,即使他一人带着奴仆,载运五、六口箱子以及许多其他物品,他从一地赴另一地时,一般都把东西留在船上,并不打开检查,更不付税。这对欧洲的海关和税务所是一个好榜样,欧洲的穷旅客遭到凶狠野蛮的劫掠搜夺,随身携带的所有东西还抵不上向他索取的税”

“(浙江)论富庶它超过许多其他省,可以称作中国商品潮流的最佳源头。它的特产是丝绸,无论生丝还是成品,也不管是茧还是原料,都运往各地。总之,中国输出的丝绸,都产自该省”

“南方九省的最后一省是南京,……是中国最好的省份之一,也是全国的精华。……其西部地区最富庶,盛产棉纱,……仅在常州城(Xanuchi)城及附属广大地区,就有20万台织布机。……由于织布机小巧,一间屋子内常常安放许多台,差不多所有的妇女都从事这种行业”

“南京城……我认为它是全国最大最好的城市,优良的建筑,宽大的街道,风度优雅的百姓,以及丰富优良的种种物品。它有令人惊羡的游乐场所,境内人口众多,……各处能遇到拥挤的人群,街道难以通行。此外,无数的宫殿、庙宇、楼塔以及桥梁,使城市显得非常壮丽。”

“中国人天生好经商,不仅从一省到另一省做买卖,获得大利,甚至也在同一城市做生意。商店里有的东西,街上几乎都有售卖。……富有的商人信用良好,很守时(葡人多年的经验证明了这点)”

“中国人温良多礼,喜交谈,因此,在这点上,我们那些仅住在澳门和广州的人是不相信的,因为他们在那里可以说是处于不断的战争状态,起因是葡萄牙人的奴仆和中国人之间每天都发生矛盾冲突。……但在中国其他省份和内地,如我们所述,他们恭敬有礼的和我们交谈,所有集会上都把我们当作上宾,不为别的,只因我们是异邦人,因此他们称我们是来自远方国土的客人,有所需要时,他们从不拒绝借给我们所需求的东西,即使价值超过我们给他们的抵押,也不要利息”

“中国人爽快的赞颂邻国的任何德行,勇敢的自承不如,而其他国家的人,除了自己国家的东西以外,不喜欢别的东西。中国人看见来自欧洲的产品,即使并不精巧,仍然发出一声赞叹。……这种谦逊态度真值得称羡,特别表现在一个才能超越他人的民族上,对于那些有眼无珠、故意贬低所见东西的人物,这是一个羞辱。”

“他们最喜欢的欧洲工艺品是我们的钟,但现在他们已生产很好的桌钟,并能生产类似的小钟,价钱和我们的相当,他们生产的某些东西,如在我们这儿生产,价钱会十分昂贵”

05/29/06 14:32:11,由 cathayan发表。 本文链接
  

05/28/06

电子文档再次泄露信息

cathayan.org版权所有,保留一切权利。转载请保留此说明。谢绝商业转载。

以前就有过一些例子,有Word,也有PPT出问题的。然后美国NSA专门出了个文件,说明其中的问题,给出了一些编辑意见,同样的CNET也做了报道,并指出编辑文字然后在上面压上黑色、用什么东西挡住图片以使看不到等方法是没用的等等。

偏偏还是有人这么干了。在EFF诉At&t的案子中,At&t给了个答辩,是个PDF,里面17-19页这3页上都有用黑色覆盖的文字,初看是看不到了,但在Xpdf,Evince或是Mac机上的PDF工具中,这些字可以选中,反显之后就能看到,或者还可以拷贝文字,总之是盖上的黑色是没有用的。不知道Win版Adobe的情况如何,也许盖了就不能看?反正Linux下的Adobe Reader 7也能选择并拷贝这些字。

这个案子是EFF搞到个内幕消息,说At&t在私下里给网上装了某些设备,以便进行监测,这个内线还说实际上就是被NSA用于窃听的,具体位置在旧金山At&t的数据中心大楼里的某个房间内。这些隐藏的文字就是为此辩解,说即便有也不一定就是NSA啊,完全可以用于监控流量啊病毒啊。可能事后觉得写得不好,就盖上了,谁知技术不过关。

这个故事告诉我们,CNET的贴子以及我上面那个链接都是很值得一读的。


05/28/06 00:01:00,由 cathayan发表。 本文链接
  

05/27/06

JPEG专利要失效,Web2.0被注册

cathayan.org版权所有,保留一切权利。转载请保留此说明。谢绝商业转载。

米国有个Public Patent Foundation,向US专利局提出一个审查,并出示了一些先例证据,证明JPEG这种格式不能再成为专利,US专利局日前认可这一证据,声明Forgent Networks宣称的JPEG专利无效。好消息,据说Forgent再翻盘的机会不大了。

同时,O'Reilly把Web2.0这个说法给注册成商标了,以后要用这个词,还得它同意才行。也算是好消息吧,以后没人拿这个无聊名词聒噪了。

05/27/06 21:10:31,由 cathayan发表。 本文链接
  

Déjà vu

cathayan.org版权所有,保留一切权利。转载请保留此说明。谢绝商业转载。

这是法语唉,被都德胡扯的所谓世界上最美的语言。这是完全地胡扯,每个人的母语对他自己来说都是最美的语言,所以这个小说不翻译的话就不算胡扯。话说讲法语总是嘴角朝下,好像大家都欠他们家钱;讲汉语就是嘴角朝上,老是嘴角冲下会难受的,所以我们讲话时还是很得意的。从包含元音这种乐音的比例上看,法语怎么也要再往后排,汉语的乐音比例是首屈一指的。

扯远了。这个词意思是“已经见过”,也就是似曾相识,专门指这种心理现象。这个情况大家应该都遇到过吧,维基上说研究表明70%的人有过这种感觉。我记得最强烈的一次是大约10岁时从外面回村,走到村口,感觉突然来了,并且感觉说转过弯会碰到某某人,我带着这种观念转了弯,果然见到了那个人。那一刻真是有惚如隔世的意思,觉得周围的样子都变了。

但是研究差不多表明,这种感觉只是一种记忆错乱,属于非正常记忆,具体机理似乎也没有搞太明白。但按黑客帝国的解释,一只猫两次通过一个门口,那其实是Matrix系统重启的表现--这么大个机器重启这么快真不容易。又按近期一个《百莫大三角》的三集电视电影的描述,其实是出现了一个时空裂缝,才会造成一些错乱的场出现

还有个新词叫brate,据称是better than great。

05/27/06 00:01:00,由 cathayan发表。 本文链接
  

05/26/06

Google推出Picasa Linux版

cathayan.org版权所有,保留一切权利。转载请保留此说明。谢绝商业转载。

不过目前主页一直报告404,不知道出了什么问题。但也有人做了这个页面的Mirror。还有个Group专门讨论这个软件。

看上去,样子没有什么不同,是在Wine上运行的。按Newforge的报道,Google靠CodeWeavers完成了大量工作,同时,在此过程中也报告了100多个Wine的Bug(225个Patch)。目前,这个版本没有以下功能:刻录CD,Tivo的输出,非英语语言及Hello共享。支持以下系统,网页上只是要求glibc 2.3,桌面集成要求Gnome和KDE以及Gnome-volume-manager和Hal:

* Debian Sid and Etch
* Fedora Core 4 and 5
* Mandriva 2005 and 2006
* Red Hat (current versions)
* Linspire 5.0
* SUSE 9.3 and 10
* Ubuntu 5.x

对Wine印象很一般,只整过一次,运行了Notepad,还不能输入,不知道现在如何了。

下载链接:

http://dl.google.com/linux/rpm/stable/i386/picasa-2.2.2820-5.i386.rpm
http://dl.google.com/linux/deb/pool/non-free/p/picasa/picasa_2.2.2820-5_i386.deb
http://dl.google.com/linux/standalone/picasa-2.2.2820-5.i386.bin

〖简评〗按上述地址下载DEB包,大小20.7MB,dpkg -i安装,一切顺利,不须再下载什么包。

安装自动安到/opt目录下,同其他Debian官方包有所区分,这一点很好。安装后79MB,包括了Wine在内。

命令行启动正常,同时也添加了menu项目,可以直接在系统菜单的图形一项中找到它。启动后同样提示是扫描所有文件还是指定,选后者,进入界面,添加pics目录一个,扫描的样子和Windows下一模一样。不认中文,全部乱码。菜单英文,没有问题。

运行后在系统区驻留图标一个,运行进程为picasamediadetect,占有内存约8.3MB;Picasa2占有内存约43MB,引外还有一个wineserver占1.5MB。运行比较流畅。

图库界面和单张图片界面都正常,拖拉滚动条的效果如同Windows,感觉Wine真是进步很大了。修改图片属性也可以使用。

发现可能的错误一处,点Timeline按钮,第一次直接搞死了X,或僵得太厉害,不得不到Console下杀掉,同时丢掉了刚扫描的目录;第二次点这个按钮,花屏,按ESC退回正常状态。

总体感觉还不错,虽然不是Linux原生软件,用起来还是可以的。

05/26/06 17:18:19,由 cathayan发表。 本文链接
  

欧洲放弃软件专利?

cathayan.org版权所有,保留一切权利。转载请保留此说明。谢绝商业转载。

LWN的报道。准确地说是欧洲委员会认定欧洲专利局的作法不成为普遍的法律,不适用于成员国,也不对欧洲法院产生影响。也就是说到欧洲审请专利还是归欧洲专利局管,而专利之后的事情,比如专利是否成立及其法律事务还是根据现行法律管,而欧洲法院也可以有自己的意见。

看上去,欧洲还是走向了美国那个方向,毕竟欧洲在这方面也还是有一定优势的:专利可以发,但是否能成立还得看法院的判决。这对个人及开放团体十分不利,因为他们都没有钱和精力来打这种官司。美国法院是基本认可这种专利的,下一步要看欧洲法院的作法了。

05/26/06 13:22:22,由 cathayan发表。 本文链接
  

HTML邮件

cathayan.org版权所有,保留一切权利。转载请保留此说明。谢绝商业转载。

以前用邮件都是客户端比较多,Yahoo/hotmail账号都有,但用得不多。在客户端里面,我一般都是把HTML彻底关掉,转成纯文本来看。Gmail出来后,Yahoo/hotmail进步也很大,起码是容量速度都有不小的提升,于是用Webmail的时间开始极大增长,再于是慢慢也开始接受HTML邮件了。

但发出的HTML通常还是从网页上拷贝来的,为的是它直接带着各种链接和图片,比如发点呆伯特漫画还是很方便的。

真正要写HTML邮件时,才发现很不爽,不论是Gmail还是Thunderbird这种客户端,直接提供的编写选项都太少,只有字体大小,字体种类,颜色及底色,粗体,斜体,下划线,无序和有序列表,缩进,对齐,Thunderbird还有插入图片和笑脸。想在Gmail邮件中直接插入图片还得从别的窗口拷贝过来。

除了图片,表现力也有限,比如想给Header1这种标签加个边框,就还是得自己写。写完拷贝到Gmail时发现,所有CSS效果都消失了。后来发现置入标签内的样式是可以保留的,比如你要写10来个H1,就得把border这个样式拷贝10来次到每个标签内。但这种方法总算是可以用的。

刚才看到这个专门折腾HTML邮件的网页,已经是两年前Gmail推出前夕的文章了,又看到一些注意事项:

有时可以试一下连接CSS文件,而不是置入HTML内。这有可能有用,但可能直接放到每个标签内仍然是比较保险的。

Webmail自己也是网页,已经有body标签,所以会把邮件中的这个标签砍掉,于是和它有关的全局属性就会全部丢失。解决方法是用一个div标签圈上内容,把属性写在div标签里。

有些客户端会把CSS定义里的.也就是类选择符号去掉,导致使用这个属性的标签失去样式,方法是把.feature写成div.feature这样的,点号不在最前面,就不会被去掉了。

Webmail自己也有CSS样式定义,于是就会把用户自己写的一些东西给覆盖掉,比如a:link这样通用的,方法仍然是把它变得不通用,写成div a:link这样的。当然这很麻烦,要在几个地方用a:link就得写几次。

还有Hotmail会去掉html/body/head/meta等各种标签,这时要想用CSS只有写到标签内。

最后,仍然不是所有的CSS属性都管用。

而综上所述,似乎把CSS写到标签内也就是inline的方法应该是通用的。而这种方法似乎是微软风格的,就像用Word生成的HTML文件一样,中文英文都要分别指定字体,实在是推动了文本文件的一切优雅之处。

将就用一下吧,算是写作非Word格式化文档的一种权宜之计了。

还有,如果你的客户端支持,也是可以使用HTML签名档的,据说Gmail也可以显示,可以一试。

05/26/06 01:08:00,由 cathayan发表。 本文链接
  

幽灵世纪

cathayan.org版权所有,保留一切权利。转载请保留此说明。谢绝商业转载。

不是说这个世纪里到处都是幽灵,而是这几个世纪本身的存在让人怀疑了。是不是超级有趣的话题?想一下,你以为今天是2006年,实际上却只是1709年?一下子你所有的时间概念都要调整?

据这位并非疯子的怀疑论者的研究,罗马教庭伪造了这些年代,调整了日历,让没有人生活过的日子成为实际的历史。他的怀疑来自1582年罗马教皇格里高利13世发布新日历的事,那一次调整,把日子向后过了10天,为的是调整前一个历法儒略历(公元前45年施行)的误差,按说这个误差是每年10分钟多,而调整10天只代表了1257年,而不是应有的1627年。

引外他的疑点还有历史学家认为历史上有许多间隔,比如君士坦丁堡建造的时间,558-908年,炼狱的概念出现及形成的时间,600-1100年等等。基于这些怀疑,他认定现行的历法有297年的空白时间,这将近300年的时间从未出现过。

维基上居然有此人及其怀疑论的介绍,也有许多的反驳意见。不管怎样,我都要引用这个Blog的名字说:damn interesting!!!

这个怀疑即便被证实,对我们的影响也不大,中国的历史可以从西周共和元年直到现在一年年排下来,都有可靠的史书为证,伪造年份的可能不大--历史学家们不过调整一下公元元年在我国历史上的坐标点而已,从王莽时代调整到晋初,我们一样能生活在18世纪。

05/26/06 00:01:00,由 cathayan发表。 本文链接
  

05/24/06

大锤解数独

cathayan.org版权所有,保留一切权利。转载请保留此说明。谢绝商业转载。

大锤即Sledgehammer,数独即Sudoku,这篇文章的作者是黄炜华,Google工程师,目前的世界数独冠军赛冠军,前一段Google达芬奇密码游戏的设计者。

数独游戏就是如图所示的往这种9×9的格子里放数字的游戏,要求是每行、每列以及第个3×3的小区内正好分布1-9,而没有重复,也没有漏用。这个图是黄炜华得冠军的最后一题。黄把他自己解Sudoku的方法称为大锤,这个方法看来确实对解复杂的题目很有用(这篇文章有全文翻译,地址在前面链接下面的留言中)。



首先得有一点集合的概念,通常用文氏图表示。这个图里,如果要达到4个圈中的每一个正好有一个图形的要求,就不能选只在绿圈中的图形,也就是三角;同样也不能选那个方块,因为它同时处在两个绿圈中。这里,黄把红圈叫做前提,而把绿圈叫结论;前提没有交叉,而结论可以交叉。



可以得到两条定理:

选红圈外的元素会让绿圈有多于一个图形,因此不能选。
选1个以上绿圈包围的元素会让绿圈有多个图形,因此不能选它。

这个方法的秘诀就在于构造这些前提和结论(条件),并用集合图表示出来。



最简单的正中间那个J点必须是8,这很容易看出来,用这个黄氏大锤法的方法是先表示出这些条件,如第1列,A-S都等于5,就是说这些方块中只能有一个5,第2列,表示这一列里只有一个4,如此类推。它们的前提是,A里面已经是5,B已经是4,把它们圈起来就是前提。同样,J可以是1-9这些数字,也是一个条件。



根据上述定理,红圈外的不能选,两个绿圈的也不能用,因为他们都会引起结论中出现重复结果,所以J只能是8。

下面作者选中的是正文中央那个3×3的小区,利用的条件是横竖两个7。





同样地,BCDG4个点在绿圈而不在红圈中,它们不能是7,而GCDGF这些点又在这个3×3的方块中,它们也是一个条件,那只有F是7了。

下面解最右下角这个格子。利用了与它所在3×3小区有关的含有2的行与列,有3个包含2 的前提,以及3个行/列和两个3×3小区的条件。利用上述定理,可以消掉许多未知因素。最后一个条件是BD所在小区中必须有一个2,这就意味着HN这两点又被消去,则Q点必须是2。





上面这些都是比较规矩的,实战中规矩的大概都要靠大脑,然后复杂的就要同时运用更多条件和前提,前提也可变成是两个方块的取值。如此天马行空一番,解出K=4。最长的两条空的交叉点。



谁有兴趣把它解完?

05/24/06 22:47:19,由 cathayan发表。 本文链接
  

05/22/06

憧憬一下

cathayan.org版权所有,保留一切权利。转载请保留此说明。谢绝商业转载。



Support Bloggers' Rights!



看到个文章说米国法院判令EFF不能刊登有关AT&T在网络上架设某种类型的计算机的消息,然后Wired决定登出。本来这是美国人民的事,也掺和不进去,不过看看人家的斗争精神也是好的,同时憧憬一下我们可能和本来应该有的权利,作为一名Blogger,本应该有权
  1. 匿名写Blog。
  2. 为信息来源保密。
  3. 合理使用知识产权。
  4. 允许读者无所畏惧的评论。
  5. 保护自己的服务器防止别人扣押。
  6. 在Blog上写有关选举的事。
  7. 在Blog上写有关工作的事。
  8. 像正规媒体那样获取消息。
  9. 保护以上权利。

05/22/06 23:28:00,由 cathayan发表。 本文链接
  

05/21/06

看花轻松一下

cathayan.org版权所有,保留一切权利。转载请保留此说明。谢绝商业转载。




05/21/06 09:31:52,由 cathayan发表。 本文链接
  

转Utf8引来一堆乱码

cathayan.org版权所有,保留一切权利。转载请保留此说明。谢绝商业转载。

事情的起因是安装Debian的Vim7之后,直接启动Gvim出现错误一处,说menu.vim的487行不是正确的菜单项,看了一下,没发现什么毛病,同时发现用非GBK编码启动就没有这个错误,也有人提议转Unicode算了。于是我就转了。

转成Utf8之后,就是全面设成zh_CN.utf8,本来LC_CTYPE还保持zh_CN,但发现这样一来Xfce4-terminal和Gnome-terminal还是用zh_CN也就是GB2312的编码,比如直接显示date是乱码,在Gterm的菜单“终端”里面设编码的地方可以看到当前编码是GB2312。所以最后把Ctype也设成了utf8。这个问题解决了。

新问题是在term里用vim编码文件存盘退出后,Term乱码了。有没有vimrc都要乱掉,实在是受不了。见图1。问了一圈还是没有解决。同时用Konsole和rxvt-unicode就不会乱,所以本来用xfce4term的,现在也改用urxvt了。谁能提点建议?

早上本来想再切回gbk算了,切回去之后,发现Term里编码已经是gbk了,可message输出又乱了,明明它也是gbk编码,可就像还在用utf8一样全乱了。见图2。与此同时,运行gvim时所有菜单都显示成????,很典型的乱码,但同时又出现了gbk编码下那个菜单项目错误。实在搞不懂,只好又回到utf8,此时什么也没改,apt输出正常,gvim的菜单也不乱了。

当然现在也能工作,只是感觉是超级不爽。问题有两个:

1、gtk2的term怎么会在vim编辑之后彻底乱掉?乱掉后接受键盘输入,但不回显,同时输出也是一堆乱码。
2、有人提到可能某些X程序在以不同于系统Locale的方式在运行?会有这样的事吗?就像图2中的输出,所有Locale项目全是gbk了。现在用的是gdm,它自己也要设语言,但每次进去X之后我也都设了同系统一样的编码,在term上输出Locale已经全部正确。但确实像Gterm会只认LC_CTYPE而忽略LANG等项目一样,我现在也怀疑某些程序可能有自己的确定编码的方法,就像gterm里运行apt的结果,以及gvim菜单一样,问题是不知道怎么设定它们。哪位给点提示?

系统:Debian Sid,Xfce4,Gdm

05/21/06 09:01:08,由 cathayan发表。 本文链接
  

05/20/06

开源软件:谁付出谁获取

cathayan.org版权所有,保留一切权利。转载请保留此说明。谢绝商业转载。

这篇有关“谁付出谁获取”的文章副题叫:商业依赖于开源软件,但他们把编码工作留给了其他人。非常直白,文章内容也很充实,作者访问到了Firefox,Fedora,Subversion,PostgreSQL的开发人员,并有统计数据作为辅助,让我们可以明白到底是谁在写这些软件,以及他们是干什么的。

比如,为PostgreSQL贡献代码的是一位前教师,为Apache写程序的是个工程师,但只能在晚上和周末为写Apache的代码,Subversion的贡献者已经结婚并有孩子。

这篇文章指出,大公司是开源软件的消费者,但它们的贡献非常小。这和我们习惯听到的概念大不相同。像IBM,Sun,Redhat等公司确实在派人发钱写开源代码,但他们的付出相对于项目整体来说仍然是很小的。比如PostgreSQL有250个贡献者,有7个人拿钱,Subversion有200来个贡献者,有10人是拿工资的。其他的人都只是志愿性质的。

这篇文章还揭示了一个有趣的现象,即核心程序员一般是想出了概念,并实现了主要框架,而大量的贡献者会为它添砖加瓦,找错误,完善它。

这部分成员中的许多来自小公司,而不是大公司。也许是因为大公司制度严格,时间更少,也许是有制度上的限制。更奇怪的是,文章中提到其中有些人来自根本不像是科技公司的机构,比如Morgan Stanley;而像美国银行、高盛这样的公司也加入了OSDL。当然,还有许多人来自大学及政府机构。

这篇文章中没有提到在校学生的作用,它采访到的人都是有工作的,虽然他们的工作千差万别,但他们对开源软件有热情,也许是个爱好,也许是工作中有所涉及,也许是出于理想主义,想做一个商业软件的替代品。他们通常有收入,有家庭,这些都没有妨碍他们成为开源软件的贡献者。

关于参与的好处,一般是认为可以获得认可及名誉,至于赚大钱,就像“加入高中足球队就想像着得联盟冠军一样”机会十分小。

有些人是在学习的过程中加入,看代码、改代码,然后促进了自己的学习,并且对工作也有用。至于别人的看法,有些人认为他们很厉害,也有些根本不注意这些活动。通常公司里即便不干涉这种活动,也不会太支持。

以前总有人非常关心这些志愿开发者的生活问题,总要问:他们靠什么生活啊?现在我们有证据说,他们有自己的工作,有自己的收入来源,完全不必再为他们担心。就是这些几乎没有互相见过面的一些人,完成了许多非常好非常实用的软件,不管你是否相信人类的天生的合作精神,这些软件是个事实。

我以前想过开源软件开发者的可能的来源:大学生,挖到金矿的,互联网兴盛时赚了钱的,公司里工作有稳定收入的,祖传的不用工作的。现在看来像是那类工作有收入的人群是个稳定的团体,发大财的参与者似乎不多。

05/20/06 00:01:00,由 cathayan发表。 本文链接
  

05/19/06

GDM, utf-8, fcitx

cathayan.org版权所有,保留一切权利。转载请保留此说明。谢绝商业转载。

也不知什么时候变的,GDM缺省不读.xsession了。要想让它再读这个设置,必须编辑目录下的 .dmrc 文件:

[Desktop]
Session=xfce4
Language=zh_CN.GBK

内容就这么3行,指定了Session是Xfce4,语言是GBK,这里一设定,它就不读xsession了,想再设定locale什么的只好去/etc/X11/Xsession.d目录下了。真是麻烦。

必须把dmrc文件中的session=xfce4改为custom,它才会再读.xsession。而此时session将只会延续到这个.xsession运行结束,然后就会结束,退回到gdm界面,同时会出那种“这个过程只有10秒”那个错误。此时又需要在.xsession里的最后,加上exec startxfce4这个启动x窗口管理器的命令,才能让它不退出。

一个DM,居然要管这么多事,真是不学好。

为了把X换成UTF-8,居然学了这么多。现在的问题,是fcitx显示不正常,呼出正常,不能输入,按fcitx网页上的说明,只要设定LC_TYPE=zh_CN(实际上GB2312吧)就可以了,其他的LANG可以随便,设成英文都行,我按这个设了,还是不行。

05/19/06 22:20:09,由 cathayan发表。 本文链接
  

拇指原则

cathayan.org版权所有,保留一切权利。转载请保留此说明。谢绝商业转载。

Google最著名的Blogger,Matt Cutts总结的一些有关软件邮件开发等等的原则,很有趣,但谁能告诉我“Rules of thumb”是什么意思呢?

软件

让用户输入时,要求越宽越好。比如应该想到用户可能会在输入的前或后面加上空格;或者如果想要域名,也应该允许用户输入一个URL,然后从中提取域名。

输出带有日期的文件时,应该用YYYY-MM-DD,而不是其他时间,这样排列文件名时,就能按时间排了。(有点怪)
如果要报告Bug,应该给尽可能多的消息,让别人能重现错误。

如果有了Bug,应该先补好。然后问自己“怎么才能再不出这个Bug?”也许需要加点监控,也许要加强UI,也许代码里要多做检测。不要只是补好它。(好同志啊)

电子邮件

如果发邮件给多个人,不要用代词。“他稍后应能处理这个问题”对你很明白,但对别人来说,他、这个、稍后都很不明确。

如果想让人看一个小于10万行的文件,就放到一个网站上,然后发个URL给别人,这样他就能看到原始文件,或者直接在浏览器中查看。(最讨厌的是Word和PPT附件,幸亏Gmail可以直接查看)

如果发信给许多人要求做某事,不会有人回应;最好还是请某个人做某事。

如果在邮件中加了个链接,最好在发出前点一下看是否完好。(他没考虑到防火墙)

当你写下“此信也CC给某某”时,赶快加上CC的地址,否则别人看到这句话却发现没有CC就会觉得你很傻。(更傻的是说了见附件却没有加附件)

尽量让链接短点,这样就不会被邮件程序给折行或者砍掉了。(TinyURL很不错,Firefox能处理多行的URL也很不错)

杂项

在网上保守秘密是件困难的事。如果你正在做某种极牛B的没人见过的东西,去掉所有的参考项;你放出来的PowerPoint也要清理一下;处理子域名及URL的方法也要变一下;要记住的是,如果某个URL本意是要保持私秘,但如果所有人都可访问的话,总有人会偶然碰到它的;用.htaccess加个密码保护比较好。读者们会挖掘你的代码,监视你的robots.txt,研究你买了哪个域名,包括通过其他公司购买的。(这段强烈建议读原文,上面的链接很有趣)

当你做一些烂事的时候,比如清理猫屎的时候,最好闭上嘴巴。(有人说应该闭上鼻子,这样就不会闻到臭味了;当然了这位大侠不是在讨论猫屎问题了)

如果你要求100个人去做某事,只有25人会做,如果你用死亡或开除来威胁人家,会有60个人做。(这对那25个人很不公平啊)

如果你正在讨论某个你想要的东西,并且你又已经得到了批准,最好不要再说,还是走开的好。(世事难预料 :P )

05/19/06 10:43:21,由 cathayan发表。 本文链接
  

05/18/06

读书人的timeline

cathayan.org版权所有,保留一切权利。转载请保留此说明。谢绝商业转载。

发信人: cathayan (学习厚道), 信区: Reader
标 题: Re: [话题]读书人的timeline
发信站: 水木社区 (Wed May 17 17:03:27 2006), 站内

太有意思的话题了,那谁谁真是人才啊。

: 列出各个年龄的读书,
:
: 0-3岁:
听外婆讲故事。扒土堆,玩尿泥(eee...)等

: 3-7岁:
逢村里赶会时买一本小人书,印象中只有孙悟空和哪咤。

: 7-12岁(小学):
三国演义全套连环画。聊斋(简写的)。七剑下天山,冰川天女传等梁派武侠。
金庸的看了本射雕英雄传。十万个为什么(带语录的)。没有角的牛(曹文轩)。
飞碟探索。儿童文学(也就几本)。故事会。

: 12-18岁(中学):
红楼梦。钢铁是怎样炼成的。牛氓。基督山伯爵。三个火枪手。福尔摩斯。
我们爱科学。平凡的世界。看过一些 收获 十月等。一些古龙小说,七种
武器一类。

: 18-22(大学本科)
列·托尔斯泰,连青年少年那些都看了。白鹿原。废都。苏童格非莫言马××
等人的。红楼梦水浒西游三国重读。鲁迅伤逝离婚那些。沈从文。王小波。路遥中篇。
卢梭忏悔录爱弥尔。

: 22-25(后大学时代,研究生院)
王小波继续,变形记那种,菲茨杰拉德,挪威的森林,茨威格。孔子传。许多非小说的。。。。

--
※ 来源:·水木社区 http://newsmth.net·[FROM: 256.256.256.*]

05/18/06 08:49:45,由 cathayan发表。 本文链接
  

05/17/06

北京

cathayan.org版权所有,保留一切权利。转载请保留此说明。谢绝商业转载。

好不容易进城一趟,还赶在8点到9点之间,一路上,我至少听到5次周围的人说:北京要完了。因为地铁实在太挤,而且偏偏5月的大早上有沙尘(暴)。

今天的沙尘远没有达到“暴”的程度,但它足以让赶路的人心生恐惧。想想吧,车厢里挤得像照片,人都贴在窗玻璃上了,好不容易出来了想缓口气,吸到的还有百分之好几的灰尘和沙子;满头大汗的就更惨了。

回来的时间算是清闲时间,还有座。为什么这么多人都要冲着差不多一个方向走呢?可能和北京规划中住在某一片,工作又在某一片有关吧,像建国门及周边,中关村及周边都算是工作上班的地方,实在太集中了。有点想起我国古时对城市区域的划分,东市西市,剩下的都是坊,市是买卖的地方,坊是住人的地方,严格分开。想来那时要买东西也只是冲着两个方向去,不知有无交通问题。其实有宋一代,开封城就开放得多,有人想这么干,居民不愿意,皇上及其同事们居然也就算了,才有清明上河图那样的世俗首都景象可看。

05/17/06 16:11:44,由 cathayan发表。 本文链接
  

Java is back?

cathayan.org版权所有,保留一切权利。转载请保留此说明。谢绝商业转载。

今天有个大消息说Java要开源,不过只是个意思,源代码本来也有,就是不算开源,但Sun的想法显然是尽量保持Java的统一,但又希望有开发者能参与进来,所以它会选择一个什么样的协议是关键。毕竟Java最早是宣称一次编写,到处运行的,如果有了分支,显然会直接影响到这一点。我们可以等着看Sun的动作。

更好的消息是在Linux上面装Java不再有障碍了,Sun搞出个“Java发行协议”,从而可以让Linux合法地把Java执行程序包括在它们的发行之中。虽然还是Non-free,但确实是件大好事啊。想想以往在Debian上装个Java是多么地麻烦,为了保持dpkg系统的优雅,不得不用别人的包或是自己打deb包。从现在(昨天就有了?)起,可以apt-get install了,JDK和JRE都可以,具体的Debian包看这里Ubuntu的包也有。

似乎是同这一消息相配合(假想的:P),Google推出一个GWT,Google Web Toolkit,就是Google的服务的Java开发类库吧,把原来的web api变成了java api,确实是好东西啊,可能会让我去年看Java的行为物有所值了 :D

DWN上看来的消息说,apt这个软件升级了,升级后在更新软件包列表时将只更新变化的部分,也就是增量更新了,这样把原来4-5MB的下载量减到几十KB,很不错。

还是DWN推荐的,Instalinux网站,这个站可以供用户自己定义Linux安装包。支持Debian/ubuntu/rhel/fc等等,在网页上进行选择,然后自动打成一个ISO安装包供用户下载,安装时可以自动连到网上去下载并安装你选定的项目。有兴趣可以一试。

05/17/06 15:55:53,由 cathayan发表。 本文链接
  

05/16/06

Google Notebook推出

cathayan.org版权所有,保留一切权利。转载请保留此说明。谢绝商业转载。

上午还在用Sendpagebyemail的扩展,这个Notebook下午就推出来了,试用结果是不错的,确实称得上网络笔记本了。

首先要安装扩展,支持Firefox1.5及IE 6,Linux也可以用。装完扩展,右下角会出现OpenNotebook的功能,点出是一个小窗口,可以自己写;也可以在网页上选中文字后右键,选Note This。同Gmail的编辑一样,网页上能选中的都可以收录进来,包括图片和链接。但似乎少一个“Note this page”的功能。

Notebook主页面上可以整多个笔记本,一个笔记本可以打上Section header,然后再加内容时就出现在这个section下面了。

现在每一个搜索结果的后面也会有Note this的链接,点击也可以直接加入,不过并不包括该网页的内容,而只是搜索结果显示的那些,相当于是一个bookmark的功能。

05/16/06 14:31:53,由 cathayan发表。 本文链接
  

推荐Firefox扩展--SendPagebyEmail

cathayan.org版权所有,保留一切权利。转载请保留此说明。谢绝商业转载。

有了Gmail没多久,就产生过这个想法,就是看到有价值的网页就当成Email发回到信箱里。IE可以用邮件客户端来发送,但似乎只能是Outlook,Thunderbird就收不到页面内容;也有通过网上的Sendmail来发送的程序存在;也有直接调用Gmail的发邮件链接的,但Gmail一变就不行了;Fx自身只能发送链接。

现在这个SendPagebyEmail扩展,基本上解决了这些问题,它可以把页面内容或选定文字发送到指定邮箱。它使用第三方的Sendemail程序,同时要用一个现成的smtp服务器,但还不支持gmail那样的ssl的smtp。可以转换编码,如gb2312到utf-8,但邮件本身编码尚不完整。但用起来是没有问题的,在页面或选定文字上右键就行了。

这个扩展非常小,运行也很快,不过目前还没有Linux版。不知道Mozilla里面有无Thunderbird的sendemail类组件,从而可以在Fx内部直接构造一个发送程序,就可以省去第三方sendmail了。不过据说Google很快要出Notebook了。

还有个Firefox的事,说是发现了Firefox的Bug,会搞死机器。其实不算严重,是在页面上用Javascript写img标签,src的内容写mailto,循环执行100次,Fx就会打开100个缩写信件的客户端窗口,前提是系统有缺省的邮件客户端。img的src内容写成mailto似乎是个错误,但浏览器好像都不检查这个,而是直接执行。奇怪的是在Win2k上IE6只弹出一个邮件窗口,这算是强悍还是执行错误?其实如果装了Noscript扩展的话,根本不用担心;更其实就让它打开100个Thunderbird窗口,也不过占了140MB内存,机器并没有死。当然,如果是写10000次,只怕是活不下来了。所以,这里也推荐Noscript这个扩展,它可以选择执行或不执行网页上的Javascript代码,对付国内站点也是很不错的。

05/16/06 10:43:57,由 cathayan发表。 本文链接
  

05/15/06

为什么信任Google?

cathayan.org版权所有,保留一切权利。转载请保留此说明。谢绝商业转载。

这题目太过巨大,不过这几天好几个站上都讨论这个问题,不免也勾起了我的兴趣。毫无疑问,我是属于信任那一派的。

通常的不信任存在于这几点:Google知道你搜什么词,Google知道你搜了之后访问了什么网站,Gmail里存着许多个人的邮件,Gmail会扫描这些邮件并加上广告。总之就是Google知道你的上网动作并利用这些动作投放了相关的广告。

但正如那些站点的评论所指出的那样,实际上能干这些事的人或机构非常多,你的ISP,你的单位,你的其他的Webmail提供商,甚至一个可能的监听你局域网或无线网的网管或黑客。他们中的任何一个人都可以在你毫不知情的情况下看到你的任何网上活动,如果你没有采取措施的话。前些天那个MSN吃米粉的故事大家应该还记得吧,在这一点上,个人或小机构要比Google值得担心得多。

我在单位的Email就处于这种状况,我发现这一点是因为有一天突然收到一封信说对不起,下面这封信删错了,再转发给你 :P

为什么这些数据在Google那里反而更安全呢?我可以想到的就是这是Google目前为止99%的业务的基础,没有这个基础,它的业务就不能进行下去。在这种情况下,只要发生一件这些信息被不当使用的例子,它的业务就会遭受巨大的损失,任何理性的人都不会去冒这个险。我相信Google在这一点上应该有着最严厉的管理制度。

更何况,实际上它没有必要去冒这个险,有哪位的个人隐私数据重要到让Google去利用呢?对Google而言,最有价值的部分都是一些默默无闻的普通人,只在统计学意义上对搜索产生效果,而不是个人。比如你的邮件里提倒了度假,也许边上会出现一些马尔代夫的广告,对你而言这是独特的;但对Google来说,只有这个广告投放了多少次,是哪个关键词引起投放,以及多大比例的人点击了这个广告有意义,还有就是这些人中间有多大比例的男性、女性,来自哪个国家哪个城市等等,就像Google Trends一样。这些数据也只有这些数据是有价值的。

前一段Google人士回答另一个问题的答案也值得借鉴,那个问题是Google是否会手工调整搜索结果。答案是不可能,因为Google算法中用超过200个变量来描述结果,而现在它的数据库中的结果怎么着也超过了80亿,在这个规模上手工调整某个结果是不可能的事。另一个数字也可辅证这一点,那就是每一次搜索时,参与运算的电脑都超过1000台,我们可以了解到其中的复杂性。

最功利的思路是这样的,如果统计效果已经能带来每年数十亿美元的生意,它还有兴趣和时间去利用每个私人数据吗?

另一个担心也许更实在些,那就是谁还能接触到这些数据。其一就是政府;美国政府显然是最可能的,它还借911之名快速通过了一个爱国法,里面的条款很强硬。前一段他们要一些非法内容的搜索数据做为某个法案的证据,Google打了官司,然后得到了基本胜利的结果。这个问题更加复杂,涉及到法律及政府信任的问题,不谈也罢。当然,最重要的是你会因为什么的网络活动而被抓的问题,是因为你说了什么话还是制造原子弹,是因为在家里看黄碟还是因为赞助了T,这中间的区别实在太大了。

其二还有黑客。Google的数据中心会被黑吗?硬盘会被偷吗?这一点上,普通人除了相信Google的高智商人士之外,并没有更好的办法。

最根本的一点,在网上正如在社会中一样,是需要有一定程度的基本信任的。正如走在大街上突然过来一人问:你哪地方来的?你会什么反应?所以我很讨厌在IM上一加好友就开始查户口,这在我的信任范围之外。与之相反,如果和朋友坐在饭馆里,他又介绍我认识另外的人,那我自然会报上我的数据了。除此之外,大可不必凡事都写真的,尤其是电话、手机、住址、生日以及关键的邮箱。当然国家民族城市无所谓了。这一点应该对任何网上服务都适用。

05/15/06 10:54:57,由 cathayan发表。 本文链接
  

05/13/06

中国图景

cathayan.org版权所有,保留一切权利。转载请保留此说明。谢绝商业转载。

商业成功人士总爱自称“最懂中国”,说这是他们成功的根本,这说法很不严密,因为一个来中国转上一圈的人也一样敢于预测50年后的中国。

Blog中文翻译的这篇文章就是这种情况,他们一家来中国转了一圈,很不幸地他碰上了五·一前后的沙尘暴,碰上到处是人的场景,碰上了难吃的中餐,并且不知道在城市里到哪里去找西餐。并且我觉得他的说法很可疑,350美元一晚的喜来登会那么差?没经验啊。

正如贴出这些内容的那位讲的,他读了许多有关中国的媒体报道,这他这位朋友的旅行经历大不相同。我想起码应该把这两部分结合起来才算是相对正确的。

前几天看电视上批判一个非法传销的案子,里面一位头目讲大头目们为了让被骗来的人相信他们的成功,就是开名车,穿名牌,带戒指和项链。名车自然是奔驰宝马,戒指和项链自然是大大粗粗的黄色的,这个我能想像;最不习惯是这个穿,他们穿的是报喜鸟,好像是浙江的牌子,经常在央视上做广告的。我本以为他们要穿阿玛尼的,看来还是不懂中国啊。

记得早有人说过,在中国呆几天,可以写几篇文章;呆一年,可以写本书;呆个3、5年,也还是写几篇文章;呆到10年以上,想写关于中国的小文章也会觉得力不从心,所以还是不写了吧。

这个故事告诉我们,来中国旅游一定要看沙尘暴预报,还要住在外国人聚居的地方,奔驰宝马的公关做得不错,而阿玛尼的公关还有相当的增长空间啊。

[update]第3篇也出来了,作者果然改变了一些观点。

另外,BBS有人转了一篇文章,非常有趣,有关“老外: 在清华教政治 西方朋友都觉得我简直疯了”。

05/13/06 15:02:34,由 cathayan发表。 本文链接
  

05/12/06

上海交大处理“汉芯”造假事件

cathayan.org版权所有,保留一切权利。转载请保留此说明。谢绝商业转载。

上海交大已经在网站上发布了关于此事的调查结论及处理意见,详见上交大网页。里面说明了各号汉芯的实际情况,给了行政处理。

不过我觉得这事实在是个刑事案,诈骗罪,即便要为受害者一方的教育、科技、发改委三方不出面,检察机关也应该主动介入了。

05/12/06 16:09:10,由 cathayan发表。 本文链接
  

Trends游戏

cathayan.org版权所有,保留一切权利。转载请保留此说明。谢绝商业转载。

以前就有人用搜索引擎玩这个游戏,以搜索结果的多少来比较,这样反映了一定的流行度;而Google Trends这个最新放出来的工具就能反映一个项目真正的流行趋势,也就是上网的人们对它的关注程度了。

搜一个词直接放进去就可以,要搞PK的话就在词中间加个“,” :

Linux, Windows,Win胜
debian,redhat,fedora core,suse,ubuntu,本来是Debian胜,可2006之后,居然是Ubuntu出来了
新浪,搜狐,163,雅虎,百度,QQ,百度高高在上
百度,google,百度赢
Firefox,IE,Firefox胜出
Beijing,shanghai,Shanghai胜,除了北京一地外
北京,上海,还是上海胜出,但地域性表现更强
blog,rss,Blog关注度十分强劲,RSS还不温不火
拿China和几个国家比,总体总是胜出,但在新闻上从2005年低于印度,说明这帮国际媒体还是偏爱印度些。


05/12/06 10:26:03,由 cathayan发表。 本文链接
  

05/11/06

Google Trends, Desktop 4, Notebook and Co-op

cathayan.org版权所有,保留一切权利。转载请保留此说明。谢绝商业转载。

这是昨天Google新闻日上发布的4款新产品:

Trends:看一下某些东西在Google的搜索情况,主图是搜索流量,右边是有关的新闻,下方分区分语言,搜一下Blog这个词,分区显示的结果相当惊人:P

Desktop 4:就是增加了一些东西,变得漂亮些了,Calendar也可集成上去,在索引中已经删除的文件也会自动消失。

Notebook:强烈期待的东西,据说是个类似Gtalk那样的窗口,可以把网页上看到的东西直接拖进去,然后就保存在Google的服务器上了,再然后就可以同大家共享。有点类似Firefox的Scrapbook的功能,但不必存在本地机上,而是上网就能用。

Co-op:这个就是用户主动给网站打标签的初步应用了。角色分为两类,一个是用户,一个是贡献者。贡献者提交对网站的说明,链接和标签(有专门的格式),这些东西会列在不同的目录下,用户则可以订阅这个内容,订阅后一旦搜索了相关词汇,这个网站就会列出来。估计最积极的应该是商业性质的吧,现在新闻下面就列着个Digg。

05/11/06 09:51:22,由 cathayan发表。 本文链接
  

塑料草根

cathayan.org版权所有,保留一切权利。转载请保留此说明。谢绝商业转载。

再次证明Slashdot的留言更有趣,在这个贴子的留言中有人写了这么一句:

So she's a professional astroturfer [wikipedia.org] as well as an informant.

最后那个词是告密者,不是什么好意思;中间那个指明要求维基进行解释的词不认识,于是费尽千辛万苦我过去看了一下,果然十分有趣。

Astroturf,原来是米国的一个牌子,产品是人造草皮,就是塑料做成绿草的样子,铺在某些地方应个景或是充当真草皮用的;同时针对普通大众,他们又有个词叫草根;草根的意见在他们那里是相当重要的,但在政治或商业活动中却有人伪装起来冒充草根们的意见来影响社会舆论;这些伪装的草根就被称为Astroturfer,这种行为就称为astroturfing,就是塑料草根的意思。

制作塑料草根的主要方法就是请一批人来,呆在一间放满电话、传真、电脑、纸、剪刀和浆糊的房间里,打电话、发传真、制作各种信件、发送Email,参与各种社区论坛的讨论,目标通常有报纸编辑、公众网站、blog,互相发贴和引用等等。他们把自己伪装成来自各个地方的具有不同身份的人,以形成一种公众关注的虚假氛围。当然,他们说的话,发的信件和贴子无一不是经过指导的作品,有着明确的指向和诉求。

制作塑料草根的经典老手包括希特勒和尼可松,但最有趣的可能是微软,维基上面讲2001年,LATIMES报道微软搞了这种活动,他们收到成百上千封相似的信件,都是表达一位公民对美国司法部不满的──当时,微软正同DOJ打垄断官司。这些信件本来是寄给一些人,由于没有寄到就又寄给这个报纸,再寄的时候却没有改正,于是被抓了现行。

上面那位同学可能目标不止一个,也许每天的任务都不一样,其水平和层次肯定是要高于微软合同工的,一般也不会被抓现行。并且,他们经常在讨论出现激烈化倾向的时候出现,经常能挽狂澜于既倒,疏通了想法,和谐了社会。从目的上讲,除去有和老美政客们一样的诉求外,她们还担负着保持社会稳定、为广大人民指引正确的发展方向的伟大使命,这也使这一活动更具有正当性,也更容易吸引mm们参与。

再来学个词,叫Sock Puppet,直译祙子玩偶,就是套在手上扮另一个人物的道具,老美儿童剧里常见的东西。意译则是我们很熟悉的一个词,叫马甲,专指网络论坛中的第2-n个身份。以前曾有朋友告诉我,他一人可以在BBS上整出10大话题,其马甲更是包括了春夏秋冬梅兰竹菊天文地理名人偶像等多个系列不下数十个。马甲在形成意见时的运作也相当讲究,有的演白脸,有的演红脸,有的演专家,有的演小人,一个人一台电脑就能演上一出戏,还能让看客和不明就里的票友们看得热血沸腾,直呼过瘾,那才是一个马甲好手啊。

05/11/06 00:02:00,由 cathayan发表。 本文链接
  

05/10/06

Debian Etch 发布日程确定

cathayan.org版权所有,保留一切权利。转载请保留此说明。谢绝商业转载。

来自Debian发行小组邮件,下一个Debian发行版,Etch的发行日程如下:

N-117 = 06年7月30日:freeze essential toolchain, kernels
N-110 = 06年8月7日:freeze base, non-essential toolchain (including e.g. cdbs)
N-105 = 06年8月14日:d-i RC [directly after base freeze]
N-45 = 06年10月18日:general freeze [about 2 months after base freeze, d-i RC]
N = 06年12月4日:release [1.5 months for the general freeze]

05/10/06 12:05:00,由 cathayan发表。 本文链接
  

在Debian下编译Vim 7.0

cathayan.org版权所有,保留一切权利。转载请保留此说明。谢绝商业转载。

Vim 7正式推出后,先是在Win2k下面用官方exe安装版尝了鲜,实在经不住诱惑,决定在Debian下也编一把,虽然估计一周之内sid应该能有。

编译需要的包有:

下载的Vim 7包及其语言文件包:vim-7.0-lang.tar.gz vim-7.0.tar.bz2

gcc, libc6-dev, linux-kernel-headers, gawk, sed, ncurses*, libncurses5-dev, libgtk2.0-dev, libx11-dev, x-dev, libsm-dev, xorg-dev.

如果GUI采用gnome2,可能需要装libgnome-dev,它应该会自动安装上面一些包。装gtk和X相关开发包是为了使用Vim的Gui版,有些特性只有gvim才有。

修改编译选项应该可以通过修改src/下的Makefile进行,改好后make config一下;不过smth之vim版主推荐这个方式:
./configure --with-features=huge \
--enable-cscope \
--enable-multibyte \
--enable-xim \
--enable-fontset \
--enable-gui=gnome2
就是加huge特性,加cscope,多字节支持,xim输入法等。config时如果前面进行过,会在src/auto/config.cache中保留,再次配置时应该删除这个文件。

加上gui支持之后,编译时间比没有gui的要长一倍,不过没什么错误。

缺省安装目录在/usr/local,一般不用动。debian的PATH变量中local还在/usr/bin前面,所以也不用改,再敲命令vim出来的就是vim 7.0了:

:version
VIM - Vi IMproved 7.0 (2006 May 7, compiled May 9 2006 23:15:24)
编译者 qi@cathayan.org
巨型版本 带 GTK2 图形界面。

05/10/06 00:01:00,由 cathayan发表。 本文链接
  

05/09/06

搜索树

cathayan.org版权所有,保留一切权利。转载请保留此说明。谢绝商业转载。

demo@virushuo发掘的这个页面,这位大侠搞了2^31-1个节点的BST网站,专门来记录搜索引擎的爬虫的行为,具体的研究就不看了,这里来点有点艺术感的东西欣赏一下,每条线都代表一个节点,爬虫抓取这些节点的次数决定线的长短,这些图经过了修改,否则根会非常长。

Yahoo:
yahoo slurp
Google:
google bot
MSN:
msn bot

05/09/06 12:14:01,由 cathayan发表。 本文链接
  

郇山隐修会和天主事工会

cathayan.org版权所有,保留一切权利。转载请保留此说明。谢绝商业转载。

这是两个出现在《达芬奇密码》一书中的两个神秘组织,前者据说有上千年历史,有包括牛顿、达芬奇和雨果在内的多位大师为领袖;后者据说力量无比强大,甚至在曼哈顿还有一座17层的大楼。

看到本4月某期的Time周刊,封面居然讲这个Opus Dei,这个词当然不认识,查了一下,居然是天主事工会,一下子又勾起对这个神秘组织的兴趣。这个西文词组是拉丁文,意思是天主之事,是真正的天主教团体,受罗马教皇的认可,其创始人前两年刚被封为圣人。

这个团体创立于1928年的马德里,追求在日常工作生活中成为圣徒,也就是不必入教,甚至不必真正加入这个团体。当然这个团体在全球范围内有85000来真正的会员,美国有3000来人(Time),在纽约有一座刚建成没几年的大楼。入会后有相当严格的戒律,比如禁欲,男女分开,苦修(在大腿上绑一个满是尖刺的苦修带,每天2小时),也有说法说他们死后要把财产捐给这个会。同时会员要求保持隐秘状态。它的发展对象是高层次人士,像大学生等,因此据说在某些上层有极大的影响力。

郇山隐修会是书中提到另一个神秘组织,书中说他们有关于基督教起源的另外的说法,而天主事工会则是罗马的支持者,这就是他们之间的冲突。该会英文名Priory of Zion,所以又叫锡安会(看过黑客帝国后应该对Zion有点印象,耶路撒冷的一个地方),于是又同几百年前的圣殿骑士团拉上了关系。实际上,历史上找不到任何这个组织的记录,而法国那里倒有这个组织的档案,它成立于1956年,目前已经没有什么活动,在它短暂的历史上也没有什么惊人之举。

神秘的东西,了解一下 :P

05/09/06 09:46:43,由 cathayan发表。 本文链接
  

05/08/06

Vim 7正式发布!

cathayan.org版权所有,保留一切权利。转载请保留此说明。谢绝商业转载。

Vim 7.0版正式发布了!这是自Vim6以来的最重大的一次更新,在功能上有极大的增强,强烈建议现在就升级:*nix可以自己编译,PC用户可以直接下载编译好的版本。

增强亮点有:
  • 标签页,:tabnew开新标签,gt在标签间切换;:tabdo命令可以在所有打开的标签页上执行命令。
  • 拼写检查,:set spell/nospell打开和关闭,]s到下一个错误,[s到上一个错误,z=显示所有正确的拼写推荐,敲入序号即可改正。
  • 代码补全,敲代码时如果有支持,Ctrl-x Ctrl-o即可列出可能的选项,然后按屏幕下面的快捷键选择即可。
  • 回退操作,不但可以一步步回退,还可以直接退回到几个小时前。

其他的可以看下面的新特性列表:
NEW FEATURES
  • Vim script enhancements
  • Spell checking
  • Omni completion
  • MzScheme interface
  • Printing multi-byte text
  • Tab pages
  • Undo branches
  • Extended Unicode support
  • More highlighting
  • Translated manual pages
  • Internal grep
  • Scroll back in messages
  • Cursor past end of the line
  • POSIX compatibility
  • Debugger support
  • Remote file explorer
  • Define an operator
  • Mapping to an expression
  • Visual and Select mode mappings
  • Location list
  • Various new items

05/08/06 11:16:03,由 cathayan发表。 本文链接
  

还是盗版

cathayan.org版权所有,保留一切权利。转载请保留此说明。谢绝商业转载。

在对盗版的反对声音中,以及在不太响亮的反驳的声音中,有着一个逻辑,就是说人家定那个价是人家的自由,你买不起就不要用好了。这是极端错误的,它不适用于版权。

人类社会中的任何一种活动,如果不能增进社会的福利,那这个社会绝不会容忍它,不论明招还是暗箭也一定要废了它。版权制度的初衷,是为了促进知识创新,从而便也有利于增进社会福利;它绝不是为了一种生意,为了赚钱而设立的。

现在好像都说中国人有钱了,可以满世界跑,可以去探险了,这种状况也许让事情有些变化,但至少在B.G.骂中国人是小偷的时候,2000块一套的Win98是不太买得起的,我觉得买这种东西也很难增进我国社会的福利;但10块钱一套就可以。

李敖在《美国是盗版祖师爷》一文中说:

你动辄要我钱,我讲过,我以台湾为例子我讲过,美国的收入跟台湾是四比一,所以你收入四块钱的时候,你可能买到有钱买这个书,我收入一块钱的时候,这个书对我就太贵了,我就买不起了,那买不起我就不念吗?我就不研究吗?我就坐等我的文化退步吗?我也不肯啊!我希望能够力争上游,像你们美国人当年跟英国比赛一样。你们追到英国,你们用什么方法追到英国呢?用盗印的方法,用偷偷摸摸做小偷的方法来追到了英国。今天你向我们要钱,我们没有钱,或者钱不够,或者钱不甘心给你,我们也要用你们的方法去力争上游啊,去后来居上啊,去并驾齐驱啊。为什么我们要付钱?老子们就是不付钱,这就是我们的道德标准,我们的道德标准跟它的是不一样的。可是我们讲,我们也是持之有故,言之成理,不是吗?为什么你们当年在我们国家是强盗,今天我们做了民族主义的小偷,偷一点回来,你鬼叫什么东西啊!这就是我的李敖的这个标准。

这就是文化产业的特质,它就是不同用金钱来衡量,不能用“买不起就不要用”这种混蛋逻辑来解释的特质。在李敖引用的爱默生的信中,他其实还说,现在一个先令要换30个美分,到我们这里就买不起了,情况同我们现在收入不如美国远甚,而汇率又是1:8的情况简直一模一样。

话说回来,我是坚决支持版权制度的,但它必须依据一个社会的发展程度来实施,而文化强国有义务在知识输出上帮助弱国,而文化上的弱国更有权利使用一切可以得到的知识来发展自己,一点都不必不好意思。当然凡事有个度,这样不认真实施版权制度的结果也可能造成本国创新动力不足,这是一个要权衡的问题。

05/08/06 00:18:00,由 cathayan发表。 本文链接
  

05/07/06

Google语义网

cathayan.org版权所有,保留一切权利。转载请保留此说明。谢绝商业转载。

前些天我写过一篇打Tag的文章,当时写的时候就想,没准Google那邦聪明家伙已经在做这个了。这不,猜Google只怕慢,不怕快,他们确实已经在做了。下面是两个别人的发现:

一是Type的应用,在Google搜索框里输入“type tiger”,搜索结果的第一项是:

Tiger — Type: Animal
According to http://www.pubquizhelp.34sp.com/animals/adject.html

这里根据这个网页指出Tiger是一种动物,但目前没有依据这一点做更多的工作,因为给每一个网页打Tag不是个小活。其他还有“type china”这类针对国名的。如果这能进入实用的话,就很容易进一步限定搜索结果了,比如输入Apple是找水果还是找电脑等等。

二是more的应用,在传说要推出的Google健康网站上有人见到了,目前的例子是搜索“Tired”,结果中会出现:

Treatment Research papers From medical establishment
Symptoms News Alternative medicine

这样就可以进一步限制搜索结果,让搜索更快捷准确,据说之所以能推出这个功能,是因为有组织做了这个工作,给一些网页打上了标签。而这张图上的显示分类更多,那显然给网站打标签就得更详细些。

我记得有位Blogger曾经设想过今后Google的应用图景:进入一家商店买葡萄酒,一看想要的那种要50美元一瓶,很不甘心,就掏出手机或PDA之类,上Google,给出邮编和酒名,Google直接告诉他在他附近另一个商店中这种酒只卖35美元。结果可想而知,商店几乎要限制在让内使用手机了。要做到这么准确的搜索,只怕以上这些语义的工作是必需的。

05/07/06 22:23:41,由 cathayan发表。 本文链接
  

05/05/06

5月5日杀档事件

cathayan.org版权所有,保留一切权利。转载请保留此说明。谢绝商业转载。

在我国人民欢度五·一黄金周,满世界撒钞票的日子里,在沙尘暴终于远去,我们可领略大好春光的日子里,水木著名ID之一k.g*b被杀档了。至发稿时止,讨论仍在进行。

据称,此人一贯在水木灌水,经常掀起小小的浪花;而最近,此人发表的一篇Blog文章终于被神勇的版面巡查人员拿获,控以危害公共安全,终于一举拿下。

多位记者的追问“是否只是因为那个文章”,一位站内元老承认“不是”;在谈及后果时,该元老又说,是一个“两败俱伤”的结果。

05/05/06 22:23:34,由 cathayan发表。 本文链接
  

05/02/06

Debian Unstable暂时不要升级gdm(20060502)

cathayan.org版权所有,保留一切权利。转载请保留此说明。谢绝商业转载。

今天全面升级,从xorg 6.9到7.0,还装了许多gnome 2.14的包,都没有问题,只是gdm起来之后不能进入gnome/kde/xfce4,三个桌面环境全部不行,报错是: Your session only lasted less than 10 seconds. 给出的疑问有安装错,硬盘空间满等。详细信息中有:某进程正在以setuid/gid方式运行gtk/kde,这是不允许的,所以gtk/kde不能初始化。

Google了一下,看到有人报告了GDM的Bug,到下午时已经有人给出了Patch。不过我已经退回老版gdm(gdm_2.14.4-1--gdm_2.13.0.10-2),也解决了问题。看来这个显示管理器还要影响到窗口过程的运行。

05/02/06 21:05:39,由 cathayan发表。 本文链接