Blog on 27th Floor
主页 随便 电脑 电影 社会 阅读 下载 本站 存档
主页 随便 电脑 电影 社会 阅读 下载 本站 存档

05/30/06

AI以及终极搜索

cathayan.org版权所有,保留一切权利。转载请保留此说明。谢绝商业转载。
终极搜索,是Google创始人经常被报道的一句话,他们(或其中某一人)认为现在的搜索引擎还有极大的进步空间,而Google的目标就是终极搜索,起码要达到问什么问题都有答案的境界吧。

如果没有问题,是不是要达到没有问题创造问题也要问的境界呢?那就是人工智能了,估计他们很有可能考虑了这个问题。比如这个贴子就说,Google确实雇用了一些AI方面的专家。比如他们搜索质量方面的指导就是一位,而大量数据的搜索也算是AI的一个重要方面。

AI这东西,虽然我对CS所知甚少,但也听到过说这东西没前途,或者一直没有进展,多少年了,也还是那么点东西,在CS领域内似乎地位也不高了等等。通常说起AI的时候,大家都认为如果计算机足够快,就有希望,这个贴子也举了很多例子,比如到2018年,地球上所有计算机的计算能力将可以等于一个人脑;像蓝色基因这样的大系统,有可能在下一个10年就达到这个水平(前面说的是PC?);还有人预测到2019年一台1000美元的笔记本就有一个人脑的计算力。

可是这种计算力有什么用呢?如果他们还只是用来统计、模仿、按指定规则办事的话。正如作者说的,这不是AI,而是IA,也就是智力放大器。它们算得再快,也只能增强人已有的智力,扩展它的范围和深度,而不能发展出新的智力。

这其间必有一个大大的障碍没有突破,甚至看不到突破的可能,因为对人的意识的研究还很初步,更谈不到如何去创造一种意识。也许这是老天才能做的事?

阿西莫夫的作品中,他大量地写到机器人,它们都已经比人还聪明,高级的已经能调整人的意识,但它们仍然缺乏人的直觉。当然它们已经先进得大大超过我们现在的理性思考了。它们的秘诀在于一种线圈(不知道记得对不对了),一种模拟线路,状态不定,其中的电流有很强的自我创新的能力,这就是它们的意识的来源了。当然,最初这个线圈也是某科学家无意中的发现。在这没有重大科学突破的时代里(炸药奖年年发,就是记不住),不如期待一下阿西莫夫的机器人吧 :P

05/30/06 09:01:30,由 cathayan发表。 本文链接

05/29/06

曾德昭《大中国志》

cathayan.org版权所有,保留一切权利。转载请保留此说明。谢绝商业转载。
看到篇名为华夷之辨的文章,里面讲了这个葡萄牙人曾德昭和他写的《大中国志》,下面是书中的一些话,我读了也很惊奇,尤其是倒数第2段。现在我们都不敢称赞许多东西。

曾德昭是耶稣会士,1613年到达中国南京,1636年返回欧洲,在旅途上完成了《大中国志》。

“我曾在流往杭州的南京河的一个港湾停留8天,……,一个砂漏时辰过去,仅仅数数往上航行的船,就有三百艘。那么多的船都满载货物,便利旅客,简直是奇迹。船只都有顶篷,保持清洁。有的船饰以图画,看来是作为游乐之用的,不是运货的”

“所有的省都不乏长寿和愉快的人,可以看见许多精力旺盛和健壮的老人”

“他们的住房因设计良好而便于住宿,整洁舒适”“他们种植许多蔬菜,供百姓常年食用”“他们在各地,即使小村镇,都有充足的肉食,全年最常食用的是猪肉,牛肉去骨售卖,他们的鹿肉很少,也不怎么爱吃它”

“中国人特别喜欢花,他们有非常美丽,但不同于我们的花。我们有的,他们也有。有一种没有甚么味道的丁香紫罗兰。他们极力在园子里种植全年各个季节的花,在园里,它们看来很希奇。”

“中国人是如此之多,我在那里生活了22年,离开时和刚到时一样,拥挤的人群令人惊叹。情况确是这样,决非夸张,不仅城镇及公共场所(有的地方,如不用力推攘就不能通行),甚至在大道上,也汇集了大群的人,很象欧洲通常过大节或群众集会,如果我们查看总户籍簿,其中只登录纳税人口,而不记载妇女儿童、太监、文武教师(人数几乎无穷),共有5805万5180人人(引者注:明末中国人口至少在两亿以上,应该接近三亿。这也可以和曾德昭这里的记载相印证,5千多万的人口不包括女性,不包括儿童,也不包括文官阶层,应该还不包括一大部分的流民和商人阶层,所以接近三亿应该是保守的估计)”

“这个国家的财富值得称羡,从上述可以看出,除盛产各种谷物以及一切生活所需东西以外,他们还把所有东方最好最贵重的商品售卖给外国人。”

“中国大部分最好的商品都由此处(引者注:这里指的是广州)运往各地,因为它是中国最开放和自由的交易地点。且不说6个邻国的土著和异邦人运走的各种货物,仅葡萄牙运往印度、日本和马尼拉的货物,每年约有5300箱各类丝绸,每箱装有100匹真丝,天鹅绒花缎和缎子、轻料如半花缎、彩色单层线段,还有250块金子,及每块重12盎司的2200块金锭,此外的货物还有瓷盘,镀金器皿,糖,中国木,大黄,麝香,……即使长篇开列也不能尽举其名”

“(福建省)这个省滨海,是中国输出大量商品又一个优良港口,当地的勤劳百姓,把货物运往马尼拉、日本等地区”

“在海关……有更多的方便。没有堆放、过磅和检查货物的房间,也不需从船上取出货物,只察看一下并根据商人的簿册,征收一笔适当的税。若旅客不是商人,即使他一人带着奴仆,载运五、六口箱子以及许多其他物品,他从一地赴另一地时,一般都把东西留在船上,并不打开检查,更不付税。这对欧洲的海关和税务所是一个好榜样,欧洲的穷旅客遭到凶狠野蛮的劫掠搜夺,随身携带的所有东西还抵不上向他索取的税”

“(浙江)论富庶它超过许多其他省,可以称作中国商品潮流的最佳源头。它的特产是丝绸,无论生丝还是成品,也不管是茧还是原料,都运往各地。总之,中国输出的丝绸,都产自该省”

“南方九省的最后一省是南京,……是中国最好的省份之一,也是全国的精华。……其西部地区最富庶,盛产棉纱,……仅在常州城(Xanuchi)城及附属广大地区,就有20万台织布机。……由于织布机小巧,一间屋子内常常安放许多台,差不多所有的妇女都从事这种行业”

“南京城……我认为它是全国最大最好的城市,优良的建筑,宽大的街道,风度优雅的百姓,以及丰富优良的种种物品。它有令人惊羡的游乐场所,境内人口众多,……各处能遇到拥挤的人群,街道难以通行。此外,无数的宫殿、庙宇、楼塔以及桥梁,使城市显得非常壮丽。”

“中国人天生好经商,不仅从一省到另一省做买卖,获得大利,甚至也在同一城市做生意。商店里有的东西,街上几乎都有售卖。……富有的商人信用良好,很守时(葡人多年的经验证明了这点)”

“中国人温良多礼,喜交谈,因此,在这点上,我们那些仅住在澳门和广州的人是不相信的,因为他们在那里可以说是处于不断的战争状态,起因是葡萄牙人的奴仆和中国人之间每天都发生矛盾冲突。……但在中国其他省份和内地,如我们所述,他们恭敬有礼的和我们交谈,所有集会上都把我们当作上宾,不为别的,只因我们是异邦人,因此他们称我们是来自远方国土的客人,有所需要时,他们从不拒绝借给我们所需求的东西,即使价值超过我们给他们的抵押,也不要利息”

“中国人爽快的赞颂邻国的任何德行,勇敢的自承不如,而其他国家的人,除了自己国家的东西以外,不喜欢别的东西。中国人看见来自欧洲的产品,即使并不精巧,仍然发出一声赞叹。……这种谦逊态度真值得称羡,特别表现在一个才能超越他人的民族上,对于那些有眼无珠、故意贬低所见东西的人物,这是一个羞辱。”

“他们最喜欢的欧洲工艺品是我们的钟,但现在他们已生产很好的桌钟,并能生产类似的小钟,价钱和我们的相当,他们生产的某些东西,如在我们这儿生产,价钱会十分昂贵”

05/29/06 14:32:11,由 cathayan发表。 本文链接

05/27/06

JPEG专利要失效,Web2.0被注册

cathayan.org版权所有,保留一切权利。转载请保留此说明。谢绝商业转载。
米国有个Public Patent Foundation,向US专利局提出一个审查,并出示了一些先例证据,证明JPEG这种格式不能再成为专利,US专利局日前认可这一证据,声明Forgent Networks宣称的JPEG专利无效。好消息,据说Forgent再翻盘的机会不大了。

同时,O'Reilly把Web2.0这个说法给注册成商标了,以后要用这个词,还得它同意才行。也算是好消息吧,以后没人拿这个无聊名词聒噪了。

05/27/06 21:10:31,由 cathayan发表。 本文链接

Déjà vu

cathayan.org版权所有,保留一切权利。转载请保留此说明。谢绝商业转载。
这是法语唉,被都德胡扯的所谓世界上最美的语言。这是完全地胡扯,每个人的母语对他自己来说都是最美的语言,所以这个小说不翻译的话就不算胡扯。话说讲法语总是嘴角朝下,好像大家都欠他们家钱;讲汉语就是嘴角朝上,老是嘴角冲下会难受的,所以我们讲话时还是很得意的。从包含元音这种乐音的比例上看,法语怎么也要再往后排,汉语的乐音比例是首屈一指的。

扯远了。这个词意思是“已经见过”,也就是似曾相识,专门指这种心理现象。这个情况大家应该都遇到过吧,维基上说研究表明70%的人有过这种感觉。我记得最强烈的一次是大约10岁时从外面回村,走到村口,感觉突然来了,并且感觉说转过弯会碰到某某人,我带着这种观念转了弯,果然见到了那个人。那一刻真是有惚如隔世的意思,觉得周围的样子都变了。

但是研究差不多表明,这种感觉只是一种记忆错乱,属于非正常记忆,具体机理似乎也没有搞太明白。但按黑客帝国的解释,一只猫两次通过一个门口,那其实是Matrix系统重启的表现--这么大个机器重启这么快真不容易。又按近期一个《百莫大三角》的三集电视电影的描述,其实是出现了一个时空裂缝,才会造成一些错乱的场出现

还有个新词叫brate,据称是better than great。

05/27/06 00:01:00,由 cathayan发表。 本文链接

05/26/06

欧洲放弃软件专利?

cathayan.org版权所有,保留一切权利。转载请保留此说明。谢绝商业转载。
LWN的报道。准确地说是欧洲委员会认定欧洲专利局的作法不成为普遍的法律,不适用于成员国,也不对欧洲法院产生影响。也就是说到欧洲审请专利还是归欧洲专利局管,而专利之后的事情,比如专利是否成立及其法律事务还是根据现行法律管,而欧洲法院也可以有自己的意见。

看上去,欧洲还是走向了美国那个方向,毕竟欧洲在这方面也还是有一定优势的:专利可以发,但是否能成立还得看法院的判决。这对个人及开放团体十分不利,因为他们都没有钱和精力来打这种官司。美国法院是基本认可这种专利的,下一步要看欧洲法院的作法了。

05/26/06 13:22:22,由 cathayan发表。 本文链接

幽灵世纪

cathayan.org版权所有,保留一切权利。转载请保留此说明。谢绝商业转载。
不是说这个世纪里到处都是幽灵,而是这几个世纪本身的存在让人怀疑了。是不是超级有趣的话题?想一下,你以为今天是2006年,实际上却只是1709年?一下子你所有的时间概念都要调整?

据这位并非疯子的怀疑论者的研究,罗马教庭伪造了这些年代,调整了日历,让没有人生活过的日子成为实际的历史。他的怀疑来自1582年罗马教皇格里高利13世发布新日历的事,那一次调整,把日子向后过了10天,为的是调整前一个历法儒略历(公元前45年施行)的误差,按说这个误差是每年10分钟多,而调整10天只代表了1257年,而不是应有的1627年。

引外他的疑点还有历史学家认为历史上有许多间隔,比如君士坦丁堡建造的时间,558-908年,炼狱的概念出现及形成的时间,600-1100年等等。基于这些怀疑,他认定现行的历法有297年的空白时间,这将近300年的时间从未出现过。

维基上居然有此人及其怀疑论的介绍,也有许多的反驳意见。不管怎样,我都要引用这个Blog的名字说:damn interesting!!!

这个怀疑即便被证实,对我们的影响也不大,中国的历史可以从西周共和元年直到现在一年年排下来,都有可靠的史书为证,伪造年份的可能不大--历史学家们不过调整一下公元元年在我国历史上的坐标点而已,从王莽时代调整到晋初,我们一样能生活在18世纪。

05/26/06 00:01:00,由 cathayan发表。 本文链接

05/24/06

大锤解数独

cathayan.org版权所有,保留一切权利。转载请保留此说明。谢绝商业转载。
大锤即Sledgehammer,数独即Sudoku,这篇文章的作者是黄炜华,Google工程师,目前的世界数独冠军赛冠军,前一段Google达芬奇密码游戏的设计者。

数独游戏就是如图所示的往这种9×9的格子里放数字的游戏,要求是每行、每列以及第个3×3的小区内正好分布1-9,而没有重复,也没有漏用。这个图是黄炜华得冠军的最后一题。黄把他自己解Sudoku的方法称为大锤,这个方法看来确实对解复杂的题目很有用(这篇文章有全文翻译,地址在前面链接下面的留言中)。



首先得有一点集合的概念,通常用文氏图表示。这个图里,如果要达到4个圈中的每一个正好有一个图形的要求,就不能选只在绿圈中的图形,也就是三角;同样也不能选那个方块,因为它同时处在两个绿圈中。这里,黄把红圈叫做前提,而把绿圈叫结论;前提没有交叉,而结论可以交叉。



可以得到两条定理:

选红圈外的元素会让绿圈有多于一个图形,因此不能选。
选1个以上绿圈包围的元素会让绿圈有多个图形,因此不能选它。

这个方法的秘诀就在于构造这些前提和结论(条件),并用集合图表示出来。



最简单的正中间那个J点必须是8,这很容易看出来,用这个黄氏大锤法的方法是先表示出这些条件,如第1列,A-S都等于5,就是说这些方块中只能有一个5,第2列,表示这一列里只有一个4,如此类推。它们的前提是,A里面已经是5,B已经是4,把它们圈起来就是前提。同样,J可以是1-9这些数字,也是一个条件。



根据上述定理,红圈外的不能选,两个绿圈的也不能用,因为他们都会引起结论中出现重复结果,所以J只能是8。

下面作者选中的是正文中央那个3×3的小区,利用的条件是横竖两个7。





同样地,BCDG4个点在绿圈而不在红圈中,它们不能是7,而GCDGF这些点又在这个3×3的方块中,它们也是一个条件,那只有F是7了。

下面解最右下角这个格子。利用了与它所在3×3小区有关的含有2的行与列,有3个包含2 的前提,以及3个行/列和两个3×3小区的条件。利用上述定理,可以消掉许多未知因素。最后一个条件是BD所在小区中必须有一个2,这就意味着HN这两点又被消去,则Q点必须是2。





上面这些都是比较规矩的,实战中规矩的大概都要靠大脑,然后复杂的就要同时运用更多条件和前提,前提也可变成是两个方块的取值。如此天马行空一番,解出K=4。最长的两条空的交叉点。



谁有兴趣把它解完?

05/24/06 22:47:19,由 cathayan发表。 本文链接

05/21/06

看花轻松一下

cathayan.org版权所有,保留一切权利。转载请保留此说明。谢绝商业转载。



05/21/06 09:31:52,由 cathayan发表。 本文链接

05/19/06

拇指原则

cathayan.org版权所有,保留一切权利。转载请保留此说明。谢绝商业转载。
Google最著名的Blogger,Matt Cutts总结的一些有关软件邮件开发等等的原则,很有趣,但谁能告诉我“Rules of thumb”是什么意思呢?

软件

让用户输入时,要求越宽越好。比如应该想到用户可能会在输入的前或后面加上空格;或者如果想要域名,也应该允许用户输入一个URL,然后从中提取域名。

输出带有日期的文件时,应该用YYYY-MM-DD,而不是其他时间,这样排列文件名时,就能按时间排了。(有点怪)
如果要报告Bug,应该给尽可能多的消息,让别人能重现错误。

如果有了Bug,应该先补好。然后问自己“怎么才能再不出这个Bug?”也许需要加点监控,也许要加强UI,也许代码里要多做检测。不要只是补好它。(好同志啊)

电子邮件

如果发邮件给多个人,不要用代词。“他稍后应能处理这个问题”对你很明白,但对别人来说,他、这个、稍后都很不明确。

如果想让人看一个小于10万行的文件,就放到一个网站上,然后发个URL给别人,这样他就能看到原始文件,或者直接在浏览器中查看。(最讨厌的是Word和PPT附件,幸亏Gmail可以直接查看)

如果发信给许多人要求做某事,不会有人回应;最好还是请某个人做某事。

如果在邮件中加了个链接,最好在发出前点一下看是否完好。(他没考虑到防火墙)

当你写下“此信也CC给某某”时,赶快加上CC的地址,否则别人看到这句话却发现没有CC就会觉得你很傻。(更傻的是说了见附件却没有加附件)

尽量让链接短点,这样就不会被邮件程序给折行或者砍掉了。(TinyURL很不错,Firefox能处理多行的URL也很不错)

杂项

在网上保守秘密是件困难的事。如果你正在做某种极牛B的没人见过的东西,去掉所有的参考项;你放出来的PowerPoint也要清理一下;处理子域名及URL的方法也要变一下;要记住的是,如果某个URL本意是要保持私秘,但如果所有人都可访问的话,总有人会偶然碰到它的;用.htaccess加个密码保护比较好。读者们会挖掘你的代码,监视你的robots.txt,研究你买了哪个域名,包括通过其他公司购买的。(这段强烈建议读原文,上面的链接很有趣)

当你做一些烂事的时候,比如清理猫屎的时候,最好闭上嘴巴。(有人说应该闭上鼻子,这样就不会闻到臭味了;当然了这位大侠不是在讨论猫屎问题了)

如果你要求100个人去做某事,只有25人会做,如果你用死亡或开除来威胁人家,会有60个人做。(这对那25个人很不公平啊)

如果你正在讨论某个你想要的东西,并且你又已经得到了批准,最好不要再说,还是走开的好。(世事难预料 :P )

05/19/06 10:43:21,由 cathayan发表。 本文链接

05/17/06

北京

cathayan.org版权所有,保留一切权利。转载请保留此说明。谢绝商业转载。
好不容易进城一趟,还赶在8点到9点之间,一路上,我至少听到5次周围的人说:北京要完了。因为地铁实在太挤,而且偏偏5月的大早上有沙尘(暴)。

今天的沙尘远没有达到“暴”的程度,但它足以让赶路的人心生恐惧。想想吧,车厢里挤得像照片,人都贴在窗玻璃上了,好不容易出来了想缓口气,吸到的还有百分之好几的灰尘和沙子;满头大汗的就更惨了。

回来的时间算是清闲时间,还有座。为什么这么多人都要冲着差不多一个方向走呢?可能和北京规划中住在某一片,工作又在某一片有关吧,像建国门及周边,中关村及周边都算是工作上班的地方,实在太集中了。有点想起我国古时对城市区域的划分,东市西市,剩下的都是坊,市是买卖的地方,坊是住人的地方,严格分开。想来那时要买东西也只是冲着两个方向去,不知有无交通问题。其实有宋一代,开封城就开放得多,有人想这么干,居民不愿意,皇上及其同事们居然也就算了,才有清明上河图那样的世俗首都景象可看。

05/17/06 16:11:44,由 cathayan发表。 本文链接

05/15/06

为什么信任Google?

cathayan.org版权所有,保留一切权利。转载请保留此说明。谢绝商业转载。
这题目太过巨大,不过这几天好几个站上都讨论这个问题,不免也勾起了我的兴趣。毫无疑问,我是属于信任那一派的。

通常的不信任存在于这几点:Google知道你搜什么词,Google知道你搜了之后访问了什么网站,Gmail里存着许多个人的邮件,Gmail会扫描这些邮件并加上广告。总之就是Google知道你的上网动作并利用这些动作投放了相关的广告。

但正如那些站点的评论所指出的那样,实际上能干这些事的人或机构非常多,你的ISP,你的单位,你的其他的Webmail提供商,甚至一个可能的监听你局域网或无线网的网管或黑客。他们中的任何一个人都可以在你毫不知情的情况下看到你的任何网上活动,如果你没有采取措施的话。前些天那个MSN吃米粉的故事大家应该还记得吧,在这一点上,个人或小机构要比Google值得担心得多。

我在单位的Email就处于这种状况,我发现这一点是因为有一天突然收到一封信说对不起,下面这封信删错了,再转发给你 :P

为什么这些数据在Google那里反而更安全呢?我可以想到的就是这是Google目前为止99%的业务的基础,没有这个基础,它的业务就不能进行下去。在这种情况下,只要发生一件这些信息被不当使用的例子,它的业务就会遭受巨大的损失,任何理性的人都不会去冒这个险。我相信Google在这一点上应该有着最严厉的管理制度。

更何况,实际上它没有必要去冒这个险,有哪位的个人隐私数据重要到让Google去利用呢?对Google而言,最有价值的部分都是一些默默无闻的普通人,只在统计学意义上对搜索产生效果,而不是个人。比如你的邮件里提倒了度假,也许边上会出现一些马尔代夫的广告,对你而言这是独特的;但对Google来说,只有这个广告投放了多少次,是哪个关键词引起投放,以及多大比例的人点击了这个广告有意义,还有就是这些人中间有多大比例的男性、女性,来自哪个国家哪个城市等等,就像Google Trends一样。这些数据也只有这些数据是有价值的。

前一段Google人士回答另一个问题的答案也值得借鉴,那个问题是Google是否会手工调整搜索结果。答案是不可能,因为Google算法中用超过200个变量来描述结果,而现在它的数据库中的结果怎么着也超过了80亿,在这个规模上手工调整某个结果是不可能的事。另一个数字也可辅证这一点,那就是每一次搜索时,参与运算的电脑都超过1000台,我们可以了解到其中的复杂性。

最功利的思路是这样的,如果统计效果已经能带来每年数十亿美元的生意,它还有兴趣和时间去利用每个私人数据吗?

另一个担心也许更实在些,那就是谁还能接触到这些数据。其一就是政府;美国政府显然是最可能的,它还借911之名快速通过了一个爱国法,里面的条款很强硬。前一段他们要一些非法内容的搜索数据做为某个法案的证据,Google打了官司,然后得到了基本胜利的结果。这个问题更加复杂,涉及到法律及政府信任的问题,不谈也罢。当然,最重要的是你会因为什么的网络活动而被抓的问题,是因为你说了什么话还是制造原子弹,是因为在家里看黄碟还是因为赞助了T,这中间的区别实在太大了。

其二还有黑客。Google的数据中心会被黑吗?硬盘会被偷吗?这一点上,普通人除了相信Google的高智商人士之外,并没有更好的办法。

最根本的一点,在网上正如在社会中一样,是需要有一定程度的基本信任的。正如走在大街上突然过来一人问:你哪地方来的?你会什么反应?所以我很讨厌在IM上一加好友就开始查户口,这在我的信任范围之外。与之相反,如果和朋友坐在饭馆里,他又介绍我认识另外的人,那我自然会报上我的数据了。除此之外,大可不必凡事都写真的,尤其是电话、手机、住址、生日以及关键的邮箱。当然国家民族城市无所谓了。这一点应该对任何网上服务都适用。

05/15/06 10:54:57,由 cathayan发表。 本文链接

05/13/06

中国图景

cathayan.org版权所有,保留一切权利。转载请保留此说明。谢绝商业转载。
商业成功人士总爱自称“最懂中国”,说这是他们成功的根本,这说法很不严密,因为一个来中国转上一圈的人也一样敢于预测50年后的中国。

Blog中文翻译的这篇文章就是这种情况,他们一家来中国转了一圈,很不幸地他碰上了五·一前后的沙尘暴,碰上到处是人的场景,碰上了难吃的中餐,并且不知道在城市里到哪里去找西餐。并且我觉得他的说法很可疑,350美元一晚的喜来登会那么差?没经验啊。

正如贴出这些内容的那位讲的,他读了许多有关中国的媒体报道,这他这位朋友的旅行经历大不相同。我想起码应该把这两部分结合起来才算是相对正确的。

前几天看电视上批判一个非法传销的案子,里面一位头目讲大头目们为了让被骗来的人相信他们的成功,就是开名车,穿名牌,带戒指和项链。名车自然是奔驰宝马,戒指和项链自然是大大粗粗的黄色的,这个我能想像;最不习惯是这个穿,他们穿的是报喜鸟,好像是浙江的牌子,经常在央视上做广告的。我本以为他们要穿阿玛尼的,看来还是不懂中国啊。

记得早有人说过,在中国呆几天,可以写几篇文章;呆一年,可以写本书;呆个3、5年,也还是写几篇文章;呆到10年以上,想写关于中国的小文章也会觉得力不从心,所以还是不写了吧。

这个故事告诉我们,来中国旅游一定要看沙尘暴预报,还要住在外国人聚居的地方,奔驰宝马的公关做得不错,而阿玛尼的公关还有相当的增长空间啊。

[update]第3篇也出来了,作者果然改变了一些观点。

另外,BBS有人转了一篇文章,非常有趣,有关“老外: 在清华教政治 西方朋友都觉得我简直疯了”。

05/13/06 15:02:34,由 cathayan发表。 本文链接

05/12/06

上海交大处理“汉芯”造假事件

cathayan.org版权所有,保留一切权利。转载请保留此说明。谢绝商业转载。
上海交大已经在网站上发布了关于此事的调查结论及处理意见,详见上交大网页。里面说明了各号汉芯的实际情况,给了行政处理。

不过我觉得这事实在是个刑事案,诈骗罪,即便要为受害者一方的教育、科技、发改委三方不出面,检察机关也应该主动介入了。

05/12/06 16:09:10,由 cathayan发表。 本文链接

Trends游戏

cathayan.org版权所有,保留一切权利。转载请保留此说明。谢绝商业转载。
以前就有人用搜索引擎玩这个游戏,以搜索结果的多少来比较,这样反映了一定的流行度;而Google Trends这个最新放出来的工具就能反映一个项目真正的流行趋势,也就是上网的人们对它的关注程度了。

搜一个词直接放进去就可以,要搞PK的话就在词中间加个“,” :

Linux, Windows,Win胜
debian,redhat,fedora core,suse,ubuntu,本来是Debian胜,可2006之后,居然是Ubuntu出来了
新浪,搜狐,163,雅虎,百度,QQ,百度高高在上
百度,google,百度赢
Firefox,IE,Firefox胜出
Beijing,shanghai,Shanghai胜,除了北京一地外
北京,上海,还是上海胜出,但地域性表现更强
blog,rss,Blog关注度十分强劲,RSS还不温不火
拿China和几个国家比,总体总是胜出,但在新闻上从2005年低于印度,说明这帮国际媒体还是偏爱印度些。


05/12/06 10:26:03,由 cathayan发表。 本文链接

05/09/06

搜索树

cathayan.org版权所有,保留一切权利。转载请保留此说明。谢绝商业转载。
demo@virushuo发掘的这个页面,这位大侠搞了2^31-1个节点的BST网站,专门来记录搜索引擎的爬虫的行为,具体的研究就不看了,这里来点有点艺术感的东西欣赏一下,每条线都代表一个节点,爬虫抓取这些节点的次数决定线的长短,这些图经过了修改,否则根会非常长。

Yahoo:
yahoo slurp
Google:
google bot
MSN:
msn bot

05/09/06 12:14:01,由 cathayan发表。 本文链接

郇山隐修会和天主事工会

cathayan.org版权所有,保留一切权利。转载请保留此说明。谢绝商业转载。
这是两个出现在《达芬奇密码》一书中的两个神秘组织,前者据说有上千年历史,有包括牛顿、达芬奇和雨果在内的多位大师为领袖;后者据说力量无比强大,甚至在曼哈顿还有一座17层的大楼。

看到本4月某期的Time周刊,封面居然讲这个Opus Dei,这个词当然不认识,查了一下,居然是天主事工会,一下子又勾起对这个神秘组织的兴趣。这个西文词组是拉丁文,意思是天主之事,是真正的天主教团体,受罗马教皇的认可,其创始人前两年刚被封为圣人。

这个团体创立于1928年的马德里,追求在日常工作生活中成为圣徒,也就是不必入教,甚至不必真正加入这个团体。当然这个团体在全球范围内有85000来真正的会员,美国有3000来人(Time),在纽约有一座刚建成没几年的大楼。入会后有相当严格的戒律,比如禁欲,男女分开,苦修(在大腿上绑一个满是尖刺的苦修带,每天2小时),也有说法说他们死后要把财产捐给这个会。同时会员要求保持隐秘状态。它的发展对象是高层次人士,像大学生等,因此据说在某些上层有极大的影响力。

郇山隐修会是书中提到另一个神秘组织,书中说他们有关于基督教起源的另外的说法,而天主事工会则是罗马的支持者,这就是他们之间的冲突。该会英文名Priory of Zion,所以又叫锡安会(看过黑客帝国后应该对Zion有点印象,耶路撒冷的一个地方),于是又同几百年前的圣殿骑士团拉上了关系。实际上,历史上找不到任何这个组织的记录,而法国那里倒有这个组织的档案,它成立于1956年,目前已经没有什么活动,在它短暂的历史上也没有什么惊人之举。

神秘的东西,了解一下 :P

05/09/06 09:46:43,由 cathayan发表。 本文链接

05/08/06

还是盗版

cathayan.org版权所有,保留一切权利。转载请保留此说明。谢绝商业转载。
在对盗版的反对声音中,以及在不太响亮的反驳的声音中,有着一个逻辑,就是说人家定那个价是人家的自由,你买不起就不要用好了。这是极端错误的,它不适用于版权。

人类社会中的任何一种活动,如果不能增进社会的福利,那这个社会绝不会容忍它,不论明招还是暗箭也一定要废了它。版权制度的初衷,是为了促进知识创新,从而便也有利于增进社会福利;它绝不是为了一种生意,为了赚钱而设立的。

现在好像都说中国人有钱了,可以满世界跑,可以去探险了,这种状况也许让事情有些变化,但至少在B.G.骂中国人是小偷的时候,2000块一套的Win98是不太买得起的,我觉得买这种东西也很难增进我国社会的福利;但10块钱一套就可以。

李敖在《美国是盗版祖师爷》一文中说:

你动辄要我钱,我讲过,我以台湾为例子我讲过,美国的收入跟台湾是四比一,所以你收入四块钱的时候,你可能买到有钱买这个书,我收入一块钱的时候,这个书对我就太贵了,我就买不起了,那买不起我就不念吗?我就不研究吗?我就坐等我的文化退步吗?我也不肯啊!我希望能够力争上游,像你们美国人当年跟英国比赛一样。你们追到英国,你们用什么方法追到英国呢?用盗印的方法,用偷偷摸摸做小偷的方法来追到了英国。今天你向我们要钱,我们没有钱,或者钱不够,或者钱不甘心给你,我们也要用你们的方法去力争上游啊,去后来居上啊,去并驾齐驱啊。为什么我们要付钱?老子们就是不付钱,这就是我们的道德标准,我们的道德标准跟它的是不一样的。可是我们讲,我们也是持之有故,言之成理,不是吗?为什么你们当年在我们国家是强盗,今天我们做了民族主义的小偷,偷一点回来,你鬼叫什么东西啊!这就是我的李敖的这个标准。

这就是文化产业的特质,它就是不同用金钱来衡量,不能用“买不起就不要用”这种混蛋逻辑来解释的特质。在李敖引用的爱默生的信中,他其实还说,现在一个先令要换30个美分,到我们这里就买不起了,情况同我们现在收入不如美国远甚,而汇率又是1:8的情况简直一模一样。

话说回来,我是坚决支持版权制度的,但它必须依据一个社会的发展程度来实施,而文化强国有义务在知识输出上帮助弱国,而文化上的弱国更有权利使用一切可以得到的知识来发展自己,一点都不必不好意思。当然凡事有个度,这样不认真实施版权制度的结果也可能造成本国创新动力不足,这是一个要权衡的问题。

05/08/06 00:18:00,由 cathayan发表。 本文链接

05/05/06

5月5日杀档事件

cathayan.org版权所有,保留一切权利。转载请保留此说明。谢绝商业转载。
在我国人民欢度五·一黄金周,满世界撒钞票的日子里,在沙尘暴终于远去,我们可领略大好春光的日子里,水木著名ID之一k.g*b被杀档了。至发稿时止,讨论仍在进行。

据称,此人一贯在水木灌水,经常掀起小小的浪花;而最近,此人发表的一篇Blog文章终于被神勇的版面巡查人员拿获,控以危害公共安全,终于一举拿下。

多位记者的追问“是否只是因为那个文章”,一位站内元老承认“不是”;在谈及后果时,该元老又说,是一个“两败俱伤”的结果。

05/05/06 22:23:34,由 cathayan发表。 本文链接

我的E-Mail


Copy&Paste Exchange

访问CPeX Group

订阅Feed

订阅Feedburner
Feedsky订阅
本站订阅

请登录

导航

cathayan.org Web

最新贴

Windows 10 文件批量命名简单方法
Windows 10 文件删除高级操作
本站也算是有响应式设计了
哥利亚
NucleusCMS回归
怎么把孩子养到18岁,神志正常还不恨你
Open Live Writer
Windows 10 升级初体验
光学大师维米尔
VLC 显示中文字幕

最新评论

Powered by

Powered by Nucleus CMS

版权声明

Creative Commons License
Blog on 27th floor by Cathayan is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 3.0 Unported License.
Powered by Nucleus CMS v3.71. Best view with Mozilla browsers.