09/25/06

网络著作权的尺度

cathayan.org版权所有,保留一切权利。转载请保留此说明。谢绝商业转载。

虽然很快就要出发去坐48小时的火车而兴奋地没有心情干活,我还是很关注天下大事的。前天,Google上诉比利时报刊组织的案子被驳回,于是就在google.be站上放了那个判决的全文,虽然除了比利时的几百万讲法语的人之外,没有人会去读那个判决,但这件事的意义还是很深刻、值得我们讨论一下的。

这个案子里,这些报刊就要求Google不得再索引缓存它们的文章,包括搜索和新闻站点都不许再有。其实Google在大多数情况下只会增加这些网站的流量,让更多的读者知道有这个文章然后再转向真正的文章站点,从而对网站也很有利,但这些报刊看上去不这么想。

也许他们有自己的理由,但我们要关心的是网上还能不能链接,索引或简单的摘录?从我们的著作权法来看,第22条是“权利的限制”,也就是合理使用,包括个人学习研究,为介绍评论而适当引用,为报道新闻时事的,报刊报道其他报刊电台已经发表的东西的,课堂使用的,总共有12种情况。单就这几条,我们是可以“适当引用”或报道新闻的。

但这个著作权法没有说明互联网的情况。去年,国家版权局和信息产业部出台了一个法规,叫“互联网著作权行政保护办法”,其中包括了“上载、存储、链接或搜索等功能”,把存储和链接的权利都授予了版权所有人,也就是说,版权所有人占有这个权利。但法规中没有说明缺省情况下不许链接,只是说如果所有人发现他人侵权,可以发出通知要求改正,服务商只要改正(去除侵权内容或链接),就可以不负进一步的责任。

看比利时的这个判决,实际上是要求Google不但要去除,还要在首页上登判决全文,那就是说要想免于这个惩罚,网站必须在链接或引用他人之前取得许可。比如如果现在再有一家报纸告Google,Google.be的主页岂不要再次加长?

至少在这里,我认为上面那个行政法规的做法还是适当的。作者拥有自己作品的全权,包括不让他人提到自己作品的权利(这是不是也有点过分了?别人要想说它就只能说那某某某的某某文?),但如果他不要求,别人也可以先提一下。

著作权的产生是为了刺激创作和创新,以便出现更多的好作品,而要出更多的创新,就必须有交流,如果没有交流,创新也很难。所以如果著作权制度影响了这种交流,那它的作用就要打折,就需要对它做出改变以保证社会进步。现在似乎有越来越多的权利倾向于个人的金钱的利益,但它们对进步的危害却难以度量。

既然难以度量,我们也没办法说这个制度就已经有了危害,眼下也只好如此;但如果提到什么,引他两句话都要先取得许可,确实也有点荒谬。

现在还有组织想创造个协议来管理这个搜索引擎的问题,其实不是很必要,只要放个robots.txt在网站上,一般搜索引擎还是听话的。

09/25/06 11:04:56,由 cathayan发表。 本文链接
  

09/22/06

广而告之:参与“RSS阅读习惯”调查

cathayan.org版权所有,保留一切权利。转载请保留此说明。谢绝商业转载。

这个关于RSS阅读习惯的调查,由微软亚洲研究院交互设计中心发起,其结果“将在2006年10月20日之后于本页面公布”(前面那个链接),可以对RSS的推广应用起到一些作用。

调查题目不多,几分钟就可做完。我已经接受过他们面谈了。

09/22/06 11:16:10,由 cathayan发表。 本文链接
  

慕尼黑市开始部署基于Debian的Linux桌面

cathayan.org版权所有,保留一切权利。转载请保留此说明。谢绝商业转载。

前天(9月20日),德国慕尼黑市宣布该市已经开始部署基于Debian的Linux桌面系统,以取代公务员们目前使用的Windows。

在此之前,慕尼黑的市长,Christian Ude已经试用了一段时间,并对自己的经历作出了积极的评价:“在概念和开发完成后,我们现在已经开始使用这个版本,我也对它进行了成功的测试。这个软件是我们不再依赖于独一供应商的一步,对这个目标,自由软件是个好工具。普通用户并不会受到太多改变的影响。”

该系统全面基于自由软件。核心是Debian 3.1(Sarge),KDE 3.5OpenOffice2,还有自动安装工具FAI和远程管理工具GOsa

09/22/06 00:01:00,由 cathayan发表。 本文链接
  

09/21/06

Kill & Join

cathayan.org版权所有,保留一切权利。转载请保留此说明。谢绝商业转载。

被问住两个问题,记录一下:

1. Kill缺省是什么信号。只会用kill和kill -9,是什么信号完全不知道,这一页说得明白:
SIGHUP 1 Hangup
SIGINT 2 Interrupt from keyboard
SIGKILL 9 Kill signal
SIGTERM 15 Termination signal
SIGSTOP 17,19,23 Stop the process

2. SQL查询里Join怎么用。完全忘了,似乎从来没用过,于是一点也记不得了。这一页也有,还有Left/right的分别:
SELECT employees.Lastname, employees.Firstname, invoices.Sale, invoices.Price
FROM employees
INNER JOIN invoices
ON employees.id = invoices.EmployeeID


这个故事告诉大家,别问外行这么专业的问题啊!尤其不要再往下面问。

09/21/06 23:28:34,由 cathayan发表。 本文链接
  

09/18/06

中医治病

cathayan.org版权所有,保留一切权利。转载请保留此说明。谢绝商业转载。

有个朋友的朋友身体出现问题,会不时地出现头晕眼花直至站立不住的情况,去医院做检查,血液心电图B超等等,全部参数(人是机器吗)显示完全正常,于是西医束手无策,没有检查出毛病,怎么给治呢?于是随手开了点补血的药给打发了。

这位朋友在此之前已经跑过几家医院,于是对西医丧失信心,转向一家中医院。中医听完主诉,把了脉,认定为气虚血亏,讲了一番,开了一通治血亏的中药,这位朋友非常满意。

西医现在有完整的理论和方法,检查不出病变细菌和病毒,他确实没办法出手,无非给点安慰剂。中医是按经验,这个虚和亏我似乎也能讲。前几天央视某6:30的节目中大讲杰出中医,看了两位,都能看舌像,说从舌头上的颜色和状态能看出内脏的病情。不过末了讲实例时,一位中医研究院的大夫给人看不孕症时看了舌像,然后还是要提醒病人吃了这一剂药再来看情况诊治,我看她也没有十足的把握。

记得小时候邻村有位中医相当出名,有人从很远的城里跑来看病,我见过一回他看病人一眼,就说她的舌头会变成紫色,果然病人的舌头在伸出来半分钟之内就变成了紫色,在场的人士都非常服气。

现在想来,这么明显的变化理应能从物理化学生物学上进行检测和解释。

现在感冒厉害,头变得相当地沉重,除去吃有化学成分的泰诺(酚麻美敏)之外,也吃了著名的板蓝根和银黄颗粒,其中就是植物了,板蓝根,金银花和黄芩,怎么工作的就说不上了。不像泰诺会说明某芬会抑制前列腺合成于是降温,某碱会防止鼻子充血,于是就不鼻塞,还有什么可以抑制咳嗽神经,于是就不咳等等等。

板蓝根自称能用于病毒性感冒和咽喉肿痛,是能抑制病毒呢?还是能杀菌?又或者只是抑制中枢神经,从而抑制症状呢?也没有人来研究一下。

09/18/06 10:00:52,由 cathayan发表。 本文链接
  

09/17/06

西藏

cathayan.org版权所有,保留一切权利。转载请保留此说明。谢绝商业转载。

到全国去
好消息是:已经成功地搞到T27次列车卧铺票两张,25日晚上就要出发前往西藏了!

坏消息是:感冒了,必须在出发前恢复。

初步计划,到拉萨后先去林芝,这地方海拔要低点,可以算是适应一下;然后有朋友陪同,转一转拉萨;然后如果有可能,找车去纳木措日喀则;如果情况好,说不定再走远点去远观一下珠峰?

有经验的讲评一下吧

还有边防证的问题,已经搞到了单位介绍信,现在得到海淀分局去办了,具体写哪几个地方呢?听说林芝那里普通的风景区已经不需要,那就只有珠峰所在的定日了,是这样吗?

09/17/06 00:46:10,由 cathayan发表。 本文链接
  

09/16/06

理性与信息

cathayan.org版权所有,保留一切权利。转载请保留此说明。谢绝商业转载。

前几天看新闻,看到说澳洲鳄鱼先生Irwin的Fans们为了给偶像报仇,就跑到他们的东北海岸,从海里找了10多条魔鬼鱼(就是大大的伸着大翅膀,拖着长尾巴,像黑山老妖那种),拖到岸上杀死。虽然Irwin确实死在这种鱼的尾巴上的毒刺上,但他本人却一直是个彻底的环保及动物保护人士,这种纪念方法,一定得不到Irwin的饶恕。

孔夫子说,三思而后行,这些人就是没有三思。其实孔子说过这句话吗?没有。孔子说的是:再斯可矣。就是说二思就够了,但许多人只想一次,即偶像被这种鱼毒死了,所以杀这种鱼就能为偶像报仇。

在这想一次里面,有明显的漏洞,比如某条鱼是凶手,你怎么随便抓这种鱼来杀?这条鱼为什么要杀死这个人,是不是有原因,原因是否正当?杀鱼能报仇吗?偶像喜欢杀鱼吗?诸如此类。也就是在进行一次简单的因果分析时,必须注意到方方面面,使自己的推理能够成立。

GRE考试中就有这么一类题,虽然现在考试方法变了,但道理一直不变,就是找出一个推论中的错误或漏洞。比如有人把甘肃和陕北现在环境不少直接归结于北宋砍树,其间很大的一个漏洞就是没有考虑其他可能会影响到环境的因素,比如气候变迁,比如其他人搞破坏,比如物种灭绝:P,给出这方面的任何一个例子都可以直接推翻上述论证。所以一度我觉得GRE真是很好的东西。

推理似乎并不涉及多麻烦的逻辑,但它却经常要求许多知识。很长时间以来,我都认为妄人出现的一个原因就是知识少,信息少-如果不是完全没有是非观的话。方舟子归结科学妄人的成因为:传统上只讲技术没有科学,文化上讲通才,讲悟道,政治上夸大群众的创造性。不能说方舟子总结的没有道理,但缺乏足够的知识和信息这一条他却没有提及。事实上,只要多了解些学科常识,就知道靠哲学解不了四色问题。

还有一种原因是可能是文化上的,但和悟无关,也就是可能缺乏这种推理的习惯,只习惯于口号:我们要进行大规模的建设,但是我国还是一个很穷的国家,这是一个矛盾。全面地持久地厉行节约,就是解决这个矛盾的一个方法。在这里,这真的是矛盾吗?根本不是,穷一样可以修梯田,一样可以大炼钢铁,还可除四旧灭四害,还可以收集3/4的人的口粮去搞建设,规模都非常大,也没有节约什么东西。许多话,说的人有他的考虑,但他不说,因为他有他的目的。但听的人却没有细想,当然想的人都被打倒了,比如老彭想搞明白一亩地能产多少粮食。

现在我们却正有一点机会,可以让大家多了解些信息,并且也没有太强的手段去不让大家想事。这就是网络,就是wiki这样的东西。信息当然是空前得多,但相对人的处理能力来说,这不算什么,许多信息是知识点性质的,需要知道的就是有某个事而已。

有些fq以这个特指的wiki是美国的,以米政府经常在国际上干坏事来证明这wiki也是坏的,这种说法很无聊,也算是诛心之论。也就是其心可诛,虽然wiki并没有来害我们,虽然Wales没有害我们的心思,但其最最最后台老板经常有害我们的心思,所以它也是坏东西。所以有关Wales发表言论的讨论最后可落脚到米国是否鼓励过伊拉克的化学武器研究的问题上。

这是推理过程中必须排除的一种方法,原因必须是直接的和明确的,而不能是宏大和模糊的。

还有一个问题,就是信息多了但信息准确吗?信息多了,但虚假和错误也一样更多了,怎么保证得到正确的结论呢?这要归功于信息来源的多样性。人都免不了偏见,wiki也一样,毕竟那里经常进行编辑的也就1500人,而不是全部网民。但我们还有许多其他途径可以说明一些问题。比如报纸上都说小布的智商有问题,但搜索一下,就可以看到同样的说法和辩驳以及怀疑的说法,看过之后,我想能够得到一个更好的结论。

信息与理性之间我想有一个互相失去的关系,信息多了才会有怀疑,才会产生理性,而理性的人必将珍爱更多的信息和更通畅的渠道。正如疯狂的石头上所描写的,易拉罐骗术演不到一半,人们就都跑到车厢那一头了。

09/16/06 23:39:00,由 cathayan发表。 本文链接
  

09/13/06

德谟克雷西--开源网络电视平台

cathayan.org版权所有,保留一切权利。转载请保留此说明。谢绝商业转载。

从特色上看,这个开源的网络的电视平台什么都好,就是这名字犯禁,只好汉化一下。这个德先生电视,是一个软件,目前是0.9beta,除Windows平台外,还有MacOS,Fedora,Ubuntu,Debian和Gentoo版本下载,其中Win版声明不受官方支持。

如果用Debian unstable版的话,这个包已经在正式的库里面,apt-get update之后就可以install了。对Python依赖比较多,然后程序运行速度也有点惨。

最主要的特点是600多个电视台,据说节目很多,可以用RSS订阅;然后是下载,采用BT技术,有更新可以自动下载,感觉很不错。当然单位网络上就不要用了,BT嘛。本来想抓个播放视频的图,可是用Gimp没抓到视频内容,只好抓了个下载的界面。目前已经有的Bug是播放高清的某个格式时会死掉,我下了个mov的似乎就死掉了,报告说资源不够,但其他的没有问题,(同样用xine/totem播放这个mov也会死掉,mplayer没问题)。缺省情况下下载的视频放在~/.democ.../Movies目录下。目前还不会找其他的频道。

Wales说,……不光是挡住了你们不舒服的信息,也挡住了中国人同世界对话的路。唉,能将就看点就将就看点吧。其实在这个问题上,是不屈服全部不能看好呢?还是屈服一点然后也能将就看一点好呢?我是倾向于后者的。

Boingboing在说明德国人Tor事件的贴子中指出,Tor这个工具不是用于绕过什么的,而只是用于防止私人信息泄露的。任何人都可以安装Tor的服务器,安装后就可以方便地得到全部在线服务器的IP,并且,你用Tor连接时很可能会经过这个假的服务器,然后就无所遁形了。所以也不要对它太有信心。

著名的【单位TV】系列剧Sexy Beijing新一集Country Loving已经上线了,可以一看。

09/13/06 00:20:00,由 cathayan发表。 本文链接
  

09/12/06

302-baidu-完美世界

cathayan.org版权所有,保留一切权利。转载请保留此说明。谢绝商业转载。

昨晚某人的电脑上的maxthon浏览器突然失灵,经常访问的一个网址被导向一个百度搜索,今天又有人发现这个问题,这回是一个IP,是ping img.alumni.163.com得到的(用不同的DNS会返回不同的IP),这里的例子是:202.108.251.207。如果把这个IP直接放到地址栏,结果就会是这个百度搜索的网页:

http://www.baidu.com/s?wd=%CD%EA%C3%C0%CA%C0%BD%E7&cl=3
这是北京网通ADSL的情况,和昨晚上发现的情况一模一样。用Curl可以发现,中间会有个302临时重定向,重定向的网址就是上面那个。这里谁是流氓呢?北京网通?这个“完美世界”的垃圾网游?或者还有百度?如果百度没有参与的话,那百度应该封杀这个关键词。

E:\curl>curl -v http://202.108.251.207
* About to connect() to 202.108.251.207 port 80
* Trying 202.108.251.207... connected
* Connected to 202.108.251.207 (202.108.251.207) port 80
> GET / HTTP/1.1
> User-Agent: curl/7.15.4 (i586-pc-mingw32msvc) libcurl/7.15.4 zlib/1.2.2
> Host: 202.108.251.207
> Accept: */*
>
< HTTP/1.0 302 Found
< Location: http://www.baidu.com/s?wd=%CD%EA%C3%C0%CA%C0%BD%E7&cl=3
< Server: BIG-IP
* HTTP/1.0 connection set to keep alive!
< Connection: Keep-Alive
< Content-Length: 0
* Connection #0 to host 202.108.251.207 left intact
* Closing connection #0


昨晚的情况是用Maxthon出这个问题,换用Firefox就没事,按道理它们去解析域名应该是一样的,不知道是不是Maxthon还中了什么插件不是。

在这里,强烈推荐外面的DNS server,它们不会被人随便乱改。比如这个OpenDNS就很好用。

09/12/06 11:11:53,由 cathayan发表。 本文链接
  

Sort和PIM

cathayan.org版权所有,保留一切权利。转载请保留此说明。谢绝商业转载。

当邮箱的容量不再是问题时,从邮箱里找到某个资料就成了件难事。Gmail说:

搜索但不排序。


这里的英文是Search和Sort。Search我们都知道了,它的位置在所有Google产品中都很显著,并且Google还专门请幻灭的麦克风写过一个Gmail搜索功能介绍,其实不算很好的宣传,因为它的功能还不完善。

Sort这个词很有意思,在我的印象里,我一直以为它只有“排序”的意思,为了排得快,还有许多算法和国际性的比赛。在一般的邮件程序的邮箱界面上,把邮件按不同性质进行排序也是基本功能,比如发件人,日期,有无附件,标题等等。Google这里翻译成排序,当然是正确的,并且后面的解释还说了When的问题,也就是按日期排序的方法。

但我自己的体会,找到信件最有效的方法,却不是搜索,也不是排序,而是分类。在Thunderbird里,一些被我标记为重要(红色)、工作(黄色)的信件虽然淹没在上千封信件里,但仍然最容易找到;在Gmail里,我也建了me,important,work这样的标签,再加上星标,基本构成了我查找邮件的最主要的途径。当然我也用搜索,但Thunderbird的搜索实在太慢(巨大的文本文件)并且搜索能力有限,词记错一点都搜不到;Gmail的搜索英文比较好用,但不是每个要搜的信都有独立的英文单词。

这就涉及到Sort这个词的另一个重要的意思,就是分类。如果用define:sort在Google上查的话,这个意思比排序的意思更多、更靠前。想一下,学习中只在a sort of这个词组中用过这个意思。

在处理信息时,分类应该是sort的本意,比如按字母序排列,也完全可以认为是按字母分类,最后的结果就是一片a打头的,一片b打头的。至于是a出现在前面还是b出现在前面,意义已经不大了(如果有2600个字母的话意义还是很大的 :P 比如中文)。

而分类,我认为,也仍然是个人信息管理最重要的功能,实现上就是图书馆的分类系统和网络应用上的Label和Tag。在Delicious上面找以前收藏的某个网址时,这些Tag也是我最常用的,它的搜索也经常出不来理想的结果。

个人信息不同于整个Web,因为它的量太小,搜索行为也少,似乎不足以让搜索引擎具有某种程度的智能,比如猜测某个同义词,纠正拼写错误,分析用户使用结果的行为甚至用人工来校正结果等等。

09/12/06 10:18:18,由 cathayan发表。 本文链接
  

09/11/06

Google机器和存储的传说

cathayan.org版权所有,保留一切权利。转载请保留此说明。谢绝商业转载。

传说一:

以前,我只听说那系统强韧到能把硬盘直接摆在地上,坏了就拔,想加就加,于是 Gmail 的容量才能不停地成长。今天,连主机都变成那样了:简化过的主机板裸片,用魔鬼毡黏在机架上,一格就可以多放好几片。那一片的指示灯有问题就下架换新,也不必检查了。而且现在听说还能用机器人自动化地检查抽换。


传说二:

Google目前共有850TB的网络搜索信息,也就是蜘蛛爬回来的那些东西;Google Analytics占用了220TB,数据200TB,总结性信息20TB;Google Earth占用70.5TB,原始图片70TB,500GB是索引;个性化搜索只有4TB,Google Base占了2TB,Orkut占了9TB。

09/11/06 09:15:18,由 cathayan发表。 本文链接
  

搜索结果的人工评价

cathayan.org版权所有,保留一切权利。转载请保留此说明。谢绝商业转载。

这篇贴子讲Google雇用许多人员来做搜索结果的评价工作,这似乎不是新闻。据我所知,Google也聘请过中文结果评价员,不过限制在海外华人那里了。这些人不是正式员工,可以兼职工作,因为只要有网络就行了。这些人当然也不能改变搜索结果,只是评价这些结果,然后搜索引擎会据此进行一些算法上的调整。

通常要求是母语是目标网页的语言,在web上做研究发掘资料的能力要强,要有宽带连接,要懂所处环境的网络文化。像hao123一度被清除就是不理解本地网络文化的问题。

这个贴子也给出了评价员的工作界面,对一个结果同时会有多人进行评价。评价分为相关/不相关/有用,最好的是有用。评价后还可以写下自己的评论。有时有些搜索词可能会出现在多个类别中,评价员也要逐一说明,这里的例子是美洲虎,可能是动物,也可能是汽车。

Google把查询分为3类:导航性,只有一个结果;信息性,可能有多个结果;交易性的,用户要求得到某种东西。评价员就要分辨一个查询属于哪一类或其组合,分辨它的类型,对结果进行研究(包括其他引擎,数据库,分类目录,站点以及线下资料),然后评价,当然还要注意那些欺骗性的网页。

文中提到Google新近注册了indexbench.com和Google-testing.com这样的域名,于是推测说也许会让网民都参与这种工作?就像对图像搜索那样?当然,这回不大可能是付费工作了。

其实,Google前些天刚拿到一个专利:System and method for supporting editorial opinion in the ranking of search results。虽然很有可能是防护性的专利,但也不能排除真的加以直接地应用吧。

09/11/06 00:02:00,由 cathayan发表。 本文链接
  

09/10/06

施明德

cathayan.org版权所有,保留一切权利。转载请保留此说明。谢绝商业转载。

这位今年已经超过65岁,居然还能坚持理想,真是不容易。虽然对他的一些理念不能认同,但这人还是很值得钦佩的。他还以苏武自比,志不在小:

“苏武牧羊19年,有羊肉可吃羊奶可喝,有番女可谈情说爱,生儿育女,他已流传千古。我25年苦牢,什么都没有,百年之后,现在的权势者都淹没于时间的洪流时,我一定还会存活!”

上个月他写了一封信,后面有这么几句,写得很好:

shi ming de

是啊,谁会示弱呢?谁肯舍弃呢?

09/10/06 21:58:16,由 cathayan发表。 本文链接
  

09/08/06

Eval

cathayan.org版权所有,保留一切权利。转载请保留此说明。谢绝商业转载。

seal of cathayan.org


Eval,也就是evaluation,evaluates a string as though it were an expression,这个词是 估价,评价,求值的意思,这里只能取“求值”这个意思了。以前只在bash shell脚本里见过,也不怎么明白。今天碰到一个大表格,里面有一项要本来是填数字,高人们有的给填成了10*4, 23*8这种算式,这种东西数据库进不去,还是得算,10000多条,想想都烦。

还是得Perl。本来是想把这个式子按*拆开,得到两个数字再做运算,应该也行,不小心翻书就翻到字串处理部分的最后一页,正是eval()这个函数,真是巧了,一读就发现它可以求值,以前翻到这页也不止一次,居然就没看过。

my $t = “33*21+23484/1291”;
my $tt = eval($t);
print $tt;

管它几万行,一个while就加两行eval和print就全算出来了,真是不错啊。

看了Wikipedia的解释,原来许多语言都有这个功能,包括Javascript,Python,Lisp和PHP等。Bash也有,我记得看到的应该就是 eval ‘dircolors’ 这一句,就是运行dircolor,打印出LS_COLORS的值用于bash里面的export什么的。

在perl里面,除了可以求值并赋给其他变量,它还会把运行结果(成功与否)交给特殊变量,$@,如果运行一切正常,就是未定义,如果有问题,里面就是错误信息,这样就可以用它对一个式子在运行前进行检查,免得出除0一类的错误。当然,由于它可以在代码里面再运行代码,危险性也是显而易见的。

09/08/06 00:33:00,由 cathayan发表。 本文链接
  

09/07/06

回归Blog的本源

cathayan.org版权所有,保留一切权利。转载请保留此说明。谢绝商业转载。

FT中文网已经提出问题说“博客如何超越”,是啊,如何超越?我自己是不想超越什么了,只是最近在Bloglines感觉到这个越来越少的趋势,长此下去,快要只能读老徐的非Blog了。当然还有专业媒体的RSS,那倒是一点不少。

FT中文网上说:

在普通人眼中,这种新媒介的主要倡导者往往被视为自负的业余爱好者——他们非常独立特行,有时也极有见地;他们写作的动力源于一种激情,那就是向更广阔的世界传播其观点。

是这样吗?至少在个人Blog里,如何传播不可能成为真正的重点,个人也不会有太多的精力关注自己的传播效果,也没有能力去做大的推广。对个人来说,出自内心的表达欲望可能更重要,这也是长久都不会熄灭的动力之一。

FT观察到的著名Blogger,Dan Gillmor,Dave Winer等。他们现在都投身某种产业,或是自己创业,“新的工作或商业机会已经开始成为他们关注的中心”,因而在Blog上面的投入明显减少了。国内的情况如何呢?也许是大家也是变忙了?我感觉很不一定,但说起热情减退了,可能更真切吧。

我自认毅力和耐性算是我的优点之一( :P 另一面讲,就是比较懒和活得没有创意),但我也认为如果把Blog当成重要的事业可能会比较累,尤其是因为要更新而写的时候会更累,甚至会影响到工作生活--我也经历过这个阶段。但后来我坚持除非想写,绝不更新。但翻翻我的归档就能发现,我想写的东西还真不算少,哈

毕竟,每天网上会有如此多的好东西,有趣的观点,有趣的事件,有用的资料和软件,哪个不能写几句呢?Blog的本源是Web Log,也就是浏览Web时的记录,不需要太有创意,太与众不同,只要是有趣点的,都可以写两句。而Web之大,总有你看到而别人看不到的。

所以,还是回归Blog的本源,继续来发现Web上的好东西,然后写出来表达自己并与他人共享吧。

但是,这可能会依赖于你每天浏览的数量,FT中文昨天也说,“干扰太多 影响工作”,不过它说的是电邮,IM和电话。

比如卫报就说二战时,统计学家从德国坦克的编号上发现了德国每月能生产多少量坦克,从而下定了进攻的决心。不过那个公式给的毫无来由,就像国内的数学教科书。还有有趣的Danwei TV即将推出Sexy Beijing第3集,目前有个介绍看。

勇猛的BTSB同学目前似乎陷入了某种状态,或者Blog出了问题,我虽然在Bloglines上面看到他写了13篇骑行游记,但似乎Blog打不开了,名字也变成了“来自天池的迷 慕尼黑”,发生了什么呢?祝他早日恢复快乐和勇猛的本性吧!

(一个好的Blogger,打字快是必须的,当然还要看的快。像这一篇,我敲字用时29分,之前浏览了快1个小时--这时,保持网络匿名是极为重要的 :P )

09/07/06 10:14:38,由 cathayan发表。 本文链接
  

09/06/06

歧视

cathayan.org版权所有,保留一切权利。转载请保留此说明。谢绝商业转载。

在说明朝皇帝的时候,有人发表意见说:

: 明朝为了防止后党干政,皇后选自小户人家。往往无论能力、学识和势力都不行。

这就是赤裸裸的歧视性语言,也算是流行文化之一。这里是大户人家看不起小户,城里的看不起农民,北京的看不起乡下,上海的看不起外地(北京除外),富裕地区看不起中西部,全国人民(河南除外)看不起河南。

现在国际交往多了,来的老外也多,出去的人也多,已经不止一次看到一些英语的Blog上讨论中国人的肤色歧视,比如看不起黑人。Google的某位Blogger,是小时候被父母移民带到美国去的,她就写过她父母的歧视,并声言再说这种话她就离家出走 :D

以前以为歧视人的一类人,大体是为了建立自己的一种优势心理,从而活在Q精神之中,也算是心理疾病的一种疗法,虽然不彻底,但似乎危害也不很大。我们实际上也还是实用主义占上风,赚起钱来绝不会因为对方是黑人就不卖,虽然确实有北京的出租车司机敢于声明“日本人不拉”的。

但近来考虑这个问题,又有一点心得。就是这个歧视都发生在群体身上,真正人与人面对面时,倒是基本没有,一群人讲个河南人的笑话都会说不是故意的啊什么的。

当上面那位看不起小户人家的女子的时候,他并没有看不起明朝的某位具体的皇后(其实朱元璋老婆出身就很差,但表现很强;还有万历未亲政前也是太后主政,表现也不差),他是看不起所有小户人家,他也不认为是自己看不起人家,而是他自认他所属的团体--所有的大户人家--比人家那个团体强。

也就是说,当歧视发生时,这个主体把自已当成了一个优势群体中的一员,比如是北京人,上海人,富裕地区的人还有非河南人。

这里的问题就很简单了,歧视别人的人都没有自己的人格,没有自己的生活,没有个人的理性。他想问题从来都是从一个群体--他所假想的他处于的群体--出发想的,而不是从他个人。一旦他从个人出发想问题,他就会知道,人与人之间有多大的不同呢?

人与人当然不一样,并且很不一样,正因为有这种不一样,一个经过了理性思考的人才完全没有歧视他人的想法:你在任何一方面有点长处,都会发现在所有其他方面都有无数人超过你。当朋友聚会时,通常人能意识到自我,虽然也讲河南人笑话,但不免自己都会不好意思。

其实就人群的表现来看,也一样不是能用几个形容性就能概括的。英国人就保守吗?德国人就死板吗?黑人就笨吗?美国人就性开放吗?我想绝非如此,这些都是一些长期形成的毫无来由的传统思维罢了。

做为个人来讲,还是活回自己的好,不要随便代表某个群体说话,也不要随便就把自己归入某个群体,从而以为自己也很强大,现代人还需要这种虚妄的不真实感来壮胆吗?有报道说香港人(一个调查,杨锦麟读报读到的)在几种品格中把爱国排在最后,也很不错嘛。

09/06/06 12:16:57,由 cathayan发表。 本文链接
  

09/05/06

谁创作了维基百科?

cathayan.org版权所有,保留一切权利。转载请保留此说明。谢绝商业转载。

本文作者是Aaron Swartz,他看来是著名网络文章挖掘网站reddit的员工(?),也是Wikipedia的重型编辑,目前编辑数排名1301。他置疑维基创始人Jimbo Wales经常发表的一个数字,即最核心的500人贡献了大部分维基百科的内容,具体说来是:0.7%的编辑,也就是524人,完成了超过50%的编辑量,最活跃的2%用户,完全了总数的73.4%,剩下的25%由98%的用户完成。

按Wales的说法,维基百科和传统百科全书的创作方法类似,有一个核心的团队,他们完成大部分工作。但Aaronsw不相信这个说法,并且指出Wales的统计方法有误,他只统计了编辑次数,而不是创作或修改的内容量。Wales也说他将逐步完善这个统计。

但这位作者已经等不及,似乎他正在竞选维基基金会的董事。他下载了一份Wikipedia,然后编程进行了自己的统计,但总共的编辑数已经超过600亿次,所以他只统计了一个随机样本,他的结论与Wales的大不相同。

他发现(这是他Blog中的一篇)在编辑中,只有很少的用户是注册用户,但他们占据了大量的编辑数,而真正完成条目内容的人甚至根本没有账号,甚至也只做过一次编辑--就是创造出大多数内容的那一次。他举了Anaconda这个条目的例子,贡献大多数内容的那位只编辑了两次,而编辑最多的那位实际上在最终版本中已经看不到他的工作了。

Aaron把这两类用户称为格式员和贡献者。不过前者还是叫编辑比较好,他们贡献大量的时间,参与Wikipedia社区,学习或创造了这个社区的文化以及编辑风格,他们对贴子进行大量的操作,使它们风格统一,格式正确;但贡献者甚至可能没有账号,参与也少,但他们碰巧是某个方面的专家,对某个条目懂得很多,他们创造了大量的原始内容。

所以重要的是贡献者,即使没有编辑,他们提供的原始内容仍然是有价值的,所以维基百科应该把重点放在这些偶尔来一趟的人身上,起码要更关注一下这些人。这就是作者同创始人Wales的不同之处,似乎也是他的竞选纲领吧。

文中提到Wales曾经说过他是一个百科人碰巧用上了Wiki,而不是碰巧变成百科人的Wiki人,所以他才特别注意他的编辑团队。而作者认为,维基应该看重他的贡献者,编辑只是辅助贡献者工作的。

其实好像这也还是传统百科的工作方式,有专门的编委会,但重要条目也是要请专家来写的,当然编委会也会创作出大量的普通条目。

刚才看到著名的澳洲鳄鱼先生Steve Irwin在潜水时遇事故身亡,真是不幸,在北京台引进的动物星球节目里经常看到他,还有他老婆,一块抓鳄鱼,说鳄鱼。他的介绍还是Wikipedia最全。

现在可以通过指IP的方法看到E文的Wiki,但中文是怎么也不行,真是不爽。

09/05/06 11:12:54,由 cathayan发表。 本文链接
  

09/04/06

有关宠物

cathayan.org版权所有,保留一切权利。转载请保留此说明。谢绝商业转载。

根据养两只猫(进行时)一只狗(刚送到乡下姥姥家)的经验,很希望能传播一点关于宠物的养前知识,免得养了之后又不喜欢,然后狠心抛弃,对动物说当然是极为可怜,只怕对当事人也是一次良心考验。
  • 猫狗家养之后,就基本没有野外生存能力,所以你一定要负责;
  • 猫狗也能活10来年,也就是说你要负10来年的责任;
  • 猫听不懂人话,所以很可能教训啥的都没用;
  • 它会乱抓东西,包括一切东西,它不懂得什么该什么不该;
  • 有可能会乱拉乱吐,会很臭,还得收拾;
  • 除了不长毛的,它们都会掉毛,城里养的四季都会掉,吸尘器都吸不过来;
  • 养狗一定要遛,不但是为了大小便,更要为了心理问题;
  • 它会在你之前死掉;
  • 它们会要求你的关注,抚爱,没事也会跟着你;
  • 你不能离开家养的猫狗超过2天,因为得给他添食换水;
  • 你要给它打疫苗,每年一次;
  • 它们要花一定的钱,不是很多,但确实要花,猫粮狗粮通常比好的肉略便宜一点;
  • 给的水量要大,这样才不容易坏,最好每天换。

总之,养宠物得有:耐心,恒心,爱心,宽容心,还得有体力和财力

我看到有的人在孩子要养小猫小狗之前都要让他们学习这方面的知识,甚至还要坚持半年或一年之久,如果还是想养才让养,这非常好和必要。真希望任何一个想养宠物的人都有这方面的准备,毕竟城里不比乡下,没有野生动物的空间,抛弃了会非常惨。
img_1944img_1944 Hosted on Zooomr

丢丢小朋友在院子里,离开了熟悉的人还会生气绝食等等……

09/04/06 17:34:01,由 cathayan发表。 本文链接
  

09/01/06

Google Image Labeler

cathayan.org版权所有,保留一切权利。转载请保留此说明。谢绝商业转载。

Google的很有趣的实践,让网络用户给图片打标签。工作模式是直接到它的网页上,可登录或不登录,然后进入,系统自动挑两人合作,同时给一幅图打标签,如果两个人打的标签里有重合的,就算是有用的,如果两人碰不上,就不算,一幅图90秒的时间。打标签时可以尽量多地写,比较考验英文,碰到个航天飞机起飞,我打了space shuttle还有takeoff也没有碰上。

看起来这就是传说中的personal rank了吧,不知道这个人工打出来的标签在针对这个词的搜索中占多大比重。上一周,Google得到了一个专利:System and method for supporting editorial opinion in the ranking of search results,支持搜索结果排名中编辑意见的系统及方法。虽然有时候申请专利不过是为了自卫,但更多时候专利还是有用的。

09/01/06 22:21:47,由 cathayan发表。 本文链接
  

Firefox 2 beta 2

cathayan.org版权所有,保留一切权利。转载请保留此说明。谢绝商业转载。

这个Beta2算是昨天发布的,下载了一个来试用,不过下成英文版 :P 呆会再看中文的。初步试用,体会如下:
  1. 程序反应速度比1.5有所加强,刚从我每天使用的1.5.0.6过来,还比较明显。也许是机器破所以明显了,也许是还没有装任何第3方扩展才显得快吧。
  2. 用户界面上有了微调,据说是新雇用的设计师的成果,有点透明三维的那种效果,鼠标放上去会加亮那种。
  3. Tab标签条有点变,也有透明效果,当前标签页高亮,其他变灰。
  4. 所有标签上都加了关闭按钮--有人可能还不喜欢这个,应该能改的。
  5. 标签栏最后加了“显示所有标签”的按钮。
  6. 内置拼写检查功能,现在敲字就有显示。错字加下划线,右键之后有建议拼写,跟Word差不多的效果。
  7. 加了RSS Feed直接显示和订阅到主要在线阅读器的功能,显示RSS和IE7那种效果一样,同时提供订阅到LIve/Google/Yahoo/Bloglines这4家的功能。在选项中也加了Feed管理。
  8. 搜索引擎管理有了单独的界面,也可以订阅更多的搜索引擎,和扩展及主题网站在一起了。
  9. 动态标题,不过要网站再加点东西(微型概括)支持才行。
  10. 扩展和主题管理放到一个窗口中。

很不错,就等正式发布了。

09/01/06 10:29:27,由 cathayan发表。 本文链接