Blog on 27th Floor
主页 随便 电脑 电影 社会 阅读 下载 本站 存档
主页 随便 电脑 电影 社会 阅读 下载 本站 存档

09/22/06

慕尼黑市开始部署基于Debian的Linux桌面

cathayan.org版权所有,保留一切权利。转载请保留此说明。谢绝商业转载。
前天(9月20日),德国慕尼黑市宣布该市已经开始部署基于Debian的Linux桌面系统,以取代公务员们目前使用的Windows。

在此之前,慕尼黑的市长,Christian Ude已经试用了一段时间,并对自己的经历作出了积极的评价:“在概念和开发完成后,我们现在已经开始使用这个版本,我也对它进行了成功的测试。这个软件是我们不再依赖于独一供应商的一步,对这个目标,自由软件是个好工具。普通用户并不会受到太多改变的影响。”

该系统全面基于自由软件。核心是Debian 3.1(Sarge),KDE 3.5OpenOffice2,还有自动安装工具FAI和远程管理工具GOsa

09/22/06 00:01:00,由 cathayan发表。 本文链接

09/21/06

Kill & Join

cathayan.org版权所有,保留一切权利。转载请保留此说明。谢绝商业转载。
被问住两个问题,记录一下:

1. Kill缺省是什么信号。只会用kill和kill -9,是什么信号完全不知道,这一页说得明白:
SIGHUP 1 Hangup
SIGINT 2 Interrupt from keyboard
SIGKILL 9 Kill signal
SIGTERM 15 Termination signal
SIGSTOP 17,19,23 Stop the process

2. SQL查询里Join怎么用。完全忘了,似乎从来没用过,于是一点也记不得了。这一页也有,还有Left/right的分别:
SELECT employees.Lastname, employees.Firstname, invoices.Sale, invoices.Price
FROM employees
INNER JOIN invoices
ON employees.id = invoices.EmployeeID


这个故事告诉大家,别问外行这么专业的问题啊!尤其不要再往下面问。

09/21/06 23:28:34,由 cathayan发表。 本文链接

09/13/06

德谟克雷西--开源网络电视平台

cathayan.org版权所有,保留一切权利。转载请保留此说明。谢绝商业转载。
从特色上看,这个开源的网络的电视平台什么都好,就是这名字犯禁,只好汉化一下。这个德先生电视,是一个软件,目前是0.9beta,除Windows平台外,还有MacOS,Fedora,Ubuntu,Debian和Gentoo版本下载,其中Win版声明不受官方支持。

如果用Debian unstable版的话,这个包已经在正式的库里面,apt-get update之后就可以install了。对Python依赖比较多,然后程序运行速度也有点惨。

最主要的特点是600多个电视台,据说节目很多,可以用RSS订阅;然后是下载,采用BT技术,有更新可以自动下载,感觉很不错。当然单位网络上就不要用了,BT嘛。本来想抓个播放视频的图,可是用Gimp没抓到视频内容,只好抓了个下载的界面。目前已经有的Bug是播放高清的某个格式时会死掉,我下了个mov的似乎就死掉了,报告说资源不够,但其他的没有问题,(同样用xine/totem播放这个mov也会死掉,mplayer没问题)。缺省情况下下载的视频放在~/.democ.../Movies目录下。目前还不会找其他的频道。

Wales说,……不光是挡住了你们不舒服的信息,也挡住了中国人同世界对话的路。唉,能将就看点就将就看点吧。其实在这个问题上,是不屈服全部不能看好呢?还是屈服一点然后也能将就看一点好呢?我是倾向于后者的。

Boingboing在说明德国人Tor事件的贴子中指出,Tor这个工具不是用于绕过什么的,而只是用于防止私人信息泄露的。任何人都可以安装Tor的服务器,安装后就可以方便地得到全部在线服务器的IP,并且,你用Tor连接时很可能会经过这个假的服务器,然后就无所遁形了。所以也不要对它太有信心。

著名的【单位TV】系列剧Sexy Beijing新一集Country Loving已经上线了,可以一看。

09/13/06 00:20:00,由 cathayan发表。 本文链接

09/12/06

302-baidu-完美世界

cathayan.org版权所有,保留一切权利。转载请保留此说明。谢绝商业转载。
昨晚某人的电脑上的maxthon浏览器突然失灵,经常访问的一个网址被导向一个百度搜索,今天又有人发现这个问题,这回是一个IP,是ping img.alumni.163.com得到的(用不同的DNS会返回不同的IP),这里的例子是:202.108.251.207。如果把这个IP直接放到地址栏,结果就会是这个百度搜索的网页:

http://www.baidu.com/s?wd=%CD%EA%C3%C0%CA%C0%BD%E7&cl=3
这是北京网通ADSL的情况,和昨晚上发现的情况一模一样。用Curl可以发现,中间会有个302临时重定向,重定向的网址就是上面那个。这里谁是流氓呢?北京网通?这个“完美世界”的垃圾网游?或者还有百度?如果百度没有参与的话,那百度应该封杀这个关键词。

E:\curl>curl -v http://202.108.251.207
* About to connect() to 202.108.251.207 port 80
* Trying 202.108.251.207... connected
* Connected to 202.108.251.207 (202.108.251.207) port 80
> GET / HTTP/1.1
> User-Agent: curl/7.15.4 (i586-pc-mingw32msvc) libcurl/7.15.4 zlib/1.2.2
> Host: 202.108.251.207
> Accept: */*
>
< HTTP/1.0 302 Found
< Location: http://www.baidu.com/s?wd=%CD%EA%C3%C0%CA%C0%BD%E7&cl=3
< Server: BIG-IP
* HTTP/1.0 connection set to keep alive!
< Connection: Keep-Alive
< Content-Length: 0
* Connection #0 to host 202.108.251.207 left intact
* Closing connection #0


昨晚的情况是用Maxthon出这个问题,换用Firefox就没事,按道理它们去解析域名应该是一样的,不知道是不是Maxthon还中了什么插件不是。

在这里,强烈推荐外面的DNS server,它们不会被人随便乱改。比如这个OpenDNS就很好用。

09/12/06 11:11:53,由 cathayan发表。 本文链接

Sort和PIM

cathayan.org版权所有,保留一切权利。转载请保留此说明。谢绝商业转载。
当邮箱的容量不再是问题时,从邮箱里找到某个资料就成了件难事。Gmail说:

搜索但不排序。


这里的英文是Search和Sort。Search我们都知道了,它的位置在所有Google产品中都很显著,并且Google还专门请幻灭的麦克风写过一个Gmail搜索功能介绍,其实不算很好的宣传,因为它的功能还不完善。

Sort这个词很有意思,在我的印象里,我一直以为它只有“排序”的意思,为了排得快,还有许多算法和国际性的比赛。在一般的邮件程序的邮箱界面上,把邮件按不同性质进行排序也是基本功能,比如发件人,日期,有无附件,标题等等。Google这里翻译成排序,当然是正确的,并且后面的解释还说了When的问题,也就是按日期排序的方法。

但我自己的体会,找到信件最有效的方法,却不是搜索,也不是排序,而是分类。在Thunderbird里,一些被我标记为重要(红色)、工作(黄色)的信件虽然淹没在上千封信件里,但仍然最容易找到;在Gmail里,我也建了me,important,work这样的标签,再加上星标,基本构成了我查找邮件的最主要的途径。当然我也用搜索,但Thunderbird的搜索实在太慢(巨大的文本文件)并且搜索能力有限,词记错一点都搜不到;Gmail的搜索英文比较好用,但不是每个要搜的信都有独立的英文单词。

这就涉及到Sort这个词的另一个重要的意思,就是分类。如果用define:sort在Google上查的话,这个意思比排序的意思更多、更靠前。想一下,学习中只在a sort of这个词组中用过这个意思。

在处理信息时,分类应该是sort的本意,比如按字母序排列,也完全可以认为是按字母分类,最后的结果就是一片a打头的,一片b打头的。至于是a出现在前面还是b出现在前面,意义已经不大了(如果有2600个字母的话意义还是很大的 :P 比如中文)。

而分类,我认为,也仍然是个人信息管理最重要的功能,实现上就是图书馆的分类系统和网络应用上的Label和Tag。在Delicious上面找以前收藏的某个网址时,这些Tag也是我最常用的,它的搜索也经常出不来理想的结果。

个人信息不同于整个Web,因为它的量太小,搜索行为也少,似乎不足以让搜索引擎具有某种程度的智能,比如猜测某个同义词,纠正拼写错误,分析用户使用结果的行为甚至用人工来校正结果等等。

09/12/06 10:18:18,由 cathayan发表。 本文链接

09/11/06

Google机器和存储的传说

cathayan.org版权所有,保留一切权利。转载请保留此说明。谢绝商业转载。
传说一:

以前,我只听说那系统强韧到能把硬盘直接摆在地上,坏了就拔,想加就加,于是 Gmail 的容量才能不停地成长。今天,连主机都变成那样了:简化过的主机板裸片,用魔鬼毡黏在机架上,一格就可以多放好几片。那一片的指示灯有问题就下架换新,也不必检查了。而且现在听说还能用机器人自动化地检查抽换。


传说二:

Google目前共有850TB的网络搜索信息,也就是蜘蛛爬回来的那些东西;Google Analytics占用了220TB,数据200TB,总结性信息20TB;Google Earth占用70.5TB,原始图片70TB,500GB是索引;个性化搜索只有4TB,Google Base占了2TB,Orkut占了9TB。

09/11/06 09:15:18,由 cathayan发表。 本文链接

搜索结果的人工评价

cathayan.org版权所有,保留一切权利。转载请保留此说明。谢绝商业转载。
这篇贴子讲Google雇用许多人员来做搜索结果的评价工作,这似乎不是新闻。据我所知,Google也聘请过中文结果评价员,不过限制在海外华人那里了。这些人不是正式员工,可以兼职工作,因为只要有网络就行了。这些人当然也不能改变搜索结果,只是评价这些结果,然后搜索引擎会据此进行一些算法上的调整。

通常要求是母语是目标网页的语言,在web上做研究发掘资料的能力要强,要有宽带连接,要懂所处环境的网络文化。像hao123一度被清除就是不理解本地网络文化的问题。

这个贴子也给出了评价员的工作界面,对一个结果同时会有多人进行评价。评价分为相关/不相关/有用,最好的是有用。评价后还可以写下自己的评论。有时有些搜索词可能会出现在多个类别中,评价员也要逐一说明,这里的例子是美洲虎,可能是动物,也可能是汽车。

Google把查询分为3类:导航性,只有一个结果;信息性,可能有多个结果;交易性的,用户要求得到某种东西。评价员就要分辨一个查询属于哪一类或其组合,分辨它的类型,对结果进行研究(包括其他引擎,数据库,分类目录,站点以及线下资料),然后评价,当然还要注意那些欺骗性的网页。

文中提到Google新近注册了indexbench.com和Google-testing.com这样的域名,于是推测说也许会让网民都参与这种工作?就像对图像搜索那样?当然,这回不大可能是付费工作了。

其实,Google前些天刚拿到一个专利:System and method for supporting editorial opinion in the ranking of search results。虽然很有可能是防护性的专利,但也不能排除真的加以直接地应用吧。

09/11/06 00:02:00,由 cathayan发表。 本文链接

09/08/06

Eval

cathayan.org版权所有,保留一切权利。转载请保留此说明。谢绝商业转载。
seal of cathayan.org


Eval,也就是evaluation,evaluates a string as though it were an expression,这个词是 估价,评价,求值的意思,这里只能取“求值”这个意思了。以前只在bash shell脚本里见过,也不怎么明白。今天碰到一个大表格,里面有一项要本来是填数字,高人们有的给填成了10*4, 23*8这种算式,这种东西数据库进不去,还是得算,10000多条,想想都烦。

还是得Perl。本来是想把这个式子按*拆开,得到两个数字再做运算,应该也行,不小心翻书就翻到字串处理部分的最后一页,正是eval()这个函数,真是巧了,一读就发现它可以求值,以前翻到这页也不止一次,居然就没看过。

my $t = “33*21+23484/1291”;
my $tt = eval($t);
print $tt;

管它几万行,一个while就加两行eval和print就全算出来了,真是不错啊。

看了Wikipedia的解释,原来许多语言都有这个功能,包括Javascript,Python,Lisp和PHP等。Bash也有,我记得看到的应该就是 eval ‘dircolors’ 这一句,就是运行dircolor,打印出LS_COLORS的值用于bash里面的export什么的。

在perl里面,除了可以求值并赋给其他变量,它还会把运行结果(成功与否)交给特殊变量,$@,如果运行一切正常,就是未定义,如果有问题,里面就是错误信息,这样就可以用它对一个式子在运行前进行检查,免得出除0一类的错误。当然,由于它可以在代码里面再运行代码,危险性也是显而易见的。

09/08/06 00:33:00,由 cathayan发表。 本文链接

09/07/06

回归Blog的本源

cathayan.org版权所有,保留一切权利。转载请保留此说明。谢绝商业转载。
FT中文网已经提出问题说“博客如何超越”,是啊,如何超越?我自己是不想超越什么了,只是最近在Bloglines感觉到这个越来越少的趋势,长此下去,快要只能读老徐的非Blog了。当然还有专业媒体的RSS,那倒是一点不少。

FT中文网上说:

在普通人眼中,这种新媒介的主要倡导者往往被视为自负的业余爱好者——他们非常独立特行,有时也极有见地;他们写作的动力源于一种激情,那就是向更广阔的世界传播其观点。

是这样吗?至少在个人Blog里,如何传播不可能成为真正的重点,个人也不会有太多的精力关注自己的传播效果,也没有能力去做大的推广。对个人来说,出自内心的表达欲望可能更重要,这也是长久都不会熄灭的动力之一。

FT观察到的著名Blogger,Dan Gillmor,Dave Winer等。他们现在都投身某种产业,或是自己创业,“新的工作或商业机会已经开始成为他们关注的中心”,因而在Blog上面的投入明显减少了。国内的情况如何呢?也许是大家也是变忙了?我感觉很不一定,但说起热情减退了,可能更真切吧。

我自认毅力和耐性算是我的优点之一( :P 另一面讲,就是比较懒和活得没有创意),但我也认为如果把Blog当成重要的事业可能会比较累,尤其是因为要更新而写的时候会更累,甚至会影响到工作生活--我也经历过这个阶段。但后来我坚持除非想写,绝不更新。但翻翻我的归档就能发现,我想写的东西还真不算少,哈

毕竟,每天网上会有如此多的好东西,有趣的观点,有趣的事件,有用的资料和软件,哪个不能写几句呢?Blog的本源是Web Log,也就是浏览Web时的记录,不需要太有创意,太与众不同,只要是有趣点的,都可以写两句。而Web之大,总有你看到而别人看不到的。

所以,还是回归Blog的本源,继续来发现Web上的好东西,然后写出来表达自己并与他人共享吧。

但是,这可能会依赖于你每天浏览的数量,FT中文昨天也说,“干扰太多 影响工作”,不过它说的是电邮,IM和电话。

比如卫报就说二战时,统计学家从德国坦克的编号上发现了德国每月能生产多少量坦克,从而下定了进攻的决心。不过那个公式给的毫无来由,就像国内的数学教科书。还有有趣的Danwei TV即将推出Sexy Beijing第3集,目前有个介绍看。

勇猛的BTSB同学目前似乎陷入了某种状态,或者Blog出了问题,我虽然在Bloglines上面看到他写了13篇骑行游记,但似乎Blog打不开了,名字也变成了“来自天池的迷 慕尼黑”,发生了什么呢?祝他早日恢复快乐和勇猛的本性吧!

(一个好的Blogger,打字快是必须的,当然还要看的快。像这一篇,我敲字用时29分,之前浏览了快1个小时--这时,保持网络匿名是极为重要的 :P )

09/07/06 10:14:38,由 cathayan发表。 本文链接

09/05/06

谁创作了维基百科?

cathayan.org版权所有,保留一切权利。转载请保留此说明。谢绝商业转载。
本文作者是Aaron Swartz,他看来是著名网络文章挖掘网站reddit的员工(?),也是Wikipedia的重型编辑,目前编辑数排名1301。他置疑维基创始人Jimbo Wales经常发表的一个数字,即最核心的500人贡献了大部分维基百科的内容,具体说来是:0.7%的编辑,也就是524人,完成了超过50%的编辑量,最活跃的2%用户,完全了总数的73.4%,剩下的25%由98%的用户完成。

按Wales的说法,维基百科和传统百科全书的创作方法类似,有一个核心的团队,他们完成大部分工作。但Aaronsw不相信这个说法,并且指出Wales的统计方法有误,他只统计了编辑次数,而不是创作或修改的内容量。Wales也说他将逐步完善这个统计。

但这位作者已经等不及,似乎他正在竞选维基基金会的董事。他下载了一份Wikipedia,然后编程进行了自己的统计,但总共的编辑数已经超过600亿次,所以他只统计了一个随机样本,他的结论与Wales的大不相同。

他发现(这是他Blog中的一篇)在编辑中,只有很少的用户是注册用户,但他们占据了大量的编辑数,而真正完成条目内容的人甚至根本没有账号,甚至也只做过一次编辑--就是创造出大多数内容的那一次。他举了Anaconda这个条目的例子,贡献大多数内容的那位只编辑了两次,而编辑最多的那位实际上在最终版本中已经看不到他的工作了。

Aaron把这两类用户称为格式员和贡献者。不过前者还是叫编辑比较好,他们贡献大量的时间,参与Wikipedia社区,学习或创造了这个社区的文化以及编辑风格,他们对贴子进行大量的操作,使它们风格统一,格式正确;但贡献者甚至可能没有账号,参与也少,但他们碰巧是某个方面的专家,对某个条目懂得很多,他们创造了大量的原始内容。

所以重要的是贡献者,即使没有编辑,他们提供的原始内容仍然是有价值的,所以维基百科应该把重点放在这些偶尔来一趟的人身上,起码要更关注一下这些人。这就是作者同创始人Wales的不同之处,似乎也是他的竞选纲领吧。

文中提到Wales曾经说过他是一个百科人碰巧用上了Wiki,而不是碰巧变成百科人的Wiki人,所以他才特别注意他的编辑团队。而作者认为,维基应该看重他的贡献者,编辑只是辅助贡献者工作的。

其实好像这也还是传统百科的工作方式,有专门的编委会,但重要条目也是要请专家来写的,当然编委会也会创作出大量的普通条目。

刚才看到著名的澳洲鳄鱼先生Steve Irwin在潜水时遇事故身亡,真是不幸,在北京台引进的动物星球节目里经常看到他,还有他老婆,一块抓鳄鱼,说鳄鱼。他的介绍还是Wikipedia最全。

现在可以通过指IP的方法看到E文的Wiki,但中文是怎么也不行,真是不爽。

09/05/06 11:12:54,由 cathayan发表。 本文链接

09/01/06

Google Image Labeler

cathayan.org版权所有,保留一切权利。转载请保留此说明。谢绝商业转载。
Google的很有趣的实践,让网络用户给图片打标签。工作模式是直接到它的网页上,可登录或不登录,然后进入,系统自动挑两人合作,同时给一幅图打标签,如果两个人打的标签里有重合的,就算是有用的,如果两人碰不上,就不算,一幅图90秒的时间。打标签时可以尽量多地写,比较考验英文,碰到个航天飞机起飞,我打了space shuttle还有takeoff也没有碰上。

看起来这就是传说中的personal rank了吧,不知道这个人工打出来的标签在针对这个词的搜索中占多大比重。上一周,Google得到了一个专利:System and method for supporting editorial opinion in the ranking of search results,支持搜索结果排名中编辑意见的系统及方法。虽然有时候申请专利不过是为了自卫,但更多时候专利还是有用的。

09/01/06 22:21:47,由 cathayan发表。 本文链接

Firefox 2 beta 2

cathayan.org版权所有,保留一切权利。转载请保留此说明。谢绝商业转载。
这个Beta2算是昨天发布的,下载了一个来试用,不过下成英文版 :P 呆会再看中文的。初步试用,体会如下:
  1. 程序反应速度比1.5有所加强,刚从我每天使用的1.5.0.6过来,还比较明显。也许是机器破所以明显了,也许是还没有装任何第3方扩展才显得快吧。
  2. 用户界面上有了微调,据说是新雇用的设计师的成果,有点透明三维的那种效果,鼠标放上去会加亮那种。
  3. Tab标签条有点变,也有透明效果,当前标签页高亮,其他变灰。
  4. 所有标签上都加了关闭按钮--有人可能还不喜欢这个,应该能改的。
  5. 标签栏最后加了“显示所有标签”的按钮。
  6. 内置拼写检查功能,现在敲字就有显示。错字加下划线,右键之后有建议拼写,跟Word差不多的效果。
  7. 加了RSS Feed直接显示和订阅到主要在线阅读器的功能,显示RSS和IE7那种效果一样,同时提供订阅到LIve/Google/Yahoo/Bloglines这4家的功能。在选项中也加了Feed管理。
  8. 搜索引擎管理有了单独的界面,也可以订阅更多的搜索引擎,和扩展及主题网站在一起了。
  9. 动态标题,不过要网站再加点东西(微型概括)支持才行。
  10. 扩展和主题管理放到一个窗口中。

很不错,就等正式发布了。

09/01/06 10:29:27,由 cathayan发表。 本文链接

我的E-Mail


Copy&Paste Exchange

访问CPeX Group

订阅Feed

订阅Feedburner
Feedsky订阅
本站订阅

请登录

导航

cathayan.org Web

最新贴

RIME 小狼毫/鼠须管的极点及五笔拼音配置
Software that rocks or sucks less
一棵热带的树换新叶的过程
几个有用的Vim招术
论语七 述而
Nomacs 图像浏览器
Windows 文件校验
Windows 10 文件批量命名简单方法
Windows 10 文件删除高级操作
本站也算是有响应式设计了

最新评论

Powered by

Powered by Nucleus CMS

版权声明

Creative Commons License
Blog on 27th floor by Cathayan is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 3.0 Unported License.
Powered by Nucleus CMS v3.71. Best view with Mozilla browsers.