Blog on 27th Floor
主页 随便 电脑 电影 社会 阅读 下载 本站 存档
主页 随便 电脑 电影 社会 阅读 下载 本站 存档

04/27/06

GNU文本处理实用程序

cathayan.org版权所有,保留一切权利。转载请保留此说明。谢绝商业转载。
Unix环境下有一系列的文本处理实用程序(现在主要是GNU了),但我一直没有从事过这方面的工作,所以了解不深;直到某日,看到个一长串Perl脚本,里面充满了Perl专有变量,正仰慕间,出来一神,用一行Shell给代替了,里面当然有几个管道,外加cut, sort, uniq共3个小程序,真是简单优美啊。

cut: 输出行中选定部分,这部分可以是某些位置上的字符,也可以是一个区段(有分隔的情况,缺省分隔符是TAB)。
sort: 把输入内容(文件)按行排序,可以按整行的字母或数字顺序来排,也可以指定以某个(或某几个)字段为关键字来排,每段也可指定正序或倒序,甚至可以指定按某段中的第几个字符来排序,是不是超强?
uniq: 输出文件中的不重复行,也就是把重复的去掉;当然也可以输出重复行,或是完全没有重复的行。

想来自己编程写个取一行中某字符的程序还算不难,但要把sort写好也不是很容易吧(估计Perl中有现成的库?),有这些GNU出品的东西,实在是太好了。

也曾经处理过一大堆资料,全是Excel表格,简单的像调整一下列的位置了,把记录里多加的某字符替换掉了一类,就在Excel里面做了,但像取出所有列第2-第5字符之间的字符另存一列,或根据某列的数据经过计算生成新的一列这种,就不太会了。

好在对编程还有点概念,又听说过Perl处理文本最强,就找来本入门的书,又装了Activeperl,就开工了。幸好Excel还能输出成文本文件。这类工作用Perl处理实在是牛刀杀鸡,写上几行就解决了,所以到现在也没有写过10行以上的Perl,也不会用Perl的那些奇怪变量。今后要是再有这种工作,也许可以用点GNU工具了。

这一套实用程序也有Win32版--开源就是好--有人专门打了编译好的,里面程序更多,包括超强的wget,grep等等,还带一个zsh :P 这个包是真正的Win32程序,不需要cygwin一类的中介了。

当然,目的是高效地完成工作,如果在Excel点点鼠标就能搞定,就没有必要学习了。

04/27/06 17:09:44,由 cathayan发表。 本文链接

04/13/06

Google Calendar上线

cathayan.org版权所有,保留一切权利。转载请保留此说明。谢绝商业转载。
昨天Google刚推出第一个非英文名称,今天就放出了传闻已久的Calendar服务,是不是为了祝贺这个中文名字呢?

总体感觉还不错,在屏幕上安排得很好,整体布局和Mozilla的Calendar项目类似,左侧列出了日程名,右侧是详细内容,点击格子可以添加事务,可以设定如何提醒。在设置里面还有手机短信提醒,不过似乎只有美国的一些电话公司得到支持。

设置里还可以导入标准的ical文件,不过导入我先前用MozillaCalendar存下的文件没有成功,看来那些个备份文件是有问题了。又到网上查找了一个2006农历,导入成功,不过中文成了乱码,看原文件也是正确的Unicode编码,不知为何。

好在GCalendar还可以设置共享自己的日历,我准备共享一个“2006中国农历”,慢慢往里加内容。

共享的功能除了可以设置“公开”之外,还可以设定让特定人来共享,应该是输入该人士的Google账号来设置吧?还没有测试。这就搞小组协作了。

iCal的标准,加上日历共享,虽然都不是什么特别创新的东西--这在其他的一些WEB日历中也都有--但靠Google的影响力,这些特性应该会发挥一些作用的。

Calendar其实有相当的商务目的,不是商务环境的话,日程安排意义也不大;配合以前推出的Google Host,小公司完全可以在这个平台上进行日常联系了。

这个Calendar服务还没有广告,还是不错的。也许从今天起,再过上更有条理的生活?

04/13/06 13:22:17,由 cathayan发表。 本文链接

04/12/06

Debian世界周记

cathayan.org版权所有,保留一切权利。转载请保留此说明。谢绝商业转载。
Debian世界的972名DD们已经选出本年度Project Leader,他就是Anthony Towns。从他的Blog来看,他有不少计划。

有人提议说要建一个类似Ubuntu已经在用的网上翻译平台,举双手赞成。不过这样的话,似乎不同地方的翻译成果并没有共享?

还有几个新的软件包:Kasablanca,KDE库的FTP客户端;GNOME Commander,一个Gnome下的文件管理器;enemy lines 7,3D飞机射击游戏。

04/12/06 17:14:40,由 cathayan发表。 本文链接

04/10/06

搞明白Linux下程序的内存占用

cathayan.org版权所有,保留一切权利。转载请保留此说明。谢绝商业转载。
其实在认真阅读了这篇名为“计算内存使用”的文章之后,还是处于半迷糊状态。这位作者就说Linux下面没有特别好的显示内存占用的工具,虽然有top和free,但都说得不清楚,就跟巫毒教的魔术似的。

比如top这个工具,它会显示3种数据,作者分别解释如下:

VIRT:virtual memory usage。Virtual这个词很神,一般解释是:virtual adj.虚的, 实质的, [物]有效的, 事实上的。到底是虚的还是实的?让Google给Define之后,将就明白一点,就是这东西还是非物质的,但是有效果的,不发生在真实世界的,发生在软件世界的等等。这个内存使用就是一个应用占有的地址空间,只是要应用程序要求的,就全算在这里,而不管它真的用了没有。写程序怕出错,又不在乎占用的时候,多开点内存也是很正常的。

RES:resident memory usage。常驻内存。这个值就是该应用程序真的使用的内存,但还有两个小问题,一是有些东西可能放在交换盘上了(SWAP),二是有些内存可能是共享的。

SHR:shared memory。共享内存。就是说这一块内存空间有可能也被其他应用程序使用着;而Virt - Shr似乎就是这个程序所要求的并且没有共享的内存空间。

DATA:数据占用的内存。如果top没有显示,按f键可以显示出来。这一块是真正的该程序要求的数据空间,是真正在运行中要使用的。

所以DATA的含义比较确定,甚至可以用程序读取的数据量计算出来;SHR是一个潜在的可能会被共享的数字,如果只开一个程序,也没有别人共同使用它;VIRT里面的可能性更多,比如它可能计算了被许多X的库所共享的内存;RES应该是比较准确的,但不含有交换出去的空间;但基本可以说RES是程序当前使用的内存量。

将就明白这几点意思也算是收获吧,对这么高深的东西没力气深究啦。最近感觉到Firefox在Linux下面比在Win上还好用,表现就是僵死的机会少且僵住的时间短,一个页面上有大量图片时表现也要比Win上面好,也许表明Linux在内存管理或是进程调度上有什么高明之处?

04/10/06 13:20:17,由 cathayan发表。 本文链接

04/07/06

Yahoo Mail Beta初评

cathayan.org版权所有,保留一切权利。转载请保留此说明。谢绝商业转载。
YahooMailBeta
在Gmail出现两年零几天的时候,我终于用上了Yahoo Mail Beta。为了用上这个,我不但早早就去排队,还改变了居住地和日常使用语言。我现在觉得做网站的,实在应该学习一下Linux的i18n技术,别总是新服务出来只有英语一种界面语言,使用其他语言的就用不上。

首先是一个邀请函,上面给出了一幅像是邮件客户端的界面,点Try IT Now即可进入。

进入之后,发现风格还是很清新。左边是文件夹,右边是新邮件提示和广告。查邮件和写邮件的功能还在左上,但搜索从原来的右上移到了左上角。文件侠中把联系人、日历以及记事本也移过来了。同时还增加了RSS Feeds的文件夹。

点击Inbox,进入收件箱,出现的就是类似邮件客户端的界面,上面上邮件列表,下面是显示邮件内容的地方,这两块的高块可以用鼠标拖动进行调整。同时广告变成了一长条,给邮件让出了空间,在1024的屏幕上也显示得很舒服。这一点要表扬,MSN Live Mail就没有这么厚道。

YahooMailBeta-2
点击邮件,显示速度也很快,看上去像是Ajax技术的功劳,只读取一块内容其他地方不变速度自然有提升。这里Yahoo也全面使用了Unicode编码,并且看来对所有的邮件都做了编码转换(是彻底全转了还是临时转的不知道),以前GB2312编码的中文都显示正常,包括列表上的标题和正文中的内容。同Gmail来回发信测试,一切正常。接受Hotmail的GB2312信件正常,但发往Hotmail的信即便已经正确声明UTF-8编码,Hotmail还是不理会,再B4一次MS。

编写新邮件的界面是在邮件显示区新开一个标签页--有点创意,在写新邮件时还能切过来看一下其他邮件。编写界面也很像邮件客户端,一样有地址提示和拼写检查功能。另外,也提供了存为草稿的功能。

搜索功能也是另外开标签页显示,还不错,但同Gmail一样,也有中文分词和索引的问题,汉字都分成单字来查了。

阅读RSS的功能已经内置,并且是做为一个单独的功能出现的,同Gmail显示在邮件列表上方的做法也是一个进步吧。RSS里面已经自带了Yahoo几个频道的内容,也可以自己添加。显示RSS条目的界面上没有列表,而是直接显示所有新条目,也很方便。还可以选择字体和字号,只是没有找到可以给Feeds分组的功能,如果有的话,几乎可以替代Bloglines了。

总体感觉,这个新的YahooMail还是很方便,比原来的旧版速度上也有较大提升。比之Gmail,还差个邮件对话的功能,Filter和文件夹的功能也有,但页面功能执行速度上还略逊于Gmail,可能是这个界面还是复杂了点吧。如果Gmail是5分的话,Yahoo Mail Beta我原意给它4++,MSN Live Mail得多少分呢?很难说啦,因为我只试用了一天就退回老Hotmail了。

04/07/06 11:58:00,由 cathayan发表。 本文链接

Portland计划统一Linux桌面环境

cathayan.org版权所有,保留一切权利。转载请保留此说明。谢绝商业转载。
Linux下的桌面环境主要是KDE和Gnome两大阵营,它们两个在操作上有相当的不同之处,熟悉G的不一定能熟练使用K,反之亦然。现在这个OSDL一手推出的计划--Portland Project,为统一Linux桌面环境的操作展现了一点曙光。

Portland计划的目标有两个,一是发布一套命令行工具,可以用在安装及使用中;二是发布一套接口库。而在它的集成目标中,按长短期计划分几步走,简单的比如怎么控制菜单,怎么打开一个URL,中间的如怎么设定缺省应用程序,高级的如设置桌面字体。这些东西就目前的状况,任何一个桌面都可以完成,但缺乏一个统一的框架,谁跟谁的操作都不一样。

这也许正是民主的缺陷?现在需要一点集中的力量了。OSDL牵头完成这个工作,也是比较合适的。以后看到别人问Gnome的问题,另一个熟悉KDE或是Xfce的人也同样可以回答了。

04/07/06 00:11:00,由 cathayan发表。 本文链接

04/06/06

Apple发布软件支持Mac-Intel机安装Windows XP

cathayan.org版权所有,保留一切权利。转载请保留此说明。谢绝商业转载。
刚刚的消息,Apple已经放出这个名为Boot Camp的软件的Beta版,可以在基于Intel的Mac机上进行测试。根据描述,这个83MB的软件将会自动地刻出一张光盘,同时帮助用户给硬盘分区,以便安装WindowsXP。

在分区完成后,即可用Windows安装光盘启动机器进行正常地安装;安装完成后插入用BootCamp刻出的光盘,即可完成Mac机特定设备及控制的安装。这个XP是运行在干净的硬件上,而不是基于MacOS的虚拟机上。在启动时,按下Option/alt键即可选择启动哪个系统。

说明中未提及XP以外的其他系统。但想来一脉相承的Win2k/Vista应该问题不大;而安装Linux应该也相当方便吧。

这一举动是否让MacFans再次大跌眼镜呢?是否再次失去了MacOS的神秘感呢?在失去纯正的Mac血统之后?

对Pc机世界来说,是否这世界又多了一家可选择厂商呢?漂亮够酷的机器配上最流行的操作系统会有什么样的感觉?也许对许多人来讲,发布个能运行在PC机上的MacOS更让人激动?

04/06/06 00:02:00,由 cathayan发表。 本文链接

04/05/06

Email对于协作系统的优势

cathayan.org版权所有,保留一切权利。转载请保留此说明。谢绝商业转载。
这位作者自己就在做协作系统,但他还是认为Email相对于协作系统有巨大的优势:
  1. Email很好理解,没有学习难度
  2. Email最通用,99.9%的知识工作者都至少有1个邮箱,重要的是它们可以互通
  3. Email可以在任何地方使用(没网络不行),可以用客户端,可以用Web,还可以用移动设备
  4. Email可以相当个人化,可以方便看到发给谁,谁发的,还有什么人参与进来等等
  5. Email又高度可管理可配置,可以自己设定过滤规则,设定缺省的回复等等
  6. Email可以搜索,尤其是有高级的客户端或是Gmail之后
  7. 可以自己决定如何回复,何时回复,全看自己的喜好

CNN Money有一个系列,How I work,讲大人物们是如何工作的,其中可以看出Email占了多大的比重。比如Google的VP,Marissa Mayer,邮件太多,于是她使用最快的Pine来处理邮件;又如Bill Gates,邮件每天也是100多封(不算很多),他应该是用Outlook吧,但邮件占据了他3个大显示器中的两个,一个列表,一个打开一封。

顺便提醒,:P 本Blog每篇下面都有Email This的功能,Bloglines也是(所以推荐RSS都输出全文)。我常用的水木社区在贴子前按下大写的F键(Term方式),也可以把贴子发回信箱留存。

另外,Google/Yahoo/MSN都有邮件列表服务,如果一个小组需要讨论问题的话,还是这个好,又可以保存,比什么群强太多了。

04/05/06 12:20:30,由 cathayan发表。 本文链接

Firefox优化10招

cathayan.org版权所有,保留一切权利。转载请保留此说明。谢绝商业转载。
目前,Firefox的全球占有率已经超过10%,但也经常听到有人抱怨它占用内存太多,或者速度变慢。Download.com的这篇文章,给了10个可以对Firefox内存占用及速度进行优化的方法

  1. PDF Download。在Windows下面,Adobe的Reader把自己的插件装得很好,所以点到PDF的链接时会在浏览器窗口内直接打开PDF。但速度非常慢,基本可以把Firefox搞到不能用的地步;并且据称这个插件不关Firefox是去不掉的,所以强烈推荐这个扩展,它可以在点击PDF文件时给出一个选择,是打开,是下载,是取消或者转成HTML来查看。
  2. NoScript。这个问题大体不能说是Firefox的Javascript解释有问题,通常都是一些不太好的JS脚本带来的;但也有些网站会僵住,有可能是在连网时暂时没有反应,也有可能是处理JS上有问题。不论如何,这个“没脚本”扩展可以解决这个问题,只在面对特别需要的网站时才打开脚本。
  3. Flashblock。这个扩展更好了,可以在遇到Flash时显示一个图标,而并不加载它,从而让网页显示更快,而在需要时点击图标即可显示Flash,对付广告也是很有用的。以前、尤其是在Linux上面,Flash是让Firefox垮掉的第一大原因,但现在我要说,现在情况大有改观,基本上没有问题了。
  4. FireTune。可以自动根据机器配置来对Firefox的一些选项进行优化,有兴趣可以试一下。
  5. 停止动画。在地址栏上输入about:config,回车,进入这个Firefox的注册表,找到image.animation_mode这一项,双击或右击,把它的值设为none,即没有动画,或者设为once,只动一次。
  6. 清理下载管理器。如果在打开下载时有明显迟滞,有可能就是因为下载管理器中项目太多了,这时就需要清理一下,点下面的按钮,把里面已经完成的项目都清掉即可。
  7. 减少页面缓存。Firefox为了加快浏览速度,会缓存已经看过的页面(是把描绘出来的页面存在内存中),这样再Back或Forward时就会非常快,但这会占用很大的内存。虽然这个页面数是根据机器内存的大小来设置的,但它似乎不考虑页面的大小(有一个实际大小8MB的页面,要占120MB的内存),有时把内存占满了也会变慢(在Linux下这个问题很不明显)。还是about:config,找browser.sessionhistory.max_total_viewers,改变它的值,通常512MB内存缺省是全局8个页面,但你可以把它改得更小些,比如2/3,一般也就可以了,真的一个也不想要,就改成0好了。
  8. 快速取消一些页面元素。这是一些小的Javascript脚本,它的作用是取消页面上一些讨厌的元素。比如object/embed/iframe/applet等等,有些人喜欢在Blog上放背景音乐,有些人看见这些元素就烦得要死。加一个在书签栏吧,碰到烦的就点一下试试。
  9. 停用或卸载扩展。这个挺有用的,其实最关键的是没用的不要装,用的少的可以暂时停用,长期不用的可以卸载。越精干,就越快。
  10. 用安全模式来论断症状。如果Firefox实在慢得不行,又找不到症结所在,十有八九是因为装的扩展或主题。此时用安全模式启动(Windows菜单里有这一项,或者用命令 --safe-mode),逐一卸载扩展看看卸到哪一个时情况会有好转即可。

[UPDATE]
又看了几招(来自GoogleSystem):
  1. about:config里面,config.trim_on_minimize,设定为True
  2. browser.cache.memory.capacity,设为固定值,作者推荐16384,我发现这个值是某个优化扩展的设定值
  3. 在工具-选项(Win)-隐私中,高速缓存设小一些,缺省是50MB,比它小点,某优化扩展设定为38.4
  4. 关掉Java支持(也不是很必要,用Java的网站现在不是很多)
  5. 扩展不要超过5个(这很难,还是算了吧)

04/05/06 00:01:00,由 cathayan发表。 本文链接

04/04/06

Google个人页面新内容

cathayan.org版权所有,保留一切权利。转载请保留此说明。谢绝商业转载。
Googleig.png
消息来自Google官方Blog,其中添了不少有趣的东西,包括X窗口上常见的xeyes,就是个大眼睛跟着鼠标转来转去的,可以逗逗它让它对眼儿 :D 还有天气,我试着输入了中文“北京”,居然有结果出来了,以前用Beijing就不行。

比较大的东西有个Google Chat,本来以为是Gtalk的延伸,启动一看,原来是个IRC,只有一个频道#googlechat,似乎又同aimx.com/有点关系。并且这个IRC终端居然是Java写成的,多日不见这种应用了。其他的也就是把不同内容分一类,还算比较方便。还有一个minimail,就是可以直接给朋友发信的小界面。

Google Chat的1.0.0.91版估计都见过了吧,也就是加了个个人头像,有些人似乎不太喜欢。据说新增加了一些表情符号: ;-| ;-O ;-x ;-P ;-D ;-( ;-) ;'( ;| ;O ;x ;P ;D ;) ;( :-| :-O :-x :-P :-D ;-) :-( :-) B-) :'( :| :O :X :P :D :) :( 。

还有这里,可以改变一下GoogleTalk的样子,是通过css进行的。

另据googlesystem(没找到原始报告),Gmail现在的地位是:
Yahoo,2.26亿用户
Hotmail,2.22亿用户
Gmail,5200万用户(列第4)

04/04/06 14:24:20,由 cathayan发表。 本文链接

04/03/06

Mozilla转向MPL\LGPL\GPL三重协议的工作已经完成

cathayan.org版权所有,保留一切权利。转载请保留此说明。谢绝商业转载。
Jserv的Blog看来的,比较原始的找到了Mozillazine的一个Blog,Gervase Markham说明这件工作已经完成,可以用来庆祝Mozilla的第8个生日了。

从现在起,再使用Mozilla的源代码的话,就完全可以自由地采用MPL、GPL甚至LGPL这三种开源授权协议中的任何一种了。Debian社区再改起Firefox代码的话应该更没有问题了。

这么宽泛的代码授权协议,相信会刺激程序员们对这些代码的利用吧,希望能有更好的产品出现。毕竟Mozilla的东西做为平台来讲确实是很不错的。

Gervase Markham同时提醒:这个协议变更仅限源代码,编好的Firefox和Thunderbird还按自己的协议发布;使用这些协议的代码,就要遵守相应的规定,同时也要小心自己编写的与这些代码放在一起的代码(比如连接GPL的代码将成为GPL的衍生作品);如果有可能,还是把自己改动的以及自己写的代码同样地以这三种协议放出来,而不只是用自己采用的那一种协议。

04/03/06 12:37:12,由 cathayan发表。 本文链接

Debian的 alternatives 系统

cathayan.org版权所有,保留一切权利。转载请保留此说明。谢绝商业转载。
我一直用Xfce4桌面,刚开始浏览器也只装了Firefox,所以缺省的浏览器肯定是它,但凡用得着浏览器的地方都会自动调用它。前些天因为想看看最新的Gnome和KDE,就装上了,之后缺省的浏览器就变成Konqueror,点击其他程序里的链接就变成了用Konqueror来打开,比如Xfce4的帮助就是。

设定缺省浏览器不同系统有不同的作法。在Windows上面程序自己要做出设定缺省浏览器的请求,然后会被记录下来,后来可能用户向微软反映得多了,微软就专门加了个设定缺省程序的功能,放在控制面板里。在Unix类系统中,设定系统环境变量是不二法门,export BROWSER=,在有些地方是这样的,或者export EDITOR=等等。

但在Debian中,有个专门的系统,称为alternatives,就专门管理这件事,其实也就是个系统范围的程序连接,把某个通用的名字连接到某个具体的程序,这样其他程序如果要调用它们就只用写最通用的名字,而不必管它到底是谁,比如可以指定cc是gcc,edit是vim,vi还是vim,ftp实际上是gftp.txt等。

管理这个工作的软件是update-alternatives,需要root权限来运行,涉及此系统的软件在安装后会自动调用它来进行设置。但如果一个项目有多个软件,那到底指定谁呢?这里又有个优先级,谁高就设定谁,比如在x-www-browser这个项目上,firefox和konqueror或者gnome的epiphany之间,似乎Konqueror设定的优先级就比较高,使用自动设定的话就是它,命令是:update-alternatives --auto x-www-browser。

修改这个设定的命令是: update-alternatives --set x-www-browser /usr/bin/firefox 。这就把缺省的浏览器设定为firefox了。

手工添加某程序的其他选择:update-alternatives --install /usr/bin/x-www-browser x-www-browser /usr/bin/firefox 50

其中第一个/usr/bin/x-www-browser是普通的程序员,系统中可以引用的,第2个www是alternatives系统下的名字,第三个指向要运行的程序的名字,最后的50是优先级。



其他常用的还有java的设定,如果新装了jdk,并且不是deb包的话,用update-alternatives也能在系统中设定java和javac指向哪里。

04/03/06 00:01:00,由 cathayan发表。 本文链接

我的E-Mail


Copy&Paste Exchange

访问CPeX Group

订阅Feed

订阅Feedburner
Feedsky订阅
本站订阅

请登录

导航

cathayan.org Web

最新贴

RIME 小狼毫/鼠须管的极点及五笔拼音配置
Software that rocks or sucks less
一棵热带的树换新叶的过程
几个有用的Vim招术
论语七 述而
Nomacs 图像浏览器
Windows 文件校验
Windows 10 文件批量命名简单方法
Windows 10 文件删除高级操作
本站也算是有响应式设计了

最新评论

Powered by

Powered by Nucleus CMS

版权声明

Creative Commons License
Blog on 27th floor by Cathayan is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 3.0 Unported License.
Powered by Nucleus CMS v3.71. Best view with Mozilla browsers.