做为发行量很大的IT开发人员工具参考书出版商,O'Reilly的书往往紧跟开发人员的需求,与时俱进,一版而再版,这本《精通正则表达式》已经是第三版了,看了一下目录:
增加了对Unicode的支持;
增加了不少在新语言环境中的运用介绍: PHP、Java、dotNET等(Ruby没有单独列出一章只是讲原理的时候提到);
利用正则表达式可以方便的解决大量文本高级替换整理工作:从把文章中的华氏度换成摄制度到按照指定公式生成各种统计报表,而最近几年:搜索引擎对于互联网的影响加大,为了更好的伺候搜索引擎蜘蛛和机器人,连SEO的培训中:往往也会增加基于正则表达式的url rewrite一节。所以这里向原作者提个建议:希望在下一版中增加基于Apache的mod_rewrite进行URL rewriting一章,相信会吸引更多的LAMP开发人员。
《精通正则表达式》第三版(中文) 的翻译者是余晟(目前在抓虾工作)。本书发行后,译者会在blog上开辟一个专门的勘误专区吧……
我个人的一些使用感受附后: 最后希望大家支持正版,远离盗版非法电子书下载;
开发人员多少都应该学点正则表达式:
第一次学正则表达式是从《Perl5编程详解》,书里介绍:正则表达式在一些大学是门软件选修课(一个学期),价值1000$美元左右。其实对于软件开发人员来说这门课非常实用:因为正则表达式在各种语言中都有相应的实现,规则通用。即使对于正则表达式并不是你开发工作中非常重要工具的开发人员来说,也还是值得将其中实例章节读一遍的。相信如果你发现一些文本处理问题如果能通过简单的正则表达式来解决的话,还是可以为你节省不少开发程序时间的。尤其是可以不用写多行程序/脚本,用perl在一行命令(oneline / oneliner)就可以解决了。而且,通过对正则表达式的运用,可以让开发人员懂得什么样需求更适合让计算机解决。
对于复杂的表达式注意注释和测试用例的积累:
正则表达式语法灵活多变,一点差别往往会带来很大的差异,所以一定数量的注释还是很重要的,帮助你自己在几个月以后再看代码,可以很快的其他的维护者,保留相应的测试case还是很重要的,是否是单元测试不重要,哪怕代码后面多写几个test() 运行一下也好。
去搜索引擎上搜搜有没有类似例子可参考:
我收藏的通过正则表达式进行UrlEncode和UrlDecode,在中文的关键词搜索日志统计分析中会经常用到。而这些现成的方法,也是从一些开发者共享代码中添加的注释才搜索到的。
版权声明:可以转载,转载时请务必以超链接形式标明文章 O'Reilly《精通正则表达式》第三版(中文) [书评] 的原始出处和作者信息及本版权声明。
http://www.chedong.com/blog/archives/001379.html
Comments
去年的时候,好不容易把正则表达式弄了个大概明白,结果好久不用,今年全忘掉啦:(
由: shizhao 发表于 2007年09月12日 傍晚07时38分
已经下单了,挖哈哈哈~~XD
由: 沈蚊 发表于 2007年09月13日 上午10时03分
在网上看到一个入门版的
http://www.unibetter.com/deerchao/zhengzhe-biaodashi-jiaocheng-se.htm
我接触正则是做编辑的时候,有时会处理一些文档,用的最多的就是转义符/n和/t~~XD
由: 沈蚊 发表于 2007年09月13日 下午12时13分
如果是原创就更要支持了.
由: anysql 发表于 2007年09月13日 下午12时38分
承蒙推荐
勘误已经发布,地址在:
http://www.luanxiang.org/blog/?p=202
请大家多提意见
由: Yurii 发表于 2007年09月14日 上午11时06分
还一篇老帖子,《正则表达式之道》
http://net.pku.edu.cn/~yhf/tao_regexps_zh.html
由: 沈蚊 发表于 2007年09月17日 下午04时46分
:-),呵呵,
markup。
----------
正则表达式,确实有非凡的用户,虽然不能算是高度的抽象,但可以看到“类” 。
由: qualylee 发表于 2007年09月18日 晚上09时05分
实在是太感谢了
由: heqingqing 发表于 2009年06月30日 上午09时33分