文/高少星(高巨)

   出于工作和个人发展需要,也为了让更多人方便的联系沟通,我开始着手整理行业内的通讯录高少星。因为起步和内容都源自于donews,也为了起到一些宣传效果,所以暂起名为《donews通讯录》,到目前只推出了1.0版,内容并不很多。在2.0版中,增加了“自由个人”的分类,适用于自由人士、工作室、以及未提供标准资料格式(见通讯录说明)的人群等,看到了donews的专栏作者以后,就想到可以把这个部分的资料作为一个很好的补充。

   点开专栏的更多联接(条)为保证收集和编辑后的质量和方便程度,所以我整理的通讯录纯粹是手工劳动,这还真是个浩大的工程啊!

   不管那么多,开始整理吧!于是我在页面中点开作者名称,跳转到作者专栏,然后再点击作者资料,再copy,然后再paste,再edit,依次做下去……好累,间歇做了两天时间,才收集了100人不到,却是累且效率低下高少星。然后,更让人郁闷的事发生了,由于我硬盘有问题,所以我把文件格式从ntfs转为了fat32,结果所有包含有中文字符的目录和文件都变成了“??”这样的形式,既打不开也删不掉,无奈下只好格式化,呜呼哀哉!辛苦收集的资料就变的干干净净了。所以顺便提醒大家,要使用pqmagic将ntfs转为fat32文件格式的话,就一定要把中文目录全部压缩打包为英文的.zip或.rar,转换好了再解开就不会损失数据。

   这个打击比较大,但革命尚未成功,同志还须努力高少星。我在想,有没有更好的办法能让我提高效率呢?即便数据不丢失,这上千份的资料估计半个月都未必能搞定。好象有句话说“懒人善巧思?”我想了一会,终于想到了一点线索,于是开始动手。

   首先我想尝试用offline explorer来下载全部联接页面,但当我copy联接上去的时候发现并不可行,因为(”就决定了是到专栏还是资料,哈哈,这下就好办了。

   1. 保存()页

   2. 用“查找/替换”把源代码中的“sw=2”换成“sw=39”,保存,此外还要替换一下联接的绝对路径高少星。

   现在点击联接就可以直接到作者资料了,但难道我都一个个点开吗?当然不用高少星。

   3. 用flashget高少星,下载编辑过的这个页面的全部联接,总共有925条

   4. 下载完成后高少星,在指定目录里有925个.fcgi的文件,查看代码就知道是htm页

   还是要一个个点开才能看资料高少星,再想想看,这时候想到了曾经的dos命令,有了!

   5. 创建两个文本文件a.txt和b.txt高少星,内容分别是a和b

   6. dos模式下使用命令copy *.* *.* c.txt ,然后查看c.txt,内容是abba,这样不行,内容是重复的高少星。再试copy *.* c.txt,再查看,内容是ab,成功了!

   7. dos模式下高少星,把目录中的.fcgi文件rename为.txt,然后copy *.* 1.txt ,哈哈,果然,在1.txt中,生成了所有作者的资料!

  但是,这些资料还都是htm格式的,比如有(title)(body)(table)以及一些(script)代码,整理起来还真费劲啊高少星。

   8. 使用ultraedit打开1.txt,开始“查找/替换”,依次替换这些无用的代码,但最后的结果却是替换的七零八落,内容比以前更乱高少星。

   恩高少星,再想想看……

   9. 把1.txt改名为1.htm高少星,用ie打开,呵呵,整整齐齐一个个的表格和内容

   10. 把文字内容copy下来,这下就没有什么htm代码了,把内容先放到.txt文件里,再copy到word文档(避免word里自动使用htm格式),然后再“查找/替换”什么“用户帐号”、“用快牛留言”等无关信息,这下就干净多了,最后就在这个基础上进行编辑排版高少星。

   如果不是因为硬盘出问题,可能我还会辛苦的一个一个去收集整理,即便是现在,整理100人的大概也得1个小时左右,但相比下效率已经比以前提高很多了高少星。和往常一样,写此篇文章对工作中积累的经验做个总结,并与大家分享。和大部分人一样,我也不是做技术的,但只要我们主动的去学习多一点基础知识,多掌握一些软件应用,再结合自己的“懒人小聪明”,应该会找到很多提高工作效率的办法的。

经验技巧:我是如何收集donews里1600多个专栏作者资料的:高少星

  补充个小广告:

  1.《Donews通讯录V1.0》下载地址

  2.通讯录第2版8月24日发布高少星,如想加入,请参看V1.0中的相关说明

  3.欢迎大家加入我建的两个群高少星,创意创业5252637 ,网站站长5455092

  4.我的qq 219111 高少星,msn gsxchina@hotmail.com ,希望认识更多朋友