kots's profile光荣与梦想——永远的CCCPPhotosBlogListsMore Tools Help

Blog


    September 25

    弄到本《古星图之谜》

      大概是小学的时候看过一本书,讲的是考古队员根据考古发现,找到外星人留下的一个铜球,最后再找到外星人的故事。那书是从父母所在工厂的工会图书馆借的。经过这么多年,具体情节和书名早已忘记,只是模模糊糊记得这个故事,还有故事里神奇的铜球——外星人的天球仪。
      前段时间,突然想起这个故事,一顿狂搜后无果。后来又试着用“铜球”做关键字搜索,这才发现,原来自己多年以前看的,竟然是一部很有代表性的长篇科幻小说!对科幻小说的爱好,想来就是从那时候开始的。
      这书是80年代初出的,现在要找恐怕只有去找卖旧书的了。不过很幸运,没费太大力气就邮购到一本,跑了趟邮局领回来。书保存得还可以,只是一些地方有磨损,和卖家的描述不符,内页倒是很完整,仅有一页撕破。^_^
      也许什么时候做个OCR,但是书太厚了,400多页啊~~

    September 24

    搞笑的当当网

      周五在当当下了一单,用招行支付卡付的钱。结果周日再次查询,发现订单状态是“退货中”……
      囧……
      和当当联系得知因为某书(不到6块钱)无货,作部分退款处理。
      当当的动作倒挺快,今天下午就把东西送过来了。但是查看银行账户,发现没有退款,于是再次联系。被客服告知居然是通过邮局退款的!顿时不得不拜服于当当的伟大。按照网站上的帮助,我那钱应该是退到银行卡的。而且当当给出的三种退款方式里根本没有邮局这项……
      6块钱,要我跑一次3公里以外的邮局。
      再次拜一下当当的创造性~囧rz

    September 07

    用数码相机做OCR

      很久以前在一本书上看到过一部小说叫做“在时间的铅幕后面”,当时就觉得非常好看。后来在《科幻世界》上又看到这部小说的缩写版,于是就想弄份电子版本。但是网上一直都只有小说的开头部分。没办法,只有借来书自己打字。当然打字是很慢的,所以坚持了一阵就放弃了。

      去年买了个DC,Canon A530。无意中竟在网上看到用DC当扫描仪用的文章,于是就想试试。

      找来书和OCR软件(我用的是尚书七号),还有图象处理软件GIMP(PS是怎么学都不会),开工!

      首先用DC+闪光灯拍,然后用GIMP做旋转,再转为灰度图象。最后估摸着调整一下亮度和对比度,再用尚书扫描。但是识别率不是很高。加之图片的下半部分居然有曝光不足的现象,结果是把上面调好了,下面就黑了,调了下面,上面的字笔划又模糊了(其实是因为亮度太高引起的)。不得不分两次来处理同一张图片,很麻烦。

      处理了一些页后,突然想到可以用台灯提供均匀的光线,于是回去试了试。效果果然好了不少。但是有时还是不行。

      最后,无意中打开尚书的帮助文件,发现里面提到了手动分析功能。一试之下,果然效果非凡。只需稍微调整一下亮度和对比,再拉上几个识别框,出来的文本正确率可以达到90%!

      总结:拍照时光线要均匀,图片先做些预处理,可以提高识别率。对于书籍,应该尽量使用手动版面分析。