kots's profile光荣与梦想——永远的CCCPPhotosBlogListsMore ![]() | Help |
|
September 25 弄到本《古星图之谜》 大概是小学的时候看过一本书,讲的是考古队员根据考古发现,找到外星人留下的一个铜球,最后再找到外星人的故事。那书是从父母所在工厂的工会图书馆借的。经过这么多年,具体情节和书名早已忘记,只是模模糊糊记得这个故事,还有故事里神奇的铜球——外星人的天球仪。 September 24 搞笑的当当网 周五在当当下了一单,用招行支付卡付的钱。结果周日再次查询,发现订单状态是“退货中”…… September 07 用数码相机做OCR很久以前在一本书上看到过一部小说叫做“在时间的铅幕后面”,当时就觉得非常好看。后来在《科幻世界》上又看到这部小说的缩写版,于是就想弄份电子版本。但是网上一直都只有小说的开头部分。没办法,只有借来书自己打字。当然打字是很慢的,所以坚持了一阵就放弃了。 去年买了个DC,Canon A530。无意中竟在网上看到用DC当扫描仪用的文章,于是就想试试。 找来书和OCR软件(我用的是尚书七号),还有图象处理软件GIMP(PS是怎么学都不会),开工! 首先用DC+闪光灯拍,然后用GIMP做旋转,再转为灰度图象。最后估摸着调整一下亮度和对比度,再用尚书扫描。但是识别率不是很高。加之图片的下半部分居然有曝光不足的现象,结果是把上面调好了,下面就黑了,调了下面,上面的字笔划又模糊了(其实是因为亮度太高引起的)。不得不分两次来处理同一张图片,很麻烦。 处理了一些页后,突然想到可以用台灯提供均匀的光线,于是回去试了试。效果果然好了不少。但是有时还是不行。 最后,无意中打开尚书的帮助文件,发现里面提到了手动分析功能。一试之下,果然效果非凡。只需稍微调整一下亮度和对比,再拉上几个识别框,出来的文本正确率可以达到90%! 总结:拍照时光线要均匀,图片先做些预处理,可以提高识别率。对于书籍,应该尽量使用手动版面分析。 |
|
|