我看到很多网上的文章大家都是ctrl-V出来的,互相拷贝粘贴过来。其实很多书里有比较好的内容,互相抄还不如去抄书里的内容。如何将书中的内容摘抄出来呢?其实不是很难。
如果你是用扫描仪去扫描书籍的话,可能会比较辛苦。如果你有超星的帐户的话,事情就比较简单了。超星里有不少书。
第一,将你选中的内容截图下来。影响识别率的两个关键因素:一个是图要大,二是字体要够黑够粗。所以截下的图一定要做处理,一是要放大,二是选择合适黑白参数值,它大大影响你的识别正确率,解决以上两个问题就能达到95%-99%识别正确率。
第二,用文字识别软件进行识别。我用的是尚书6.0,没有使用过别的软件,(超星自带的识别软件据说很烂,我没有试验过)。我觉得尚书的效果应该是不错的,识别率一般都在95%以上,需要更正的地方不多。识别的关键是定义合适的识别框。
第三,就是要校正。尚书中的校正还行,上边是识别出来的文字,下边就是扫描的图形,一个字对一个字。旁边有供选的其他字,点击就可纠正。
这样识别10页左右的文字,2个小时就可搞定。如果要把插图都放上的话就比较费事了。
希望大家都能来贡献些资料。 |