您的位置 首页 > 数码极客

【白描app】那些不错的小众软件 篇二:一个不断趋近完美的ocr软件——白描

本内容来源于@什么值得买APP,观点仅代表作者本人 |作者:拉德布鲁赫信徒

1 引言

关于白描这个软件的使用,可能从它刚出来就开始了。一开始,白描只有手机端的软件,但是在那个ocr软件较少的年代,其简洁的界面,简单易用的体验,瞬间就get到了我的痛点。与当时很多软件不同的是,它在识别之后可以自行选择自己需要的文字,可以复制到剪贴板或者直接导出为txt文件。

但是,在后来不断变换的使用场景中,白描的劣势就逐步凸显出来了。由于其只支持移动端,在pc端需要识别的时候,还得截图并且分享到手机让它来进行识别,再把识别的结果再次粘贴回电脑,一来二去,也就慢慢把其使用场景限定到了移动端使用。

期间,pc端也不断冒出很多优秀的ocr软件,如天若ocr、panda ocr等等优秀的国产软件。但是缺点在于,对于设备的支持并不全,这一类软件通常使用场景限定于pc端,而且通常限制了每日的识别次数(虽然每天可能用不到那么多,但是有时候翻阅电子版pdf或者文献的时候就难免会超出次数限制),这个就比较鸡肋了,我可以用不到,但你不可以没有。

到后来随着paddle ocr模型和各大厂商的ocr方案的盛行,各种各样的产品也逐渐丰富了起来,但是大多都是内嵌在自家app中的。比如说百度网盘或者微信这种的,你想要识别一张图片,就必须打开这个软件,找到ocr功能的专区,拖入图片,进行识别。虽然说不限次数了,但是这种体验完全称不上完美。

横向来说,虽然很多国产的ocr软件开始支持离线模型,如cnocr或者paddleocr,但是在下载的时候还得一并下载对应的模型,然后还得再设置好对应的路径,无形中增加了太多的使用成本。

为了解决接口次数的限制,如天若ocr这类软件已经开放了自定义的接口,如可以去百度购买一定的次数包,根据自己的需求来进行调用。但是,随着ocr这项技术的发展,识别的场景已经不仅限于识别图片中的文字,很多时候需要识别表格的时候,单一购买百度的ocr接口是不能满足需求的,还得再行购买识别表格的次数包,这也增加了太多的使用成本,还得不定期关注次数包的使用情形(虽然买一次能用很久,但是想到还要为了维护这个而耗费精力觉得实在优点不值当)。

在近期,突然看到了白描支持pc端了,不仅仅支持windows,就连mac os都支持了,这不就直接实现了软件层面的all in one了嘛!只需要一个软件,不管在任何设备上都可以拥有相同的使用体验。而且,这个会员只需要30元,一杯奶茶钱,终身无限次的识别图片以及表格,而且所有平台只需要购买这一个会员就可以了(笔者在刚推出会员的时候就已经购买了),这就是花小钱办大事了。

2 使用介绍

2.1 功能简介

这部分由于偷懒就不想自己截图了,直接把官网的图搬运过来了,大家见谅。

生成扫描件

这一部分功能主要是可以生成一个清晰的扫描件,而且可以自动切分边界,也是实现了扫描全能王的核心功能。

文字识别

对于这一部分而言,识别准确率一直都是处于非常高的水平,无需担心。笔者认为比较好的一点在于,这个可以自行选择自己需要识别的部分,仅选取这一部分所识别出来的文字。

表格识别

这一部分也是笔者最近用的比较多的功能,而且也是很多其他同类软件所缺失的部分,经过识别可以直接导出excel文件,对于财务人员以及日常接触很多表格文件的朋友也算是福音了。

快捷方式识别

这一部分的使用场景主要就是在手机上,能够将图片直接通过快捷方式进行识别,都无需先打开软件再选中图片。

翻译

这个功能其实日常也是非常实用。笔者当初论文写作的时候,由于对日文一窍不通,但是相关文献只有日文的比较多,通过这个软件识别后直接将日文转换为中文,就变成了可以阅读的文献了。

扫描边界

这一点算是扫描全能王的核心功能了,实现的是只识别所需要的区域,从而排除背景环境的影响。

批量识别

有了这个功能,白描就正式成为了一个相对覆盖全场景的ocr软件了,既可以识别单图,也可以批量识别很多图片。比起那些只支持单一功能的ocr软件,这一点算是做的非常到位了。

校对

这一点,绝对能够力压很多同类产品了,可以对识别结果进行同步校对,保证输出结果的高度准确性。

同步识别

这一点在pc端推出之后,已经没有其存在的意义了。在此不赘述。

2.2 电脑端实际使用体验

正常界面

可以看到,这个软件的电脑端支持的不仅仅包括表格识别、文字识别,甚至还包括了公式识别。

设置界面

设置界面除了提供快速截图识别的快捷键设置外,还提供了多种选项可以选择,这一点基本覆盖了天若ocr的使用场景。

文字识别测试:

文字识别

图片文字的识别还是非常准确的,基本没有错误,除了支持导出到剪贴板外,还支持导出为txt文件和docx格式word文档。

表格识别测试:

这里用值得买公司的高管信息进行测试

测试用图

识别结果1

识别结果2

导出excel后,可以看到,除了第一列干扰信息过多导致的原因外,基本的格式还是保留的较为完整的。

公式识别:

这里用微积分的公式进行测试

微积分公式

识别结果3

可以看出,对公式的识别结果还是较为完美的。

忘了说的一点在于,这个不但支持导入图片进行识别,也可以在截图之后粘贴进行识别。

3 总结

笔者之前也有折腾过paddleocr的识别,也想过去折腾百度新出的pp-structure表格识别,但是在某一天发现这个软件之后,发现好像完全没有折腾的必要了。

因此,在国庆的最后一天,为大家推荐一下这个软件。好的软件,总是需要收费,才能保证其功能的不断完善,相对于折腾所耗费的时间,倒不妨花小钱办大事了。

希望大家在国庆后的工作生活中,此软件能够助力学习工作,实现效率的提升。

本文无利益相关,买这个会员少说也是五六年前的事情了,只是单纯觉得这款软件不错才加以推荐。

作者声明本文无利益相关,欢迎值友理性交流,和谐讨论~

责任编辑: 鲁达

1.内容基于多重复合算法人工智能语言模型创作,旨在以深度学习研究为目的传播信息知识,内容观点与本网站无关,反馈举报请
2.仅供读者参考,本网站未对该内容进行证实,对其原创性、真实性、完整性、及时性不作任何保证;
3.本站属于非营利性站点无毒无广告,请读者放心使用!

“白描app,白描app下载,白描app官网”边界阅读