AI一键识别图表、数据,让名校博士7年的工作量降为2个星期

有个问题问各位网友们:你们有没有接到过这样的工作:将一张纸质材料中的表格数据手动输入转化为电子版材料,类似这样的数据?

可能有网友说:这还不简单,我十分钟搞定!

那如果让你输入十万份呢?

摞在一起大概三层楼那么高吧。

如果你在工作中接到这样的工作会不会觉得:这不是流水线上的活儿吗?有知识的人谁做这个?

诶,告诉大家,接到这样的工作任务的一群人不仅是一群有知识的人,还是国内TOP级名校的一群博士……


堂堂天之骄子寒窗苦读几十年居然要做这种不能创造任何价值的重复性工作,别说他们心里阴影面积大,我都觉得浪费人才!

这就是我本期为大家介绍的案例:

某top级大学课题组收到的任务——将10万册现有的长江流域水文年鉴文献复印件中的图表数据进行手动输入形成电子数据并做统计分析,所有工作必须在2个月之内完成。

不吹不黑,我们客观来分析一下实现的可能性:

就平均数据而言,每张表格录入时间一般需要20min,10万张表格就是200万min,约等于3.3万小时,也就是一个人需要每天12小时不吃不喝不眨眼录入7年2个月才能完成;

必须在2个月完成的话,则需要46个人每天工作12小时不吃不喝不眨眼才能完成!

这一切假设都建立在所有人员不出任何错误,不做任何审核工作的基础之上!(这种情况几乎不存在)

工程量之大、人工耗费程度、繁杂程度简直令人叹服!

最后走投无路的项目组负责人只好向AI求助。

路见不平(钱给到位),AI必会拔刀相助(头秃也愿意)!

我说过,高度消耗人工、重复性高的工作请你第一时间想到AI,这种情况下它几乎不会让你失望。

其实AI解决原理很简单:

构建以OCR底层算法为基础的校验工作台,左边是PDF扫描件原文,右边是通过 OCR 结构化输出的表格数据校验工作台,人工可以对算法识别出来的结果进行对照审核,修改,保存,系统可对识别置信度不高的部分进行高亮提醒最终结果可以一键导出生成Excel文件。

听懂了吗?没有是吗?

来看看操作步骤吧:

首先我们需要用扫描仪将十万份数据表格全部扫描储存在一个文件夹中;

像这样

其次用OCR识别。(别管它是啥,反正你那一堆压缩包的扫描文件,它会识别)

它不仅会识别,而且会帮你识别错误,比如它觉得“黄浦江”信度较低(错误率高),就会高亮度显示,提醒你:老板这里是不是错了?

高亮提醒

针对这部分我们可以手动迅速修改而不是漫无目的审核……

最后,它不仅帮你做录入,还会帮你把数据储存好,反馈后台,模型可收集Badcase进行学习优化。并且可以自动生成表格数据的折线图等,辅助校对,提高校对效率。例如数值波动较大,则可能对应值识别结果有误。更直观。

在完成录入和修改后,后点击数据列表右侧的导出按钮;就可以对数据进行导出了!

当然你还可以打包成一个压缩包批量导出。

导出结果

如此以来,表格加工效率由原来单个表格的20-60分钟,节省至3-8分钟,一个人仅用2周就可完成10多万份的水文表格数字化的工作了!刚刚咱们算的这可是一个人工作7年的工作量诶!


这套系统当然也不止可以用于解决表格数据的录入问题,还可识别整理招投标文档、合同类文档、企业内部各类手册、产品说明文档、各类统计报表、论文期刊等内容复杂,字数多,基数大的文件。

节省时间,缩短工期,减少出错率,节省人力成本……对老板们来说不要太香!

不过即便再智能的AI系统,也替代不了人脑,就算工作效率高,也是需要人来操作为人类服务的。AI做的不过是暂时的解放人的双手,将一部分人从毫无意义的机械性工作中解放出来,让他们去做更有价值的工作。像这种无意义无价值但又不得不做的工作,记得记得想起我和AI。我是深耕AI多年的产品人老张,下期继续为大家分享AI实用案例。

发表评论
留言与评论(共有 0 条评论) “”
   
验证码:

相关文章

推荐文章