原标题:合合信息斩获ICPR2020大赛11项冠军 持续领跑OCR领域
近日,国际模式识别大会(ICPR2020)在意大利落下帷幕,各项挑战赛的获奖名单也全部揭晓。在图表信息提取(ICPR 2020-CHART-Infographics)国际竞赛中,上海合合信息科技股份公司(以下简称:合合信息)联合华南理工大学、联想研究院共同组队,斩获了所有七个赛道14个子任务中的11个冠军,充分展现了合合信息在人工智能领域已达到世界领先水平,并获得了业界的权威认可。
合合信息最终斩获了所有七个赛道14个子任务中的11个冠军ICPR 大会是模式识别领域的顶级国际会议,已有50年历史,涵盖了计算机视觉、图标、声音、机器智能等多个领域。大会吸引了来自全球56个国家和地区的科研人员和机构,包括科大讯飞、搜狗、深兰科技、美团视觉中心、印度理工学院Ropar研究院、布法罗大学等国内外的高校、企业和科研机构参与。
其中,图表信息提取竞赛在本次大会中倍受瞩目。据了解,复杂图表信息提取是人工智能领域内一个很新的研究领域,其目标是将各式各样的图表(见图1)自动的提取转化成原始的表格数据(见图2),以利于做进一步的深入分析和挖掘。由于整个任务场景复杂难度大,因此举办方将整个任务划分为6个子任务以及1个端到端任务,涵盖图表分类、图表文本识别、文本功能分类、轴分析、图例分析、图元素提取等。最终,合合信息获得了11项冠军,并完成了端到端任务。合合科技相关负责人表示:“端到端任务需要整合所有的技术,是最难,但也是最有实用价值的任务,是综合实力的体现。我们所在的队伍是唯一一支完成端到端任务的团队。”
src="https://p8.itc.cn/images01/20210122/8363c0614e3348789d8ffe363942a59d.png" width=500 height=177>
各种类型的图表数据举例
图表信息提取任务最终结果可视化图表作为一种广泛使用的交流和展示工具,在很多应用场景具有广泛的商业应用价值,具有极大的社会意义。但复杂、多场景的图表识别与理解一直是一个全球性技术难题。合合信息利用自主研发的AI深度学习识别及计算机视觉等人工智能技术,提出了一系列领先的解决方案,并将这些方案落实到实际应用中。
此前,合合信息已多次在国际顶尖AI竞赛中获得世界冠军,如ICDAR票据识别竞赛冠军、ICDAR表格识别竞赛冠军、ICFHR签名识别与鉴别竞赛等。以票据检测和识别技术为例,合合信息票据机器人从采集票据、智能分类、票据切分、票面信息精准识别到增值税发票一键验真,覆盖全流程,整合图像增强、OCR识别、NLP语义分析等技术,让票据识别更智能,更便捷,赋予机器人文字阅读与思考能力,实现业务流程提速,赋能企业完成自动化智能升级转型。数据显示,使用合合信息票股机器人进行票据采集,全流程可以从原先的3天减少至2小时之内完成,节约95%的时间成本。
作为一家全球领先的人工智能及大数据科技企业,合合信息致力于通过智能文字识别及商业大数据领域的核心技术、C端和B端产品以及行业解决方案为全球企业和个人用户提供创新的数字化、智能化服务。旗下C端产品覆盖全球百余个国家和地区的亿级用户。B端产品已经为银行、保险、证券、物流、制造、地产等近30个行业提供提供服务,致力成为成为美好数字社会的重要建设者。