探营2021世界人工智能大会:合合信息,从识别甲骨文到“数字大脑”

  • 2021-07-07 17:50
  • 央广网

  7月7日消息 拿起展台上篆刻着形象丰富的甲骨文龟甲,打开高扫仪进行识别提取与翻译:“单身狗”、“白富美”、“买它买它”,这样一些流行网络热词被识别翻译出来,令人忍俊不禁。原来甲骨文也可以萌萌哒。这是本届世界人工智能大会上,由智能文字识别领域头部企业——合合信息所展示的热门“黑科技”之一。

  甲骨文背后的“智能文字识别”技术

  甲骨文,最早出现于3400多年前的商朝。是中国发现最早的象形文字。当时的王室贵族为了占卜和记事,将“文字”契刻在龟甲和兽骨上,图案种类十分丰富,同时又透露着古代文化的神秘。由甲骨文引发对中国古文字的破解,对中国考古学具有划时代的意义。如今,合合信息借助AI技术,用数字化的方式尝试破解更多甲骨文背后的世界。

  “这一技术我们还处于内测阶段,也是首次在人工智能大会上展示。”位于上海世博展览馆H1馆A1024展台的合合信息相关负责人告诉记者,甲骨文作为珍贵文物,曾与汉晋木简、敦煌文书、明清档案一起被誉为中国近代学术史的“四大发现”,此次合合信息专为甲骨文识别开发了新的系统,通过大量数据的生产识别、图像聚类和主动学习等一系列技术算法,对甲骨文字进行检测与识别并翻译成现代汉字,不仅将甲骨文研究资料电子化、数据化,也拉近了年轻人与中华文化的距离。

  识别甲骨文,仅是合合信息对于智能文字识别领域一个分支的尝试性探索。此负责人表示,上海世界人工智能大会(WAIC)已经成功举办三届,今年合合信息紧扣大会方向,以“AI读懂文字信息”为主题,将在大会期间向外界展示公司在人工智能领域的更多研究新成果。
  人工智能是上海落实国家战略部署、重点发展的三大先导产业之一,在这片沃土上,近年来人工智能领域出现了许多创新场景和前沿进展。合合信息作为上海本土科技企业代表,2019和2020年成功在世界人工智能大会举办金融科技落地论坛,并先后邀请两位诺贝尔奖获得者参与发言。

  据了解,当前合合信息的智能文字识别技术,支持中、英、俄等56种语言的文档图像、100+种证件的快读智能分类,以及全球不同国家、不同行业的卡证、票据、定制识别等多个AI场景的产品和解决方案。全球累计用户下载量超23亿,合作企业已经遍布各行各业。

  能落地的黑科技,才是硬科技

  让黑科技落地,才是技术的精髓。“无论多么炫酷的黑科技,能真实服务我们生活的都是硬科技,比如名片录入,原来录一张名片要花上几分钟,现在几秒钟就可以,这是个数量级的变化,能带来10倍的好处才能吸引客户。”合合信息相关负责人这样解释。

  他所说的正是合合信息2006年开发的一款产品——名片全能王。这是一款智能名片及人脉管理工具,可将复杂场景下的纸质名片一秒读懂,字符识别率平均值达99.43%。同时升级版本如数字名片,能够多语言精准识别、一秒保存到手机,是用户人脉智能管理的一个“利器”。这款产品也为合合信息打开了美国、日本、印度等全球市场。

  “扫描全能王”是合合信息全球用户最多的一款产品。它不仅集文件扫描、证件扫描、图片文字提取识别、PDF 内容编辑、电子签名等功能于一体,也是一款非常实用的随身扫描仪,移动的文件资源库。这款产品在 Apple Store 125 个国家和地区效率类免费应用总下载量排名第一。

  不得不提的还有“启信宝”,合合信息启信宝是2015年上线的一款基于合合商业大数据平台的企业信息查询APP,主要为泛金融、泛法务、泛商务、政务等行业的职场用人群,提供企业查询、商业尽调、风险合规、营销拓客、企业服务等场景下的数据服务。

  除了以上三款C端产品,合合信息基于文字识别加大数据衍生出的“数字客商平台”、“企业智能解决方案”,也积极为企业降本增效,资产数字化升级提供赋能,更多应用场景实现落地。

  以客户关系管理场景为例,合合信息为德国软件公司SAP提供供应商智能风控、财务进销项应收应付以及费控管理等场景助力企业数字化升级。集成合合信息CamCard名片识别功能的SAP C/4HANA具备“快、准、多、全、实时”等五大特点,为企业解决了海量名片快速识别,帮助业务人员快速把名片上的信息保存成SAP账户管理系统中的线索。数据显示,使用该系统后名片录入时间可以从3天减少至15分钟,相关业务部门可以100%摆脱手工录入,人力成本节约57%。

 斩获ICPR2020大赛11项冠军,“看不见的”技术软实力

  “看得见的王者,看不见的力量”。一家企业背后“看不见的”技术力量是决定王者风范的真正要素。

  作为智能文字识别领军企业,看起来平平无奇的智能识别技术,背后是获得过国际级大奖的技术团队。合合信息的创始团队都是技术出身,从而建立起技术先发优势。在合合信息的人才架构中有一个博士团队:负责未来3-5年科技的发展趋势,确保在技术上的领先性和前瞻性。

  这支团队在2020年举办的国际模式识别大会(ICPR2020)上,被誉为“冠军收割机”。曾联合华南理工大学、联想研究院共同组队,斩获了所有七个赛道14个子任务中的11个冠军。据公开资料,合合信息目前拥有100余项世界领先、自主知识产权的发明专利,境外专利超30项,是Google Top Developer全球顶尖开发者。
  值得关注的是,展会上合合信息另一大产品亮点也吸引很多人关注。现场,合合信息还向外界发布了“数字政务大脑”,基于其商业大数据平台,对全量企业、全产业链和区域经济进行多维度政企数据融合、分析、挖掘。对协助政府部门精准招商,实时了解区域经济动态和企业信息,辅助政务部门从被动了解消息到主动管理服务具有重要意义。

  帮助政府和更多的企业整理、转化数字资产,正是合合信息下一步的发展思路。毫无疑问,合合信息通过“AI+大数据”为商业数据和现代企业赋能,在智能文字识别领域将继续领跑,未来发展前景不容小觑。

头条推荐
图文推荐