达观数据:做中国智能办公机器人专家

2021年01月06日15:54  来源:人民网-上海频道
 

人民网上海1月6日电(唐小丽)  中国人工智能领域最高奖“吴文俊人工智能科学技术奖”、连续三年获得“创业在上海”国际创新创业大赛立项、高新技术企业、科技小巨人培育企业、ACM CIKM Competition国际冠军、EMI黑客马拉松算法竞赛国际冠军……一面面奖牌,摆满了达观数据公司的荣誉墙。

达观数据是一家为企业提供各类场景办公机器人的人工智能企业,创始人陈运文在复旦大学计算机系攻读博士,以第一名的成绩毕业后,先后在腾讯、盛大、百度担任技术研发和管理工作。缘于种种契机,2015年,陈运文离开“大厂”,创办了与人工智能大数据相关的创业企业——达观数据。仅仅5年时间,达观数据取得的成绩有目共睹。

提高文字工作效率,做文本智能处理领域的专家

谈及创业的初衷,陈运文坦言,在“大厂”的工作经历,让他看到了文本语义处理是人工智能中应用面最广阔、涉及人们日常工作范围最密集的领域,有巨大的市场机会,当时正值“双创”的热潮,而且有投资机构对他们的技术团队非常认可,真金白银予以支持,团队没有后顾之忧。

陈运文认为,文字资料处理是一个充满魅力的领域,人类的智慧高度浓缩在文字里面,它和人类文明息息相关。但是文字资料处理本身又是非常难的一件事,需要慢工出细活,通过对文字的深入理解来探讨如何使用数学模型更好地进行文字解读。“在日常办公中,几乎每个岗位、每个人都离不开对文字资料的运用和处理。我们希望有一个智能化的机器人系统去帮助人完成文字资料的阅读、写作,能够让我们从繁重的日常文档资料处理工作中解脱出来,这是我们创业的动机。”

与众多创业者“万事开头难”的经历相比,陈运文无疑是幸运者。创业之初,他在盛大老同事的牵线下认识了真格基金的投资人,并很快获得了1000万的一轮融资,使得他们能够甩开手脚去做技术研发,把产品尽快推向市场。

但创业这条路,从来就没有一帆风顺的,陈运文也不例外。“文本语义的应用处理与各行业结合紧密,所以我们仅仅懂文字、懂技术是远远不够的,还得去深入了解我们所服务的各行业,将技术与产业结合起来,才能更好地为客户服务。”

以银行业为例,“我们看到的银行在五点钟就准时关门了,但这并不是银行工作人员的下班时间,他们还要点钱、打印流水、整理现金库存、整理凭证……工作非常辛苦,加班加点是常态。”调研下来,陈运文发现,其实银行很多重复而又繁琐的工作是可以用人工智能来替代的,比如大量文本合同的审核、信贷报告的填写等。为此,技术人员深入银行的各个岗位进行学习、调研,掌握其工作规律,为用户定制出精确到人的个性化产品,大大解放了劳动力。

“与人阅读的过程类似,我们用大量文档教会计算机阅读文字,训练生成语言模型,就能像人一样进行特定的文字处理工作。但计算机触类旁通、举一反三的能力比人类弱,因而训练的次数需是人类的200倍以上。”陈运文介绍道。

在采访中,记者了解到,达观数据助力浦东人社局构建的外国人来华工作“一网通办”服务平台,创新性地改变了用户申请填报模式。以往,外国人来华办理相关证件需要先后获取健康证明、工作许可证、居留许可证等证件,申请顺利的情况下至少需33个工作日,大约一个半月的时间。过长的办理时间影响外国人来华工作体验,也给企业引进外籍高端人才带来不确定性风险。

在上线了智能办公机器人系统后,用户先上传必要的附件材料,通过光学字符识别(OCR)+自然语言处理(NLP)技术的结合,自动提取用户附件材料中的关键信息,并填入到系统页面中,将申请人从录入员的角色转换为审核员的角色,用户只需要审核确认机器自动识别和填报信息的准确性即可,提升了申请人的申请效率和智能化的申请体验。

同时在审核端,机器人代替人工自动完成行政审批中关注的申请完备性、材料一致性和业务合规性的审核工作,审核通过的准确率可到达95%以上,一线审核人员通过机器提示,快速的完成复核,加快行政审批效率并为基层审核人员减负。整个流程的办理时间也由33个工作日压缩到一个星期左右,大大提高了效率。

希望越来越多的人能享受到人工智能带来的便利

今年,陈运文荣获上海市青年五四奖章。达观数据联合创始人于敬在上海市“智慧工匠”评选中,从700多名选手中脱颖而出斩获一等奖。五年间,达观数据的迅速发展,在公司荣誉墙上得到了淋漓尽致的体现。

陈运文坦言,达观数据是在张江土生土长起来的本土企业,公司的迅速发展离不开政府的大力支持。“人才公寓、低廉租金、各类专项资金支持、各项人才政策的助力,对公司来说,感受是实实在在的,这些都在帮助公司聚拢更多的优秀人才。”而达观数据,也在积极承担社会责任,发挥公司优势回馈社会。

2020年初新冠肺炎疫情暴发期间,如何“有效减少人员集聚,降低交叉感染风险”成为人们关注的焦点,很多企业选择了远程办公来保护企业员工的身体健康,但如何了解员工实际工作情况成为了难题。

陈运文带领团队积极响应需求,推出针对企业和政府单位的防疫健康状况调查机器人、材料预审机器人、数据查询机器人和数据填报机器人四款产品,让人工智能技术发挥价值,共战疫情。比如防疫健康状况调查机器人,可以自动化完成文件的发放、收集和数据汇总等工作,帮助人力资源密集型企业做好健康调查,实时了解员工健康状态。这一系列的智能产品为远程办公和非接触工作提供了有力的支撑,助力许多企业渡过疫情艰难的时期。

各行各业都有自己独特的语言模型和文字使用规律。为此,达观数据还联合了北京大学、复旦大学、上海交通大学进行技术攻关,推进语言智能的核心技术研究,智能办公机器人对各行各业文档理解能力也在不断刷新。目前,在机器人服务矩阵下已推出财务报表分析机器人、票据审阅机器人、海关自动报关机器人、订单流转机器人、报告撰写机器人、税务审计机器人、日终清算机器人等近百种常见办公机器人,并仍在不断扩充机器人应用场景。

面对未来,陈运文希望,公司的产品技术能够做得更好,吸引更多优秀人才加入。“人工智能其实没有那么神秘,那么高不可攀,我们希望将来有越来越多的人能了解、能用上人工智能带来的便利,把更多人力解放出来,做更有意义的事情。”

“预计十年之内,将会有50%的重复性日常办公处理可以让机器人去完成,而今天连1%都不到,所以这里有广阔的市场空间。而这个巨大的市场空间,我们是有希望去占领的。”对此,陈运文信心满满。

(责编:严远、金煜纯)
扫描关注上海频道微信扫描关注上海频道微信 扫描关注上海频道微博扫描关注上海频道微博