達觀數據:做中國智能辦公機器人專家

2021年01月06日15:54  來源:人民網-上海頻道
 

人民網上海1月6日電(唐小麗)  中國人工智能領域最高獎“吳文俊人工智能科學技術獎”、連續三年獲得“創業在上海”國際創新創業大賽立項、高新技術企業、科技小巨人培育企業、ACM CIKM Competition國際冠軍、EMI黑客馬拉鬆算法競賽國際冠軍……一面面獎牌,擺滿了達觀數據公司的榮譽牆。

達觀數據是一家為企業提供各類場景辦公機器人的人工智能企業,創始人陳運文在復旦大學計算機系攻讀博士,以第一名的成績畢業后,先后在騰訊、盛大、百度擔任技術研發和管理工作。緣於種種契機,2015年,陳運文離開“大廠”,創辦了與人工智能大數據相關的創業企業——達觀數據。僅僅5年時間,達觀數據取得的成績有目共睹。

提高文字工作效率,做文本智能處理領域的專家

談及創業的初衷,陳運文坦言,在“大廠”的工作經歷,讓他看到了文本語義處理是人工智能中應用面最廣闊、涉及人們日常工作范圍最密集的領域,有巨大的市場機會,當時正值“雙創”的熱潮,而且有投資機構對他們的技術團隊非常認可,真金白銀予以支持,團隊沒有后顧之憂。

陳運文認為,文字資料處理是一個充滿魅力的領域,人類的智慧高度濃縮在文字裡面,它和人類文明息息相關。但是文字資料處理本身又是非常難的一件事,需要慢工出細活,通過對文字的深入理解來探討如何使用數學模型更好地進行文字解讀。“在日常辦公中,幾乎每個崗位、每個人都離不開對文字資料的運用和處理。我們希望有一個智能化的機器人系統去幫助人完成文字資料的閱讀、寫作,能夠讓我們從繁重的日常文檔資料處理工作中解脫出來,這是我們創業的動機。”

與眾多創業者“萬事開頭難”的經歷相比,陳運文無疑是幸運者。創業之初,他在盛大老同事的牽線下認識了真格基金的投資人,並很快獲得了1000萬的一輪融資,使得他們能夠甩開手腳去做技術研發,把產品盡快推向市場。

但創業這條路,從來就沒有一帆風順的,陳運文也不例外。“文本語義的應用處理與各行業結合緊密,所以我們僅僅懂文字、懂技術是遠遠不夠的,還得去深入了解我們所服務的各行業,將技術與產業結合起來,才能更好地為客戶服務。”

以銀行業為例,“我們看到的銀行在五點鐘就准時關門了,但這並不是銀行工作人員的下班時間,他們還要點錢、打印流水、整理現金庫存、整理憑証……工作非常辛苦,加班加點是常態。”調研下來,陳運文發現,其實銀行很多重復而又繁瑣的工作是可以用人工智能來替代的,比如大量文本合同的審核、信貸報告的填寫等。為此,技術人員深入銀行的各個崗位進行學習、調研,掌握其工作規律,為用戶定制出精確到人的個性化產品,大大解放了勞動力。

“與人閱讀的過程類似,我們用大量文檔教會計算機閱讀文字,訓練生成語言模型,就能像人一樣進行特定的文字處理工作。但計算機觸類旁通、舉一反三的能力比人類弱,因而訓練的次數需是人類的200倍以上。”陳運文介紹道。

在採訪中,記者了解到,達觀數據助力浦東人社局構建的外國人來華工作“一網通辦”服務平台,創新性地改變了用戶申請填報模式。以往,外國人來華辦理相關証件需要先后獲取健康証明、工作許可証、居留許可証等証件,申請順利的情況下至少需33個工作日,大約一個半月的時間。過長的辦理時間影響外國人來華工作體驗,也給企業引進外籍高端人才帶來不確定性風險。

在上線了智能辦公機器人系統后,用戶先上傳必要的附件材料,通過光學字符識別(OCR)+自然語言處理(NLP)技術的結合,自動提取用戶附件材料中的關鍵信息,並填入到系統頁面中,將申請人從錄入員的角色轉換為審核員的角色,用戶隻需要審核確認機器自動識別和填報信息的准確性即可,提升了申請人的申請效率和智能化的申請體驗。

同時在審核端,機器人代替人工自動完成行政審批中關注的申請完備性、材料一致性和業務合規性的審核工作,審核通過的准確率可到達95%以上,一線審核人員通過機器提示,快速的完成復核,加快行政審批效率並為基層審核人員減負。整個流程的辦理時間也由33個工作日壓縮到一個星期左右,大大提高了效率。

希望越來越多的人能享受到人工智能帶來的便利

今年,陳運文榮獲上海市青年五四獎章。達觀數據聯合創始人於敬在上海市“智慧工匠”評選中,從700多名選手中脫穎而出斬獲一等獎。五年間,達觀數據的迅速發展,在公司榮譽牆上得到了淋漓盡致的體現。

陳運文坦言,達觀數據是在張江土生土長起來的本土企業,公司的迅速發展離不開政府的大力支持。“人才公寓、低廉租金、各類專項資金支持、各項人才政策的助力,對公司來說,感受是實實在在的,這些都在幫助公司聚攏更多的優秀人才。”而達觀數據,也在積極承擔社會責任,發揮公司優勢回饋社會。

2020年初新冠肺炎疫情暴發期間,如何“有效減少人員集聚,降低交叉感染風險”成為人們關注的焦點,很多企業選擇了遠程辦公來保護企業員工的身體健康,但如何了解員工實際工作情況成為了難題。

陳運文帶領團隊積極響應需求,推出針對企業和政府單位的防疫健康狀況調查機器人、材料預審機器人、數據查詢機器人和數據填報機器人四款產品,讓人工智能技術發揮價值,共戰疫情。比如防疫健康狀況調查機器人,可以自動化完成文件的發放、收集和數據匯總等工作,幫助人力資源密集型企業做好健康調查,實時了解員工健康狀態。這一系列的智能產品為遠程辦公和非接觸工作提供了有力的支撐,助力許多企業渡過疫情艱難的時期。

各行各業都有自己獨特的語言模型和文字使用規律。為此,達觀數據還聯合了北京大學、復旦大學、上海交通大學進行技術攻關,推進語言智能的核心技術研究,智能辦公機器人對各行各業文檔理解能力也在不斷刷新。目前,在機器人服務矩陣下已推出財務報表分析機器人、票據審閱機器人、海關自動報關機器人、訂單流轉機器人、報告撰寫機器人、稅務審計機器人、日終清算機器人等近百種常見辦公機器人,並仍在不斷擴充機器人應用場景。

面對未來,陳運文希望,公司的產品技術能夠做得更好,吸引更多優秀人才加入。“人工智能其實沒有那麼神秘,那麼高不可攀,我們希望將來有越來越多的人能了解、能用上人工智能帶來的便利,把更多人力解放出來,做更有意義的事情。”

“預計十年之內,將會有50%的重復性日常辦公處理可以讓機器人去完成,而今天連1%都不到,所以這裡有廣闊的市場空間。而這個巨大的市場空間,我們是有希望去佔領的。”對此,陳運文信心滿滿。

(責編:嚴遠、金煜純)
掃描關注上海頻道微信掃描關注上海頻道微信 掃描關注上海頻道微博掃描關注上海頻道微博