汤晓鸥:人工智能的中国式文艺复兴 原创很重要

2017年08月30日16:50  来源:人民网-上海频道
 

人民网上海8月30日电 今天,“2017全球(上海)人工智能创新峰会”在上海徐汇西岸艺术中心举行。中国科学院深圳先进技术研究院副院长、香港中文大学教授汤晓鸥作了题为《人工智能的中国式文艺复兴》的主题演讲。

中国科学院深圳先进技术研究院副院长、香港中文大学教授汤晓鸥

演讲全文实录:

感谢组委会的邀请,我也非常荣幸有机会和我的老师Eric 同台做报告。

今天我要讲的,其实和Eric讲的一样,想强调的就是两个字,原创。原创,需要长期的积累、大量的投入,而不是一夜之间突然我们就都可以原创了。

说到原创,可能大家最近都看了一个电影《战狼2》,我还没有看,很难评价它好还是一般。但大家知道,它的票房已经是53亿(截止8月28日的数据),超过了《蜘蛛侠》《变形金刚》。这在十几年前完全不可想象,而且排行榜当中很多的电影都是全球的票房收入,而《战狼2》是靠中国一个国家的票房收入就做到了这点。可以做到这点有很多的原因,我不评价,因为没有看过。但有一个必要的原因,就是两个字:原创。

这个电影10多年前是否会发生?不会。那时候我们每个人花不到1美元,可以在大街上买到任何的好莱坞大片,不会花十几美元去电影院看这个电影,那时候中国不会有好的原创电影。所以长期以来,我们没有自己的顶级电影创作。最近这些年,大家对原创技术,对IP的尊重,对法律的维护,我们才会有《战狼2》这样的电影。

说到电影,中国的电影发源地就是上海。像20、30年代的时候,上海的电影发展好像并不落后于全球。当时我们在电影创作上,很多演员和导演都是非常非常有名。我也无法讲他们为什么会做得那么好,一个必要条件还是对原创、对IP的尊重,所以当时才会发展得那么好。很高兴,今天又开始恢复到那样的时代,我们的电影又可以重新崛起了。

上海,不仅是中国电影文化的发源地,也是中国现代文化的发源地之一。比如中国的商务印书馆,100多年前就创建了,也是标志着上海的现代文化的开始。当时有很多原创的东西,我们知道的一些文人大作家,包括鲁迅等非常有名的学者,他们写了很多的文章、小说,那时候如果他们没有版权收入,相信他们也活不下去。原创也无从谈起了。

在往远一点看,今天我为什么要讲文艺复兴,14到17世纪它真正的起来,有政治的原因、宗教的原因,各种各样的原因,但有一个必要条件,也是对原创的尊重。因为有了这些,才有了达芬奇、米开朗基罗、拉斐尔、莎士比亚等一系列非常优秀的艺术家和作家。最后这张图上的这个作品大家可能会有一些疑问,说文艺复兴时候好像没有见过这个作品,这是我非常欣赏的现代艺术家的现代艺术作品,这个作品叫“纸上谈呯”,描写的是一个忧郁的艺术家弹琴,坐在一卷手纸上,非常原创,和旁边的米开朗基罗的“大卫”有异曲同工只妙。对不起,我实在编不下去了,其实这是我儿子的手工作品,主要还是想强调它的原创性,对手纸的应用很有创意。

下面来看一下今天的人工智能的原创,我们总是听到Google的声音,听到AlphaGo、谷歌的自动驾驶等等,为什么总是听到Google的声音?一个原因是Google一年的研发投入是120亿美金,这是研发烧掉的而不是整个公司的日常运营花费,正因为这样,才会有AlphaGo、自动驾驶等技术。2014年谷歌就愿意付6.6亿美金买一个小初创公司,这个公司只有12个人,没有任何的产品落地,就是用深度学习在玩游戏、下棋。他们会花这么高的价格来买这样的一家公司。如果在我们中国的商业环境下,可能花几百万美金挖人就够了,这样肯定经济效益更好。但是,就不会有后来的AlphaGo了。他们愿意投入,就是对原创技术、对人才的尊重,才会有后面的AlphaGo。

Facebook也是2013年左右,深度学习刚刚起来没多久,大量投入资金,组建深度学习实验室。

Eric提到了Mobileye,英特尔愿意花150亿美金收购这样的公司,其实这个公司也没有什么贵重的东西,就是一伙人,几个教授带一群学生做研究。他们花钱收购,而不是挖人。

大家都非常熟悉AlphaGo,在AlphaGo之前我和投资人讲深度学习,没有人愿意听,也没有投资人关心。但是这盘棋下完之后,投资人开始回过头和我讲什么是深度学习。AlphaGo在全球引起了巨大的轰动,因为围棋这件事,是脑力劳动非常强的活动,机器可以战胜人类确实看起来很了不起,但并不是说机器无比聪明,为什么机器可以下棋?是我们定义的任务,我们让他做下棋这件事。他所做的训练都是基于棋谱,所以他不会想控制人类这件事,他的任务是人类定义的。短期我们不用担心,长期也不用担心机器人控制人类这件事。AlphaGo真正轰动的意义是它的创新和深度学习的算法巨大的进步,这在全球引起了大量的报道。

紧接着谷歌在中国做了一个AlphaGo2,和柯洁下了一盘棋,也下得非常精彩,值得大家关注,也有一些新的技术出来。那周,中国媒体铺天盖地的报道。但你看雅虎、国外的网站,会有一点报道,但报道一下就可以了,不是搞得好像大家都靠这个活着。为什么?因为这是AlphaGo2。做原创,第一次做这件事是最重要的。就像捅破窗户纸一样,第一下很重要,第二下就不那么重要了,你已经知道房间里面发生什么事情了。

再看一个地图,Deep learning的搜索次数,颜色深代表搜索的次数多,浅的代表搜索次数少。大家可以看到中国的颜色最深,而且深很多,对这个词的搜索量最大。但是这是谷歌的搜索结果,谷歌在中国老百姓是搜不了的,你要翻墙,这大概只有做技术的人才知道怎么做。翻墙的搜索量都比全球的任何国家的搜索量高很多,可以想像这在中国有多热。为什么这么热?因为我们不懂,我们这么多年没有做原创技术。中国有句成语“不明觉厉”,因为你不知道怎么回事才觉得厉害。还有一句话叫“文人相轻”,你是文人,你知道他的水平和高度,互相之间会不服气,如果你都不是文人,哪里有资格去轻视别人呢。

前段时间Amamzon、IBM、谷歌、微软,Facebook组成了人工智能联盟,当时我们觉得国外人工智能的发展已经非常非常超前了。我们如何竞争?Eric刚才讲了人工智能应该是全球的合作,是共赢。合作是双方都要做事情的,是双方平等的合作,不是说别人做了,你把它拿过来就用,然后赚钱,这不是合作,这是盗版。

人工智能,我们是否落后得很远?我从商汤公司做的事情来讲一下,我们现在处于什么水平。人工智能的发展历史我就不讲了,几起几落,前面的学者已经总结过了。真正的落地是2011年,深度学习算法在语音识别方面取得重大突破,是当时Hinton和微软的邓力合作取得的成绩。后来才有了2013年谷歌、Facebook的大量投入,和到现在的直线上升。

2011年我们开始做深度学习,当时应该是最大的华人团队。2011到2013年全球最顶级的计算机视觉学术会议CVPR/ICCV上,29篇文章涉及到深度学习,14篇由我们一个实验室做的,做了全球的一半。

最近两年,谷歌、Facebook开源了AI平台,相当于AI的操作系统。我们最早的时候没有Torch和TensorFlow,我们经过多年的积累,做出我们自己的深度学习Parrots系统,我们把几百块的GPU连起来。训练了1207层的深度学习网络,林达华教授带领学生做了这项工作,他也是从Eric实验室几年前毕业的博士生。

我们和Facebook竞争的例子,就是人脸识别。2014年Facebook发表了文章,人脸识别算法接近人眼的能力,我们同一时间发表了另外一篇文章,抢在Facebook之前,第一个用计算机做人脸识别超过人的眼睛。这其实是和AlphaGo相似的事情,在人类定义的一项任务上,机器超过了人类。我们当时用了20万的人脸数据做的。平时做研究,一两万的人脸数据就很了不起了。用了20万的人脸数据,我们觉得我们会碾压所有的人。还没有开始碾压,发现Facebook用了750万的数据,数据量上把我们碾压了。但是计算的结果,我们超过了他们,连做了3、4个算法,最后做到了99.5%,战胜Facebook。在中国,马上出现大批的公司重现一下算法,开始人脸识别落地应用的时代。

Imagenet,2012年有很大的突破。2014年是最大的一次比赛,38个团队,包括Google、伯克利、牛津,微软等顶级实验室都参加了,我们取得了全球第二名,输给了Google。当然,Google也是竞赛的组织者,我们赢他也比较难。

2015到2016年,ICCV、CVPR、ECCV三个顶级国际会议上发表的文章数量。微软124篇,CMU86篇,商汤和我们实验室一起76篇,全球前三名,我们是整个亚洲唯一前10名的团队。

最后看一下百度、阿里、腾讯,三家的估值加起来在9000亿美金上下。三家公司加起来的文章数是13篇。你想用AI作为你的未来,是要投入的,要做原创的,而不是拿来的。我们取得的这些成绩,也得到了国际上的承认。

我们非常荣幸,和MIT、斯坦福,伯克利、谷歌等实验室,被评为全球十大人工智能先驱实验室,我们是整个亚洲唯一的代表。我讲的这些是学术上的研究和成绩。如果只有这些,其实我们没有数据,没有应用,我们的人也很少。一开始,会抢跑一下,领先一下,长时间的竞争我们无法持续抗衡Google这样超高投入的公司。所以我们也要落地,很幸运,通过积累,我们现在有120位深度学习的博士,核心人员体量和Facebook、Google差不多,我们是中国唯一一个深度学习平台公司。非常荣幸,这次《华尔街日报》报道我们单轮融资打破全球最大一笔AI创业公司融资记录,4.1亿美金。以前是我们以几千万美金,打一场看起来完全不对等的战争,现在我们补充进了弹药。非常高兴,到今天有400多家顶级的客户,包括中国移动,包括银联,包括华为等巨型公司。400家公司意味着过去一年半的时间,每天签约一家公司。我们用我们的深度学习平台为核心大脑,在做人脸识别,在做芯片、医疗、自动驾驶、金融,手机等14个行业的人工智能应用研发,和14个行业的合作伙伴合作,我们会反馈回来大量的应用需求和数据,形成完整的闭环、正循环。去年的双创活动中,很荣幸和百度被选为代表中国人工智能的两家企业,参加北京地区的展览。

最后还是用一个电影来结束。我这个年龄的人,对《上甘岭》这部电影都很熟悉,当时打的最后一场战斗,也就是一个连。我们120个博士,也差不多就是这样的人数。如果我们这只队伍失败了,打散了,守不住《上甘岭》,中国人工智能的三八线也就基本结束了,谢谢大家!

(责编:唐小丽、轩召强)
扫描关注上海频道微信扫描关注上海频道微信 扫描关注品牌上海微信扫描关注品牌上海微信