百度开了一场严肃的人工智能大会,可为何现场“笑点”不断?

2018年07月12日14:36  来源:上海观察
 

一场“好笑”的技术会议——这是7月4日百度AI(人工智能)开发者大会给不少人留下的印象。毫无疑问,技术、应用、代码、芯片、系统、平台等严肃的技术名词是这场会议的“主角”,可是约7000人的会场中时不时爆发出笑声,就像听相声、笑话时发出的由衷笑声。

为什么?

如果能分析一下那些引发笑声的“笑点”,可以看到人工智能的挑战和机遇。

人工智能的生活,准备好了吗?

“您好,我是百度AI开发者大会客服,为了保证服务质量,通话可能会被录音。”这样的表述很让人熟悉吧,不过这一次,听筒另一边不是人工客服,而是基于百度人机交互开发平台DuerOS设计的机器人客服。

会场的第一个“笑点”,正来自机器人客服与参会者的几段通话录音:

“您好,请问您准备来参加百度AI开发者大会吗?”

“恩。”

“您对本次大会有什么疑问吗?”

“管不管饭?”

“当然,不会让我们的开发者饿肚子。”

“那就好。”

“还有什么需要帮您?”

“啊,你是不是机器人?”

“哎呀,被你识破了。”

“机器人啊!那你是哪里人呀?”

“我当然是百度人。”

……

录音中,机器人客服侃侃而谈,有问必答。不过,它并没有“瞒过”与之对话的人类:大部分人都从语音语调中发现了听筒对面是机器人客服,只是不同人的表现完全不一样:有人表示惊讶后饶有兴趣地开始“刁难”、“调戏”机器人客服;也有人似乎完全不适应机器人客服,自从发现对方是机器而不是人后,几乎说不上话……这些不同的反应引起了现场的笑声。

笑声背后,人们发现:人工智能生活真的来了,可人类准备好了吗?

让人们了解、熟悉、利用人工智能技术,最重要的方式是让人工智能变得触手可及。这也是百度召开人工智能开发者大会的初衷。百度董事长兼首席执行官李彦宏说:“现在,人工智能是一个堪比工业革命的技术变革,如何避免产生新的智能鸿沟?我们的答案是开放,把百度多年积累的AI能力开放出来,通过数据、算力和算法的不断迭代,让每一个开发者能够接触到全球最先进的AI技术,让每一个公司、每一个企业都能够很方便地使用这些最先进的AI能力。”

对普通人来说,随着开发者的创新、技术的落地,意味着可以在更多场景中体验人工智能。届时,大家就不会再“大吃一惊”或不知如何应对,而是成为新技术的受益人。

对于这点,援藏医生陈静飞通过视频现身说法:他在西藏地区九地调研发现,藏区牧民的寄生虫感染率比内地明显严重,原因不仅在于牧区面积大、人畜接触多,还因为当地基层医疗机构缺乏技术过硬的检验人员,导致医生不知道病人感染的是什么寄生虫,也无法判断该用什么药。

为了解决这个问题,陈静飞想到了人工智能。他利用百度的定制化训练与服务平台EasyDL进行显微镜下寄生虫虫卵识别,辅助检验人员进行相关诊断。经过几个月的机器学习,现在这套系统已经可以识别10多种寄生虫虫卵,在小范围临床检验试点里,识别准确率稳定在97%以上,未来几个月,可以实现识别常见的40多种寄生虫虫卵,并不断提高识别准确率和识别速度。“换句话讲,这个系统只用了几个月时间,识别能力可以相当于一位有20多年临床经验的检验专家,比一般检验医师识别寄生虫的种类要多很多,同时准确率和识别速度更好。”陈静飞觉得,一项技术只有用起来,才能真正体现它的价值,也得到更多的人认可。

 

机器辅助识别寄生虫

技术发展的脚步不会减缓

另一个引发全场大笑的“笑点”是百度AI技术平台体系总负责人王海峰播放的一段视频:用户打开手机上百度地图App,用语音播报了一长串类似绕口令的要求,大致意思是“现在规划一条从公司回家的路线,要避开拥堵路段、经过指定超市、不要走某个区域”,等等。结果百度地图App的语音助手回答:“如果您能把刚才的要求重复一遍,我就能给你答案。”

台下的听众因语音助手的“机智”回答而笑,但王海峰承认,虽然语音助手巧妙地给自己解围,可最终没有满足用户的要求,这并不是一个好的答复。不过,“经过几个月的训练,我们可以看看最新的结果。”紧接着,他也绕口令般说出一长串的导航要求,而百度地图App语音助手不过一秒钟就回答:“已经为您规划了路线,是否进入导航模式?”此时,台下的笑声和掌声混合在了一起。

这个小小的细节显示出,虽然很多人未必熟悉人工智能,技术本身也有缺陷和局限,但技术进步的脚步阻挡不住。不论是百度这样的科技巨头企业,还是致力于创新的开发者,都在不断推动技术进步,让技术更好地为人类服务。

从本届百度AI开发者大会发布的内容看,也可以感受到人工智能迭代升级的速度。比如,为开发者创新和技术落地准备的“百度大脑”进入了3.0时代。王海峰介绍说,百度大脑1.0完成基础能力搭建和核心技术初步开放;2.0形成完整的技术体系,开放60多项AI核心能力;3.0的核心是“多模态深度语义理解”,同时开放110多项AI能力。

 

视觉语义化技术在超市场景的应用

所谓“多模态深度语义理解”是指对文字、声音、图片、视频等多模态数据和信息进行深层次多维度的语义理解,包括数据语义、知识语义、视觉语义、语音语义一体化和自然语言语义等多方面的语义理解技术。通俗地说,“多模态深度语义理解不仅能让机器听清、看清,更能深入理解它背后的含义,深度地理解真实世界,进而更好地支撑各种应用,”

王海峰还用多段视频解释了百度大脑的这项新能力:当视觉语义化技术应用于世界杯视频解析时,机器能够全面识别视频中的球员、裁判、球、以及球门、球场线等人、物和场景,可以捕捉射门、进球、角球、任意球、换人等事件。基于这些语义化知识,既可以完成机器人自动解说,也可以进行精彩片段集锦以及各种数据统计分析等。而在实际生活的超市购物场景中,视觉语义化技术通过识别人物、动作、物品并关联时间序列,将数字化的视频转化为结构化的语义知识,既能实现顾客在无人超市购物的完整体验,还可以帮助商店经营者分析和优化商店经营。

各行各业的创新者,都有机会

12岁开发者袁翊闳一句“我很满意”构成了当天会议的另一大“笑点”。现场,百度智能生活事业群组总经理景鲲请他谈谈对百度人机交互开发平台DuerOS的感想,个子不高、满脸稚气的小袁大大方方地给出评价。

参会者除了因为小袁的不怯场而笑,更因为他的经历而笑:小袁来自广东中山一个普通家庭,在当地的海洲初级中学读初一。他从小学四年级开始接触计算机,六年级已经做出了自己的树莓派智能小车;初一开始,袁翊闳自学编程,学习了BASIC、Python等编程语言,在接触到DuerOS平台后,觉得DuerOS的智能语音交互是智能生活方向的未来,所以成为1.6万名DuerOS平台开发者中年纪最小的一名。眼下,袁翊闳已经利用DuerOS开放平台开发出三个人机交互技能,包括看图猜成语等小应用;在自己搭建的小蓝机器人(智能家居控制系统)上接入了DuerOS的语音能力,将自己家中的电器实现了智能化串联和控制。

 

袁翊闳与自己的设计在一起

所以,当小袁评价DuerOS“很满意”时,听众不仅感慨后生可畏,更觉得在新技术面前,创新者没有年龄限制、创新也没有极限。而百度请小袁“站台”的原因恐怕也是同样的:这场面向开发者的技术会议的根本目标,不仅是展示百度本身在人工智能技术上的最新成果,更是希望让创新者看到,他们可以利用这些成果,创造出更多的可能。“百度要和全球有梦想的开发者一起,用我们创新和开放的力量,实现Everyone Can AI(每个人可以进行人工智能创新)的初心与理想!”李彦宏说。

事实上,为了鼓励创新者,百度也给出不少激励条件。比如,DuerOS已经进入到3.0版本,为开发者提供更多的技能,包括倍受瞩目的小度智能音箱儿童模式、极客模式等多个创新技术;超过20个跨场景、跨设备解决方案,包含有屏设备解决方案、蓝牙设备解决方案、行业解决方案等……其中,蓝牙设备解决方案是国内首创的,开发者将这一方案植入到蓝牙耳机、蓝牙音箱后,未来可以让数以千万的蓝牙设备瞬间变成可以对话的人工智能设备。此外,DuerOS还正式启动商业分成模式。景鲲向开发者宣布,DuerOS在前6个月将会把技能收入的100%回馈给开发者。

(责编:实习生、韩庆)
扫描关注上海频道微信扫描关注上海频道微信 扫描关注品牌上海微信扫描关注品牌上海微信