陈建文规划AI蓝图,易联视讯构建未来虚拟世界
2017-08-08 13:13:36

本文来源: 21CN

据专业人士称,人类感知外界信息有80%以上是通过视觉获取的。2015年,微软在ImageNet大赛中,算法识别率首次超越人类,视觉由此成为此次人工智能浪潮中最为活跃的领域。人工智能作为人类的终极梦想,这一次浪潮人类距离梦想还有多远?是昙花一现,还是会梦想成真?

7月20日,国务院发布了《新一代人工智能发展规划的通知》。在全球AI迅猛发展的今天,此通知的印发将人工智能提到了国家层面,为推动我国人工智能事业的发展奠定了强有力的坚实基础。近日,亿欧网采访了北京易联视讯科技有限公司董事长、电子科大视觉智能研究中心主任陈建文博士。谈话中,这位在此相关领域耕耘超过15年的千人专家深度阐述了自己对于AI当下及未来发展的分析与思考。

  陈建文 Ph.D.

  没那么简单,人工智能是一个庞大的生态系统

如果问你什么是人工智能,你会如何作答?人脸识别、语音识别还是图像处理?这些经常说到的词语像润物细无声般充斥在我们的周围,正智慧地改变着人们的生活。是的,它们都是AI,也就是人工智能。但人工智能领域并不仅仅只有这些,“它是一个跨学科、多学科相结合的庞大领域”,陈建文如是说道。在这里,他为我们展示了一张人工智能图谱并详细介绍了这一领域的生态体系。

  结合此图谱,陈博士特别指出,机器学习(深度学习)这一框架目前已经基本确定了;而计算机视觉、语音识别、自然语言处理等都是应用层面的基础技术支撑。早在2008年11月IBM就提出了“智慧地球”的概念,每个行业领域都有其专业的核心算法,比如无人驾驶和安防设备的算法就不尽相同,大家都是在各自的算法上呈垂直方向更迭演进。像ImageNet 图像识别,它也仅仅只是深度学习上的一个应用而已。而算法又只有落地到场景中才能得到大量可靠的数据从而推动行业乃至社会的发展。

因此,在陈建文看来,人工智能是一个庞大的领域,它也像其他领域一样有着自己的发展脉络和体系,结构分层互相支撑:底层深度学习架构检验着上层应用算法,而应用算法也能够反过来对底层框架提出要求,并验证底层框架是否能跟上应用的节奏,推进领域的整体发展。十几年前不敢想象的场景在今天实现了、几年前的难题在今天攻克了,人工智能也和历史一样在持续不断地向前发展着,每出现一个大框架的改进或算法的提高都会在全球引发一波浪潮。所以,处在这一波人工智能浪潮下的我们决不能因为一两棵树木而忽略整片森林。

  放眼看,人工智能的未来尽在科幻电影中

当问到AI的未来将何从何从时,陈建文博士非常激动地说到:AI的的未来实际上在之前无数的科幻题材的电影中都进行了比较生动的勾画,AI的终极目标实际上也是人类的终极目标:一个虚拟智能的世界。这个世界的核心是一套完整的人工智能系统,一套庞大而又完整的智能服务系统。就像《星际迷航》、《黑客帝国》、《阿凡达》等科幻电影中所描绘的场景一样,在这个人类梦寐以求的虚拟世界中,无论你身处何方,均可随时连接,无论是人机交互、人和系统交互还是人人交互都和真实的世界没有任何分别。

陈建文对此表示:实际上,为达到这一终极目标,人类一直都在努力着。在连接方面,本质上是将人和人进行的一个线上互联。而关于连接技术,陈建文并不拘泥VR和AR的概念异同,在他看来,无论是文字、图片、语音还是视频、VR、AR都是连接人与人的工具,我们在虚拟世界中所看到的人脑互联从本质上也属于连接技术的范畴。在那里,交流不再仅仅只是通过直播或VR简单连接,它可以做到把千里之外的“人”瞬间带到你身边,而这个“人”不仅可以陪伴你,TA还完全拥有与真实人一样的表情、动作甚至情感,这其中就涉及到了现在的虚拟重建、全息投影、情感感知、手势识别等核心人工智能技术。

说到虚拟世界,很多人不免会对此产生疑问,认为它是虚幻的不可实现的。但陈建文表示,我们在二十年前科幻影片中所看到的很多技术和场景目前都已经实现了,我们现在看到的科幻电影中的东西我们又怎么能怀疑那不是未来呢?所以,虚拟世界并不是空想主义,它是有科学依据的。这从技术的发展历程,视频直播、VR/AR以及全息投影的阶段演进中便可知晓一二,所以,陈博士笑称:人工智能的未来就在科幻影片中,看看电影就知道未来的世界是什么样了。

  我们只做视频状态下与人相关的视觉智能

在人工智能火爆全球的今天,众多企业纷纷涉足其中,而陈建文博士和他的易联视讯AI团队业务主要是在视觉智能方面,准确的说就是只做在视频状态下与人相关的视觉智能算法,为未来的世界提供基础架构和核心技术支撑。在他看来,单纯的人机交互绝不是终极目标。当前,人有80%以上的时间不是在车里,而是在不同的社交环境中,那么未来的世界也依然如此。交朋友、打游戏、逛街购物……人不仅可以随意虚拟穿越到任何地点,而且还能够将本体的动作、表情之类完全同步到虚拟世界中。所以,未来世界的重建应以人为本,如何解决人的连接和智能才是最核心的问题。

在陈建文博士的带领下,易联视讯AI团队正在系统地研究视频状态下人的情绪感知、动作、手势等相关的科学难题。对于一个刚刚走出来的方向,人工智能领域需要持续不断的加码科研的投入,而这一点正是易联视讯团队的优势之一。“我们有自己的研究单位和机构,大量的科研力量能够源源不断地提供科技的支撑,这是其他很多初创期的AI创业公司无法比拟的。如果没有自己的研究团队,我们的创新也将无法长期可持续发展。”

当前,医疗、安防、支付、车联网、智能家居、工业自动化等领域的应用均已成为火热的创业风口。站在风口处,陈建文博士有着清醒的认识:人工智能并不是一个行业,它是与各行业相结合进而完成产业升级。大多数的传统行业都有自己固定的设备、渠道,行业地位在短时间内是无法撼动的,所以,易联视讯拒绝闭门造车,它倡导和行业的引领者合作,所有需要和人打交道的领域,我们为他们提供强有力的科技AI算法支持。现在,易联视讯与东方网力、长虹、华为等公司都展开了长期的合作研究,问其主要合作方式,陈建文说:“我们是他们核心算法(人工智能算法)的提供者。”以长虹为例,易联视讯提供相关视觉智能算法,这一技术不仅仅只是人脸识别,它还包括了情感、情绪、动作等所有和人有关的方面,而这些算法和技术将使用在长虹智能家居、智能机器人的产品链中。

有所为而有所不为,专注于人的AI——这即是易联视讯的战略也是目前正在做的事情!

  只要方向定正确,不怕道路弯又远

在陈建文看来,人工智能和社会性质一样,都是分阶段的。实际上,人工智能并不是一个新的概念,早在十几年前陈建文在清华读博士的时候就已经参与到车牌识别、运动行为识别这些古老的课题,但那时并未给它定义为“人工智能”。随着深度学习范畴的不断拓展,在最近的十年内,技术取得了长足进步。例如图片的识别数据集对象的准确率从71.8%上升到了97.3%,已经超越了人类的能力。而这些反过来会大幅度的升级整个行业。

上文中也提到:深度学习是底层核心,我们现在所说的人工智能算法能力大多属于应用层的能力,底层核心框架为了上层应用算法的实现和验证提供了平台保障。除了底层平台,为达到高程度的准确率,算法必须结合大量的训练数据,而当数据并不丰沛时,它的准确率必然处于劣势。只有准确率达到一定水平才会具有真正的实用价值,从而被人们所熟知。就像现在的人脸识别或语音识别等技术,经过了几十年的发展,终于突破了性能的阈值走到我们的面前。当然,还有更多的人工智能应用、算法仍处于实验室阶段不被外界所知。

因此,陈建文认为:只要方向定正确,不怕道路弯又远。就像亚马逊连续亏损25年后,其CEO贝索斯终在7月27日超越比尔盖茨成为新任世界首富。在陈看来,无论研究还是创业都不要随大流,应该有自己的独立判断。认清优势、找到目标,然后一直坚持下去。

地平线的优势是无人驾驶、东方网力是智能安防、商汤科技是人脸识别、科大讯飞是同声翻译机、……而易联视讯是专注于人的人工智能公司。以强大科研机构为后盾,持续不断地演进算法,提升技术水平。在此过程中,每个核心的算法或者能力都会输出到一些阶段性的产品上。也许“这个产品和我最后的愿景并不一致,但只要方向是正确的,不怕道路有多远。”目前,易联视讯的所有技术、产品都是为构建未来的虚拟世界而准备,“我们还将深度挖掘,在算法、应用场景上开疆拓土,把自己的核心技术、核心优势做强做精,为架构未来人工智能平台而不断前行。”

当前,易联视讯C+B端有几千万用户从而积累了大量数据,这在国内人工智能公司中是极为少见的。算法+大数据+云计算再结合庞大的研究机构,陈建文博士有信心带领易联视讯团队打造出人工智能虚拟世界!