易联视讯陈建文:我们对人工智能的想象要更疯狂一些
2017-09-01 11:11:06

本文来源: 品途商业评论

人工智能已经与每一个行业接轨,在社交中,人工智能又如何融入?

品途近日采访了易联视讯董事长陈建文博士,一探社交中AI的运用。陈建文博士毕业于清华大学电子工程系,有多年留美经验,于2015年11月入选中国千人计划,回国创业担任电子科技大学电子工程学院教授,并担任电子科技大学视觉媒体智能研究中心MediaLab主任(http://medialab.uestc.edu.cn),电子科技大学“视觉智能研究中心”依托于电子科技大学电子工程学院及哈佛大学人眼研究中心,着眼于解决人工智能在视觉交互领域的交叉学科问题。 image001

2016年在互联网+被提出时,陈建文博士作为创新创业代表给总理汇报了“互联网+”的新趋势“视频+”。

2017年,陈建文博士对AI的看法又将如何?

给AI一个更加牛X的想象

“你觉得AI是什么?”,刚刚开始采访,陈建文博士的这个提问就像给笔者来了当头棒喝。我用AI的英文解释回答“AI就是人的智能能力的增强应用”,显然,这个答案,陈建文博士并不满意。

紧接着,陈建文博士打开了电脑中的一个PPT,进入一张有着机器猫、阿凡达、黑客帝国、星际迷航四张电影截屏的PPT,在他看来,这些就是未来的人工智能。 image003

“当我们把AI放在更多的商业场景应用中时,我们的关注点会让我们的理解越来越细分,甚至可能失去宏观的想象和预测”。陈建文博士对笔者说到,“我们对人工智能的认识要更清晰、更宏观、更有高度”。在笔者看来,这才是更疯狂和更有目标感的一件事。

陈建文博士说到:“所谓的AI,在我们看到的科幻电影中其实都可以看到,在“那个世界”里,所有的东西都可以交互,都存在虚拟技术的,就像机器猫大结局中康复苏醒之后的世界,所有的人物都是虚拟的;像阿凡达中可以用思维去操控外星人,或者像星际迷航中那样可以将人的身体在空间中随意移动。”

在陈建文博士看来,人工智能的未来场景其实就像人类的终极梦想一样,人类一直在研究如何突破人自身的空间极限和物理极限。中国的音视频产业联盟在人工智能出现后改名为人工智能产业联盟,如果从这个角度去做思考,其实可以理解为,人工智能在商业场景应用时,需要交互入口,而音视频便是最大的交互入口之一。而基于交互入口,人工智能的理解才能更清晰更具体。

把握入口

众所周知,交互的入口是数据的来源,在互联网时代中,社交入口、支付入口、流量入口等等都被巨头企业所占据着。

而在智能时代,交互会则变成更无感的状态,因此,最有力的交互入口也将是音视频入口。在目前来讲,AR、VR的技术都是人工智能中重要的组成部分。 image005

2016年陈建文博士凭借敏锐的市场嗅觉,创建了赫赫有名的“易直播”,采访时,他拿出手机打开了易直播的APP给笔者看了一个美女主播正在唱歌的直播内容,并说到:“我们现在看到这个主播正在唱歌,但如果用人工智能的技术和VR的技术,是可以将这个主播传递到我们的面前的,这件事是可做的事,这是未来所有的交互入口可能的形态”。

目及市场中渴望把握入口的公司很多,例如在识别领域技术强大的商汤科技,例如各种直播平台,尝试将VR和人工智能技术运用到直播中;还有Facebook等拥有社交入口的公司也在VR上做了很多尝试。再或者是机器人、智能音箱,其实本质上都是在把握交互入口。

目前的人工智能在各行业应用者的眼中,可能只被定义为机器学习,语音识别、语义识别。这些只是人工智能其中很小的一个点。而光有这些点事实上是不能构成人工智能定义的,若想定义,则需要更整体的认知。

在人工智能的产业分级中,基础是CPU、GPU等等,这代表着运算能力,基础的应用是识别、理解、视觉等,再往上层延伸就是智能家居智能工业以及娱乐,可以说,人工智能是未来社会构建基础架构的核心。

陈建文博士引导我们想象了一个画面,未来在一些体验中,我们可能要用通过识别将有关人的数据进行获取,然后再把很多人传输到一个空间、位置中开会,这现在只在科幻电影中出现过。但如果我们思考,这当中是真的是把人传过去了么?也有可能是将人的声像数据传过去,用全息投影的技术呈现出来。未来的世界里,我们生活场景中所服务的人都是用AR来呈现的,然后通过音视频的交互完成某项能力。 image007

在人的所有生活场景中,社交还是最大的场景,没有之一。在未来,可能需要将人完成一个模拟,然后投入“未来世界”中,未来的电影中,未来的游戏中以及未来的交互中。

理解人工智能的未来

今年7月,人工智能初创公司ObEN获得腾讯领投的500万美元战略投资。ObEN通过构建个性化的虚拟声音、形象和个性来创造用户的人工智能虚拟形象,为用户带来虚拟社交体验。

具体来说,用户只需要用手机拍摄一张正脸照片上传到ObEN,ObEN就可以根据照片重建出一个3D的虚拟人脸(照片角度越多,重建效果越精确)。如果花上2-3分钟念出指定的文字,通过系统分析后,ObEN便能合成出你的声音。

陈建文博士说,这本质是一个VR+AI的项目,只有VR技术直播是完成不了,VR直播只是把人传递过去,但是里面有大量人脸识别、语音交互,也用到AI技术,它可以大量在游戏、社交等场景应用。腾讯之所以押注ObEN,是因为这个事情再往前走一步,就是把人变成虚拟世界的人。

不难想象,未来的虚拟社交、虚拟购物、虚拟游戏、视频会议都是虚拟交互模式。我们要做的是未来虚拟世界的构建者,未来核心的技术是连接,把人重建和跟踪。

人工智能的发展,要深入产业,结合场景,才能得到更好的能力释放。人工智能若可以更快的推进和变革的行业,是会有一个标志的特点的——解决最低效的社会场景。

陈建文博士给我们指出了人工智能可能回在短期内有很快的突破的场景。第一个是可能政务的人工智能,从发展的角度,人工智能是提高社会效率,而政府的效率低是大家都知道的,如何用技术手段提高效率是一个很重要的方向。第二个可能会是无人驾驶,这既是社会的刚需,又是国家重视方向,社会经济重视的商业,但需要思考的是为整个交通系统的大环境进行调整、优化,要从根本上解决问题。第三个是社交娱乐的人工智能发展,在这一点上,陈建文博士和一堆社交平台的创业者们一直都在做着深度的交流探讨,准备去为社交中的交互增加“新玩意”、“新创意”。

在这三个看好的领域中,无人驾驶和社交必然是会出自巨头企业,这些是基于驾驶和社交的商业本身。而医疗等也是在众多重要组成部分之一,但可能因某些限制,而无法达到巨头企业的量级。

在众多人工智能研究者中,陈建文博士似乎是在关于人工智能未来梦想讨论中,最激情的一个描绘者,这也与陈建文博士自身是科幻迷有关。并且,陈建文博士其实也看到,在美国的一些未来构架中,人工智能已经非常清晰的指向了未来世界。

人工智能发展至今,起起落落,看如今的形势,似乎已经进入了“大步向前”的阶段。在相关科技不断提升的背景下,人类和人工智能将会以一种什么样的共生状态?

未来可知也不可知,疯狂的想象也都会实现,就像当年比尔盖茨对今天社会的猜想95%都实现了一样,人工智能科学家所想象的图像识别技术,只发展了10年便已应用到了日常生活中,所以说,人工智能超越人类的能力,已经把未来变得不仅可以理智思考,也可以尽情想象。