12月13日,北京格灵深瞳信息技术有限公司董事长兼CTO、Google Glass 团队核心成员赵勇在“三亚•财经国际论坛”上发表演讲,本文根据演讲内容整理。
我是一个计算机工程师,今天受邀来到一个财经论坛,对我来说是个很大的挑战。我看到昨天的议题,比如金融、货币、政府、外交,感到没有什么共同语言。我自己从工程的角度来看工业界,在过去50年,从1965年到今年,新诞生的超过千亿美元市值的民营企业,只有17家。在这17家里面除了最下面一排四家公司,全部都是IT企业,也就是说有13家IT企业。在过去半个世纪推动整个经济社会向前发展的主要新动力一定是IT科技,是毫无质疑的。
在67、68年分别成立了因特尔,他们都是半导体公司。到了70年代,几乎扎堆成立了四家千亿美元公司,分别是微软、苹果,他们是做计算机软硬件的。到了80年代,有华为等。这几家公司都需要做网络和电信,当我们有了计算机,需要把它们连接起来一起工作,网络和电信是最重要的。到了90年代,有了网络,有了因特网,用他们干什么,历史证明,最成功的应用就是零售。可以看到98年阿里巴巴成立,他们把零售带上了因特网,经过十几年的奋斗,现在对我们的影响已经非常大了。到2000年,谷歌、Facebook把社交等等带到了因特网上。所有因特网的服务和商品都可以借助这个平台影响到每一个人,这是非常非常重要的。可以看到其中的规律:在什么时代做什么事情是非常重要的。这些公司之所以成功,是因为他们在正确的时代做了正确的事情,而且他们都是他们所在领域的先驱,如果晚十年再做这些事情的话,恐怕就很难成功了。至少我们没有看到一个成功的例子。未来是什么呢?我的答案是人工智能。今天我想给大家普及一下什么是人工智能。媒体上对人工智能有好多渲染,有时候神化了它,有时候妖魔化了它,我希望通过我的介绍大家对人工智能有一个比较真实的理解。今天为止,大部分计算机都是用编程的方式工作的,我们给一条指令,再给一条指令,计算机就严格地按照指令序列执行任务。计算机其实是很笨的东西,它们只是执行我们的命令。从计算机发明到现在一直是这样工作的,但是我们越来越看不到一个前途,未来的计算机怎么变得比人更聪明。我有一个导师做了一个研究,他想扫描真正的人脑,下面我给大家展示一下这套系统扫描出来的人脑是长什么样子的。这张画面上显示的人脑是一平方毫米里的神经原的图像,无论一个人的智商怎么样,脑子里大概有两千亿到四千亿的神经原,这些神经原相互联结在一起形成了我们人脑的活动。有一个非常伟大的机器学习的方法,叫神经网络的方式,就是用纯软件的方式模拟一个类似于神经网络结构的数学模型,这个模式就是我们所说深度学习的模型,当我们教他们什么是猪,什么是狗,这就是训练的过程。深度学习是过去三十年,在人工智能里最伟大的一个进展,另外一个进展是传感器领域的进展。比如视觉系统,在过去几年最重要的成就就是深度传感器,它们可以把这个世界的三维结构扫描起来,比如可以用在自动驾驶汽车里面,用在人机互动的应用里面。举个例子,比如宝马公司在欧洲的一个生产线,宝马七系列的轿车在这里被生产,在这个生产线上只有5%的工序是由人完成的,其他的工序全部是由机器人完成的。为什么一定要用机器人来完成?是因为德国的工人太贵吗?并不是这样。为了造一辆汽车,它可以跑的很快,质量非常好,很稳定,可以连续使用20年,对工艺的要求非常高,只有机器人可以做到。再比如国内某家电商的仓库,我们在网上买东西的时候看到很多网页,非常简单,但背后是巨大的仓库系统,这个仓库有四五个足球场那么大,里面有近万个年轻的农民工们推着小车飞驰地奔跑,不停地把客户的订单从成千上万的货架上收集起来。在亚马逊的仓库里没有人,所有都是机器人。在今天的亚马逊,绝大多数的物流中心都已经使用了这套系统。现在已经有了医疗机器人,主要的目标是做体检,有什么问题给你迅速进行医疗诊断。这个功能非常非常发达。这个机器人可以给人动手术,这是件很棒的事情。我们往往都希望找一个老医生,他的经验最丰富,最好,但是当我描述下一个情况的时候,你可能会改变你的想法。大概在十年前,在哈佛医学院有一个病人,他当时还没有出生,但已经被医生判断得了先天性的心脏病,需要动手术。这个孩子当时只有29周,医生提前把他取出来,给他动开胸手术,所有的医生都不敢接这个活,因为他们手指的精度达不到这个要求。当时在这个机器手术刀上有一个镜头,捕捉了画面,传递给医生。医生在虚拟的手术刀上工作,它手指的动作传到心脏上,由更加细微的机器手臂进行操作。到今天,它还可以给成人动手术,代替开胸手术。有的时候一个手术需要在心脏上动刀,并且有缝合,首先把病人麻倒,把胸腔打开,打开胸腔的过程其实是一个非常残忍的过程,心脏是跳动的,没办法在跳动的心脏上动手术。这个手术对病人的伤害是非常大的,今天达芬奇机器人怎么做呢?他们把手术刀、相机、光源通过微创的方式,直接伸到体内看到你的心脏,这时候看到了一个跳动的心脏,医生是没有办法在跳动的心脏上动手术的,但是它有一个速度非常快的摄像头观察这个心脏。用1000桢每秒的速度跟踪这个心脏的跳动,用虚拟手术刀在画面上动手术,这是一件很伟大的事。还有一种机器人叫终结者,它是用来杀人的,很不幸的是人工智能最先的应用就是在杀人的武器上。我们今天知道,已经有很多机器人会杀人了,比如侦查飞机,一些地面作战的车辆。我们看看现实的生活,我在几年前参与了一个项目,规划这个项目的时候,我们希望能发明一个计算机,它就待在人的脸上,看到你看到的东西,听到你听到的东西,连接到互联网,互联网上有你所有的通信资料,有你所有的笔记和照片,还有整个互联网上无所不用其极的所有的知识库。我们希望发明这个设备未来能够成为人很好的帮手,最开始的时候它的名字叫“僚机”。我自己在研究生的时候,有个同学在网上跟很多女孩聊天,不停地用百度搜索知识,成功地吸引了很多女孩,问题是每次约会的时候都是见光死。当然我们并没有成功,因为我们的计算能力,在谷歌眼镜的时代,都不能达到实用的状态。但是我知道谷歌还在继续投入更大的力量研发这种产品。微软也在做同样的事情,微软发布了一个助手,叫Cortana。微软研究院的同事正在研究让Cortana跟人聊天。聊了那么多有趣的事情,我想告诉大家,不是每个机器人都必须是一个人的,它在我们的行业里可以做很多事情。比如我们公司做了这么一款摄像头,它可以看懂人在干什么。哪怕是在一个非常拥挤的环境里,这个画面里有30多个人,我们去检测、识别,并且记住每一个人,然后记住他们长什么样子。现在这个产品已经放在银行里使用了,帮助银行了解营业厅里客人的秩序、行为,在夜间的时候有没有发生砸机器的情况。在银行的金库里,有一个设备,打开之后里面有80万元的现金。在很多敏感的地方,我们可以帮助员工去看工作的时候每个操作是不是符合要求。我们有些合作伙伴用它放在博物馆里,研究观众对哪些作品更感兴趣,有些客户把它放在学校里,观察老师跟学生的互动,有些客人把它放在监狱里。真的是五花八门,最近甚至有些客户说把这个东西装到数据中心里。我们在汽车上做了一些事,今天我们有很多车了,慢慢看到了汽车的一些缺点,比如安全问题、污染问题、拥堵问题。我们要解决这个问题最重要的就是让汽车变得越来越安全,我们想设计一个人工智能帮我们开车。用人工智能开车的基本任务,第一是定位和导航,第二是防止碰撞。第三是对交通环境进行感知与互动。这个动机最早在美国的军事领域产生的,美国国防部要求大家开一个车,在越野的环境里自动的完成一个任务。这辆车是斯坦福大学的车,也是今天谷歌汽车早期的原形,这个车上装了很多传感器,这些都是以前用在军方的非常昂贵的传感器。今天汽车装的传感器系统,光传感器的原件基本上都超过200万。我始终相信通过图像处理就可以很好地完成自动驾驶。我们的愿望是能够通过简单的摄像头系统和一些低成本的GPS,完整的完成自动驾驶的任务。我们通过视觉可以算出来三维结构,它可以把图像信息转化成深度信息,每一个颜色代表的是距离,通过这个系统基本上可以探测出来障碍物在哪儿,其他的行人在哪儿。我展示一个特别憧憬的未来,未来我们的汽车可以选择自己开,也可以选择让计算机来开。当你选择让计算机来开的时候,在这个车上就会变得很自由,可以休息,可以看电影,可以工作,可以进行商务会谈。在长途旅行的时候,也不用担心自己可能会不小心睡着。我非常欣赏这种概念的产品,我非常确信,这样的产品应该在未来的五到十年就会跑在全世界的道路上,包括中国的道路上。在我们做汽车项目的过程中,接触了很多交通事故的信息,我惊讶地发现,有超过85%的致人死亡的事故,都是发生在十字路口。为什么十字路口危险呢?即使你遵守了所有的交通规则,但有另外一个人违规的时候,你就会被牵扯进来,而这种危险你是提前看不见的。因为人的眼睛职能看到光鲜,而光是直线传播的,来自一个拐角的危险我们是无法提前预知的。我给大家看一个最经典的例子。当我们反思这个事故的时候,发现没有任何方法来避免这个事故,因为你是绿灯,看不到前面有任何障碍,开过去了,这个事情就从天而降了。如果我们想避免这种事故,靠车是不行的。我们有一个方案,就是在十字路口的每个方向装一个摄像头,实时检测和跟踪每个人每一辆车,并且把他们运动的信息可以实时传出来,如果每辆车对自己做一个定位,他就可以预测这种事故的发生。我们有一套给交通管理系统使用的视觉管理系统,这就是做汽车的检测、跟踪还有识别。对汽车的识别过去可以做的是车牌号码识别,但我们的客户说这个还不够,他们发现真正的犯罪分子是没有人用真的车牌号码的,他们还要深度识别这个车的颜色、生产厂家、型号、哪一年生产的。于是,在我们的桌前就放了5000多种不同型号款式生产年份的组合,这在以前是无法想象的,随着神经网络的发展,我们可以在短短几个月的时间内完成这个任务。我们公司是在两年多前成立的,当时我回到北京在一个民宅里找到一些年轻人,开始做一些有趣的实验,我们发展的非常快,在过去的两年里获得了很多资本和媒体的关注。我们的新闻联播很有意思,在我们公司才两三个月的时候,就钻到民宅里采访我们,当时我们非常惊讶,说明我们国家对创新非常重视。在这两年里,我们的团队慢慢成长起来,我们收集了中国和美国最好的人才,跟我们在一起把人工智能慢慢从一个幻想变成现实,这是我们现在的办公室。
我们现在应该是一个漫长的黑夜即将结束,黎明快要到来的时候,最近有很多大公司,很多基金,都因为人工智能做了很多的动作,产生了很多的产品。我们真的非常需要这个社会更多的投入,无论是资本、人才还是政策。我今天还要表达另外一件事情,还有一个更重要的资源就是耐心,任何伟大的创新不会一蹴而就,对于我们来说,这个行业已经发展了四、五十年了,到今天开始出现一个井喷式成长的状态,即使如此,我个人认为,我们还需要花很多钱和很多人的青春在这里面投入十年,甚至二、三十年的时间,才能实现我刚才讲到的很多创新,才能真正改变我们的生活。这就是人工智能。谢谢!