李世鹏：“集”中生“智”

国际欧亚科学院院士深圳市人工智能与机器人研究院执行院长
演讲全文>>

“集”中生智

李世鹏：大家上午好，我是李世鹏，来自香港中文大学深圳市人工智能与机器人研究院，很高兴有这样的机会给大家分享一下人工智能的一些前沿研究。

大家从这张图看到，我这里叫“集中生智”，左边是网络，右边是智能。接下来给大家讲一下，其实人工智能跟我们的网络互联有着密切的关系。

我们回顾一下互联网的发展史，我们知道互联网的出现彻底改变了我们的生活，我们生活中的方方面面到今天已经离不开互联网了。

互联网的实质是打破了距离的限制，不单连接信息，也连接信息到人。

今天我们享受所有的互联网给我们带来的一些好处，完全归功于它把信息连接起来了，把信息跟人连接起来了。

在互联网的基础上，我们有了社交网络，社交网络打破了维度的限制。我们知道，以前在没有互联网的情况下，人际圈子就是我们生活周围的一些人。

今天有了互联网，我们可以建一个更大的网络圈子，它不单把人连接起来了，同时把人的思维也连接起来了。

通过互联网，通过每个人在上面的一些活动，我们能很清楚知道每个人在想什么东西。

接下来互联网发展到了移动互联网。移动互联网就更进一步打破了时间和空间的限制。

我们无论在什么时间，无论在什么地方，都可以使用互联网，我们在网上可以进行各种各样的操作，它连接信息和位置，也连接人和位置，这跟以前固定的互联网有重大的区别。今天我们所熟悉的在手机上做的各种活动，都归功于移动互联网。

接下来是物联网。物联网真正打破虚拟世界和现实世界的界限，它连接了物理世界与数字世界，把整个物理世界数字化了，把物理世界由一个不可计算的世界变成一个可计算的世界。

我们说的很多东西包括数字孪生都归功于物联网。

5G网络。大家知道现在5G特别热，5G网络带来什么呢？

它实际打破了带宽、时延的限制，让我们可以在大带宽、低延时的情况下传输很多东西，让我们可以远程连接一个实时世界，让我们真正可以实现一个时空的“穿越”。

也就是说我们虽然不在那个地方，但可以通过5G网络进行实时操纵或者是活动在远程实际里面。

接下来大家就是大家知道的量子。

量子这个词现在也特别时髦。但它是一个特别深的课题。量子纠缠究竟会带来一个和传统有什么不一样的东西呢？

它彻底打破了我们传统通讯方面的一些概念。因为量子纠缠本身的含义就是不管这两个量子相隔多远，总是同时发生状态变化，一个量子发生状态变化，另外一个量子也会同时产生相应的变化，没有任何时延。

很神奇，对吧？这就彻底颠覆了我们熟悉的一些传统的通讯原理。那么量子纠缠会给我们带来什么？量子通讯、量子计算等一些崭新的学科。

今天，大家知道人工智能是一个特别热的课题，不管在研究上，还是在应用上。

人工智能的实质是打破了数据处理的瓶颈，前面说的种种网络产生了巨大的数据，怎样有效地处理这些数据呢？

按照传统的一些处理方法已经处理不过来了。人工智能通过机器学习的方法，从人类标注的数据里学习到一些模型，让我们用有限的算力处理更多的数据，产生我们想要的一些结果。

人工智能实际上是连接人类智力到机器智力的桥梁。

谈起人工智能，就涉及到具体的深度学习。深度学习是近十年来人工智能发展最伟大的一个进步。其实深度学习也没那么神奇，它是个什么概念呢？

简单打个比方，深度学习其实类似我们考试的时候的“押题”。

我们知道考试之前，你把试题押对了，你学习了，你在考试的时候正好碰上了你押的题，那就会得高分，反之考试结果就可能没那么理想。

现在人工智能的本质也是这样，它是依靠大量的训练数据来训练一个模型，最后再放到实际中进行测试。

如果训练集包括测试集，效果就很好，反之就可能不理想。那么今天为什么我们说人工智能在很多方面起了巨大的作用呢？

这是因为我们的训练集远大于测试集，不管人脸识别也好，不管语音识别也好，人类提供给深度学习引擎大量的数据。

所以它可以在大部分情况下做到我们想要的事情，甚至有时候超越人类的能力，这就是深度学习的本质。

从某种意义来说，前面说的所有的网络，包括物联网、互联网、社交网，本质上是关于数据。

数据的核心是关于人的数据，关于物的数据，还有一个往往被大家忽视的，就是关于环境的数据。

我们在提取数据的时候往往忽略了它所处的一些场境。

今天我们把这个场境也放到人工智能的大框架里面，就发现以前很多东西被我们忽视掉了。

把一个场境放到这里面，就会取得更多的智能，这尤其会涉及到他们之间的关系还有他们之内的关系，包括联结、关系、交互、集合和协作的一些数据。

人工智能正是把数据、知识，还有情境这些数据融合在一起才能形成的智能。以前的深度学习，大家考虑更多是数据。

近几年的深度学习框架越来越考虑到知识。未来我们会把场境，包括时间、地点，为何，如何把这些信息融入这些新的框架里面，能取得比以前更强的智能。

再回过头说物联网。物联网其实是连接物理世界跟数字世界的一个桥梁。最开始的物联网实际上也没那么多智能。

基本上就是一些传感器，它用于采集物理世界的数据，数字化物理世界，然后把数据传给处理器处理，所以采集和通信是它两个主要的方面。

基本的物联网是没有太多的智能。

即使有智能，可能仅限于IFTTT。大家可能不知道IFTTT是什么意思，实际上英文就是（If this, then that）。

就是说如果这样，然后那样，所以它是一个简单的一个逻辑电路，一个基于条件的逻辑反应。

在这个阶段，物联网集中在通知的功能，它更多需要人工去做一些工作。通过物联网连接的家电，我们就叫智能家电，大部分功能还是限于可以遥控它，因为它联网了，但其实它没有太多的智能。

大概5年之前，AIoT这个名词出现了，AIoT就是智能物联网。这个时期才真正把一些智能的因素引入到物联网里去。

在AIoT时代，我们把一些自然交互，一些数据处理的功能放进来，用AI的方法来解决，开始对数据进行处理和计算。

我们知道，在AIoT产品里面，大家可能用得最多的就是智能音响。

你跟它说，比如说阿里的天猫精灵，还有亚马逊的Alexa，就可以通过AI的接口更加自然地进行交互，这就是AIoT的特色之一。

AIoT在算知、感知方面有很多进步，它对特定任务处理做得很到位。比如说你问一个，Alexa，今天天气怎样，它会很明确给你今天天气预报，而且用自然语音告诉你。

这类东西是AIoT中现在大部分人、厂家和服务商在研究的一些内容。

将来是什么？将来并不仅仅通过网络把IoT的设备连接在一起，把人工智能的处理方法放进去，而是把多个智能体联系在一起。

它主要看重的是人群或者是一个智能群体在一起，能产生什么样的效果。虽然我们每个单个智能体能力有限，但它们联合起来就能达到更大的目标，具有更强的功能，这就是智联网，英文叫Internet of Intelligent Things。

回过头来，协作是物联网的内在的属性。物联网就是要靠不同的设备、不同传感器、不同智能体之间的协作，这样才会把它的功效发挥到最大。

不管是对智能的数据处理，还是智能交互，甚至智能协作，都离不开里面各种物体的协作。

下面给大家通过几个例子展示一下什么是物联网之间的协作。第一个实际上就是一个基本IoT的设备资源协作。这里有一个视频，放给大家看一下。（播放视频）

大家可以看到，这个视频反映了一个很简单的设备之间的合作。

这里面只需要用到一个设备之间相对定位信息，动画人物就可以从一个屏幕跳到另外一个屏幕。

还有一点，它一定需要一个中心的控制器来控制这样一个人物从一个屏幕跳到另外一个屏幕。这是一个很简单的例子，仅通过简单的位置传感器可以做到屏幕之间的协作。

刚才说了AIoT，AIoT的协作其实是在另外一个维度。

这里面我给大家举一个例子，刚才提到智能音箱，智能音箱里面很重要的，也是很难解决的问题，就是远场语音识别，远场语音识别为什么困难？

距离远了，声音信号就弱，信噪比就低了，识别率就低了。距离远了的话，要么就扯着嗓子喊，要么就走到离设备离得很近的地方，现实中这是一件很麻烦的事情。

今天通过多个智能音箱之间的协作是不是就能把这个问题解决呢？答案是有的。

我可以多布置这样一些互相连接的智能喇叭，在你跟它进行交互的时候，你就以正常的语音讲话，离你最近的那个喇叭就可以把你的声音收集过来进行识别。

虽然你是离其他喇叭比较远，但因为你有这样一个协作关系，你可以通过一个离你最近的喇叭控制所有其他的喇叭，所以这是AIoT的协作。

大家可能没有意识到这样一做，还有一个额外的好处，因为现在我的位置信息定了，比如说我在这个房间里讲话，离我最近的一个喇叭反应了，它就知道我离这个喇叭最近。

大家如果用过比如说Alexa的话，我们知道你要给它下达一个命令是很困难的，因为你必须说全了。

比如说打开电视，你必须说打开起居室的电视，还是卧室的电视。

今天通过协作，我在卧室里说打开电视，肯定是会打开卧室里的电视，不用说特别长、特别明确的命令，这就是场境在这里面起到一个很关键的作用。

关于群体的协作，不知道大家小时候有没有观察过蚂蚁？我小时候比较爱看蚂蚁上树，其实里面有很多有意思的东西。

这里面是总结出来的一个，不是我总结的，而是一个很经典的一个例子，就是说的这个群体效应。

蚂蚁没有通讯功能，彼此之间没有像人这样的语言，或者是一些其他的方式，甚至是声音，它只能通过信息素通讯，通过信息素交流，它没有别的方法。

这个例子说的是，开始蚂蚁从食物源取食物到蚁穴里去，如果中间没有障碍物，它的路径是直线。

但你加一个障碍物之后，你会发现到最后所有的蚂蚁会按照一个最佳的路线去运送这个食物。

为什么会做到这一点呢？因为它没有通讯，只能通过信息素进行交流。

很多蚂蚁在走过的路径上留下信息素，通过多个蚂蚁在一个路径叠加的信息素越来越多，它就觉得这是一个最佳路线。

最优路线其实是整个蚁群一起记录的。另外一点，它的交互是分布式的、鲁棒的、自适应的，你再把中间的障碍物移动一下，它又会新生成一个新的最佳路径。

所以，蚁群是通过这种方式进行交流和协作，这是一个群体的行为，它们在测试各种各样路径的时候，群体就走出最佳的路线，这是自然界对我们的一个很有意思的启示。

另外一个例子，给大家看一个视频，看看鸟群会做一些什么事情，这个视频是英文的，看完以后，我再给大家解释一下。

大家通过这个视频看到一些鸟群在一起一些很神奇的现象。

第一个，鸟群在一起变得很强大，或者至少看起来很强大。

大家看到一只老鹰一直想抓一只鸟，但它不敢靠近，群体在一起显得更强大。第二点，大家有没有注意到，所有鸟的个体实际是一个智能体，它有自己独立的一些判断和飞行的模式。

但是它们整体在一起，成千上万只鸟在一起的话，它是怎么进行通讯和反应的，保证没有两只鸟会碰撞在一起。

这给我们很多启示，第一个，通讯机制是什么，第二，它反应机制是什么，为什么这么多鸟在一起飞，而且会沿着一个大的方向去移动，或者去变化，保证所有鸟都不会碰撞。

这对我们多智能体协作有很多启示。

回到刚才所说的智联网群体协作的一些准则。

这里面我觉得最重要的一点，就是怎样在一个群体中制定一些基本的规则，大家都按照这个规则进行各自的运动，同时，也会不妨碍它自身的自主的一些想法，或者是一些运动。

这里面有效通讯也是一方面，还有一个，它必须知道自己的能力，也必须知道群体的其他伙伴的能力。

再举一个例子，这里面我还是以蚁群的例子。

蚂蚁是一个很神奇的小动物，虽然很小，但它给我们带来很多启示。

这是一个现实中的现象，蚂蚁要跨越一个没有桥的一个路径时，很多的蚂蚁会连接起来搭这个桥让其他蚂蚁在上面通过。

根据这样的启示，我们深圳市人工智能与机器人研究院的林天麟教授就做了一款机器人，跟这个很像。

在这个视频里，他设计了单个智能体，自己本身有很多的能力，比如说运动、爬行，还有一些导航能力。

但最强是多个智能体如何自主地在一起进行协作，达到以前没有的一些能力。比如说它们协作爬楼梯，比如说他们协作翻越一个东西等等。

我们通过自然的启示就把这个做起来，这里面的想象空间无穷之大，我们可以用多个单体智能机器人实现遇山开路，遇水搭桥的功能。

另外一个例子就是车路协同。单个自动驾驶的车永远超不过人类驾驶体验，因为视野其实都受限在车这个位置上。

如果我们把路的信息也放进来的话，我们就会发现其实可以做到更安全、更可靠。

比如说我们知道，弯道不能超车，因为你看不见对面是不是有车来，但今天通过车路协同就可以做到这一点。

我们想达到什么样的效果呢，我们看一个视频。（播放视频）精彩的部分来了。

其实将来如果车路协同在一起的话，完全可以极大地增强了我们通过交通路口的效率，但这仅仅是一个例子。

看起来很可怕，是吧？我们现在通过车路协同，可以真正做到车辆组队通过路口。

另外一个就是提到人跟机器之间的关系。我们知道将来的社会，机器人会越来越多地进入到我们日常的生活。

那么人跟机器之间怎么进行交互，怎么去协作，这之间有什么准则，包括一些伦理方面的问题，实际上都是我们在研究的一些课题。

还有一个刚才说到的自动驾驶。自动驾驶如果仅仅利用像现在的深度学习框架，一定会在某一时间遇到它自己处理不了的情况。

这个时候该怎么办呢？机器怎么样可以提醒人类说，对不起，现在的情况我无法处理了，人要接管，而且接管过程要变得平滑，不能说撞上去了，人再接手。这也是另外的一个研究的课题。

另外一个是人类群体智能，今天的智能说是人工的智能，为什么？因为我们要为学习引擎提供很多的数据，这些数据是靠人类来标注的。

那么除了我们人类标注是发挥人的群体智能的一个方面，有没有更深刻的一些人工智能框架，把人类智能，比如说提炼规则、认知学习的过程也整合起来，变成更强的智能呢？这也是我们在研究的课题之一。

还有一个，现在我们对数据处理只是考虑到它的相关性，而没有考虑它的因果性。

要考虑因果性，我们要整合更多的数据，也就是知道事物数据发生的一些时序和背景，也就是前面说的场境。

这是我们将来实现因果性推理的决定性的因素。如果大家对这方面感兴趣的话，我建议大家读一下Judea Pearl教授的《the book of why》

我的演讲就到这里。总结一下，新的通信方式及计算方式能联接更多的数据、设备、人群、智力，物理和数字世界的界限逐渐消失，人工智能水平不断提高，通过协作而获得能力会越来越强。

我们有一个美好的未来值得我们去期待。

谢谢大家！