2050大会走向通用人工智能专场总结

2021-04-28

(本文转载自”混沌巡洋舰”，点击阅读原文查看)

这两天主持了阿里云A组召集的杭州云栖小镇的2050大会《走向更加通用的人工智能》专场。活动分为论坛和深度交流两部分。也邀请了来自神经符号，类脑计算，复杂系统的很多朋友共同交流。

我觉得如果来总结这个主题，我会从“更加通用”来破题。因为现在通用人工智能AGI这个词一定程度被大量滥用，比如像人一样的人工智能，有意识的人工智能，能够威胁人类的人工智能等。唯独忘记了其实人工智能诞生之初它的原意就是通用人工智能，也就是从各个方面得到一套求解各类不同任务的模型。由于任务难以达到我们才走了符号主义连接主义等更狭义的路线。因此我觉得“更加通用” 事实上说的正是我们可以从某种程度回到人工智能建立的初衷，但是我们不求一步到位的一种温和保守的态度。而在这个时代背景下，因果，符号，类脑计算，深度学习等领域的专家本质是从各自的角度来回归到这个主题之下。

当下这个时代需要一个契机把这条道路上的同学们汇聚到一起来研讨这个体系，也正是这个会议的初衷。

现在言归正题，我们就来总结下这个简短的活动里所传递的思想。

1，为机器人提供一套通用的操作系统

这个是我所在阿里组所做的核心工作。因为当下的机器，即使是智能机器依然不理解人的语言，虽然我们的CNN算法可以给机器提供眼睛， CNN+LSTM让机器具有听懂声音的潜力，但是语言，视觉和硬件确是三者相互独立的。那么有什么方法可以把这三者打通，让机器人不仅有眼睛有耳朵还可以有一套大脑来调用它们，与人交互，完成任务？这在本质上召唤一套可以应用于不同硬件的操作系统，让不同的机器使用同一套大脑处理单元。

2, 地上与太空的AGI

来自清华的蒋老师给大家带来了精彩的对人类未来进行展望的宏大篇章。这个talk更多从AI变得更加通用后对社会的影响入手，因为AI具备更加类人的认知推理能力后，加上其巨大的算力，首先会对生产层面产生革命性的影响，取代当下即使高端的产业工人，而后，这种决策能力将引入真正的数字政府，从而对社会政治治理产生决定性的影响。这时候人本身存在的意义是什么？这时候真正的通用AI给人类提供了一个伟大的机会就是征服深空，它将引领人类重新经历一次从经济到文化的辉煌（就像大航海时代带来的欧洲资本主义文化的兴起）。为什么探索太空需要更加通用的AI，因为本质上探索外太空这类的开放任务需要机器真正具备人一样在全新问题面前的解决力和创造力，这是当下狭义AI所不具备的。

3，从类脑芯片角度看AGI

当今的AI发展基本靠算力，而随着摩尔定律上限日益临近，这种算力需求最终将达到某个瓶颈，就像最近我们所经历的显卡涨价所暗示的。然而，我们去想象生物好像不需要那么大的能量，我们每天只需要吃个馒头，就可以完成高深的数学证明了。即使是一个个小小的蜻蜓或苍蝇，也可以非常灵活的趋利避害而无需大量燃料。这说明什么？生物大脑的能量使用方法远比当下深度学习所用的芯片高效。这可以归结于生物神经元采用脉冲（某个瞬间信号）而不是连续放电传输信息，同时生物神经元的连接比较稀疏，传输耗能更少。如何模拟生物神经形态达到类似的能耗比？这正是神经拟态运算的潜力。这样做的结果会大大拓展AI算法在不同行业的通用性，可以进入到之前所无法想象的情景，比如猪圈或大型农场，因为这种场景下节能是必须的。同时，除了节能外，模拟生物神经算法的潜力要大的多，当然很多这类算法已经变成了当下的深度学习，比如CNN和LSTM。

深度交流环节：

在这个环节里我邀请了很多巡洋舰积累下来的朋友，很多没法到现场的来自不同学科的通用AI关注者交流发表了自己的想法。

1，视网膜启发更通用的人工智能

来自复旦的张老师给大家带来了从微观脑启发看走向通用智能方法的思考，人脑对视觉信号的处理，视网膜承担了很大一部分。而视网膜算法也是被神经生物学者理解的比较透彻的一块，这部分算法里一个比较核心的部分，是对一些最基本的特征的提取，这部分几乎是先天的，比如方向选择性，这在对变化的视觉世界，尤其是动态特征的提取上是极为有效的。加入这些特征可以使得当下的深度视觉追踪算法提高不少。

这部分工作的本质依然是从类脑的角度看如何通过逐步集成大脑不同局部网络的算法来实现，虽然有很多关键性的争论，有的人认为无需从细节模拟大脑，有的人认为这是必经之路，理解我们大脑本身的意义是无量的。

2，因果角度看更通用的人工智能。

中科研的龚鹤扬博士带来了关于通用人工智能的实现之路的思考。实现通用人工智能的认知部分的一个核心就是逻辑和因果推理。而因果推理本身被认为是实现通用人工智能的关键，关于因果和智能的关系本号多有涉猎。

3， AGI的研究困境

来自北大的AGI研究者徐博文同学的分享。 AGI这个词一定程度被滥用了，研究AGI的学者往往被认为民科或边缘分子，而研究AGI的学者存在自身的生存危机，因为极少的用人单位和论文收入，使得这部分人的生存本身存在一定难度。徐同学的分享可谓是入木三分。我想这也是为什么我把整个论坛的基调定为了走向更加通用的人工智能而非AGI这三个字母的背后动机吧。

4， Nars逻辑系统看AGI

渤海大学刘凯老师的分享。如果说当下有一套系统可以称上专门为未来通用人工智能设计，那么王培教授设计的Nars一定首当其冲，这是一套基于逻辑的通用智能系统。因为逻辑思维是人类智慧最有效的一种方法，而模拟逻辑就成为实现更通用的人工智能一个不可避开的方向。Nars系统对人的思维的模拟却不仅只有逻辑，它用九层清晰的结构，把从理性逻辑，到非理性的情绪统一起来，从而使得Nars推理更像人而不是冰冷的机器， Nars系统是人工智能里的另类，却代表了当下AI界所难得的一种骑士精神。

5，双曲几何看知识表示

深度学习的成功很大程度来自其充分利用了高维空间的流型嵌入。但是我们对几何空间的想象多限于欧式，而在对知识的表示上，双曲空间是远远更强大的一种方法。双曲空间的一个重要特征是不具备交换律，对于正交的两种运算，比如欧式空间里沿着x和y各走一步，或者y和x各走一步，这个效果一致。但是在双曲空间里，这个运算规律不成立。这特别适合模拟那种不可交换的关系，比如你爸爸的哥哥是你叔叔，你哥哥的爸爸就不一定了。而且，双曲空间由于其自身的曲率，可以把一个无限分叉的树结构放在有限结构，而我们知道，大部分的知识表示是树结构的，因此采用双曲空间可以特别好的嵌入复杂的知识。

这一类研究可以看做是更加通用的智能背后可能的数学突破，而数学是所有现代科学的基础。

我们总体来看走向更加通用的人工智能的脉络：

本质上我们看到当下时代的机会，从不同的学科角度我们走向更加通用的人工智能。如同以下这张大图描述的：

无论是计算神经启发，类脑框架启发，认知模型启发，深度学习启发，本质上都要解决几个当下狭义AI所难以解决的核心问题：

这几个问题每一个对于当下AI进一步产业化都是致命的，需要大量样本的训练使得算法无法在大部分缺少标注数据的领域落地。而常识的缺乏就更加致命，事实上当下还没有一个approach能够真正靠近解决常识问题。这使得像无人驾驶这样的领域，在到达一定程度后将面临无限多的corner cases，你在前面的汽车上画上一个美女或几朵蓝天白云都可以摧毁无人驾驶的自动决策，因为单纯来自数据模型堆积出来的感知能力是无法真正理解这些边角纹理背后包含的真实的实体信息。无法真正解决常识问题，也就是当下AI最大难题所在。

解决上述的问题绝不仅靠某个特定领域，而是要靠几个领域的通力合作。比如上面讲到的常识问题，从因果角度看，它是一个包含世界上的物理，经济学等基本知识的有向无环的因果图，从复杂系统角度看，它是各种基本要素间的相互作用，在符号的角度，它是大量的集中了人类知识本体的图谱，而从类脑计算角度看，它是无数概念细胞构成的一个共同体。从深度学习的角度，它是大量数据堆积出来的高维向量。但是这些单单某方面都不可能完全解决刚刚说的无人驾驶中的问题。

因此，这次会议的最终目标，也是为了建立这样一个跨学科的联盟，为我们能够达到更加通用的人工智能一起努力。我们可以就这个领域共同的难点如目标管理，常识学习，定期的展开研讨会，甚至训练营。

原文始发于微信公众号（2050团聚）：2050大会走向通用人工智能专场总结

2050 Footprints

2050大会走向通用人工智能专场总结