「导语」AlphaGo战胜了世界围棋冠军,但无论是聂卫平还是设计AlphaGo的谷歌工程师都无法理解AlphaGo为什么这样走棋,这就是人工智能中令人困惑的“不可解释性”问题。从这个问题出发,发现了一类全新的知识——“暗知识”。
一直以来人类知识可分为两类:“明知识”和“默知识”。明知识就是那些可以用语言、文字或公式清晰表达和描述的知识;默知识则是个人在感觉上能把握但无法清晰描述的知识,也即我们常说的“只可意会,不可言传”的那类知识。今天,人工智能突然发掘出了人类既无法感受又无法表达和描述的“暗知识”—隐藏在海量数据中的万事万物间的关系。介绍了机器学习五大流派从数据中挖掘暗知识的方法以及各自适用的领域,尤其是神经网络的基本工作原理和目前在商业上应用广泛的几种形态。
本文是对话录,作为对照,也引述了业界重要研究者的观点和见解,相互验证、互为解读。
价值中国:请您谈一谈,提出“暗知识”概念的相关背景?
王维嘉:过去两年我在硅谷做人工智能方面的投资,同时对那些基础的东西非常有兴趣。
我发现了一个重要的东西叫“暗知识”,“暗知识”就是人类无法理解的知识。什么叫人类无法理解的知识?这还要从阿尔法狗下围棋开始说起。阿尔法狗下围棋,让全世界第一次注意到人工智能的神奇。柯洁在下完棋后痛哭流涕,说我根本不可能打过他。它也让聂卫平五体投地,说阿尔法狗至少是20段。正当我们被阿尔法狗一棒子打晕的时候,他的妹妹又出现了,他的妹妹就是“阿尔法折叠”。2018年年底,谷歌在科学杂志上发布了“阿尔法折叠”的研究成果,根据DNA的序列测出一个蛋白质的三维结构。
大家知道,蛋白质是一个超级大的分子,它的三维结构决定了蛋白质的性质,所有的生物、人体、植物动物的细胞都由蛋白质组成。人类今天对蛋白质的理解还是非常浅的。
2017年的诺贝尔化学奖颁给了冷冻电镜的发明者Richard Henderson,冷冻电镜是干什么的呢?用来看蛋白质的三维结构。过去人类不知道,也无法看到蛋白质的三维结构,现在有了冷冻电镜,我们终于可以看到蛋白质的三维结构。怎么看呢?要把细胞冷冻了以后,照几十万张照片才能画出一个蛋白质的三维结构。所以,只要看清楚一个蛋白质的三维结构,那就是顶级期刊的一篇文章。
阿法蝶(叠)从基因序列准确预测蛋白质结构
那么一台冷冻电镜多少钱呢?一千万美金。我们去耶鲁,耶鲁人非常骄傲:我们有一台电镜。清华有两台。但是今天,“阿尔法折叠”只用人工智能就可以把它猜出来。怎么猜出来的?不知道。这就带来了一个巨大的问题:阿尔法狗下围棋,谷歌的工程师并不知道他怎么下,聂卫平也不知道。人工智能里出现了一个巨大的问题,就是不可解释性。
林永青:作为开场白,有一点明显的感触就是,相比较2016年阿法狗战胜人类围棋冠军的时候,今天业界的专家包括维嘉学长在内的业界专家,人们在情绪上更为乐观了,或许这两年大家更多地发现“人工智能”的局限性,更多地自我认同了人类的种种核心或独特优势。
我倾向于用“维度”来解释人类知识或人类认知。由于人类自身“生物熵”的局限性,我的“猜测”(卡尔-波普尔的知识论术语)是人类最多只能处理三个维度的信息(知识)。因此,人类认识论的哲学争论,也只不过停留在“一元论”与“二元论”这个非常可怜的层级。
什么是“维度”?就是“思维”的维度。维度问题离不开“时间”因素——今天多数人的“时空观”,只能理解到三维空间加上第四维时间——加上了时间维度,人们大致可以在认知上处理多维的,;但是,在“同时或共时”的约束下,人们。机器智能的区别就是维度区别。
爱因斯坦有句名言:想像力比知识更重要。不是吗?我们的知识,只是二维(最多三维)的因果或相关连接,而多维的想像力,就是我们一无所知的暗知识。
我有一个“猜想”,所谓“解释”,就是为知识建立某一角度(同一维度)或某一维度的“连接”。黑格尔很早就验证了“因果链”在逻辑上是苍白的,只是归纳法的运用而已,所以,我认为解释也不过是一种类比或隐喻,既不是演绎推理,也不是统计归纳,因此“解释”也就是一种意识连接、一种“无法解释”的暗知识“涌现”。
|