朱松纯访谈录：初探计算机视觉的三个源头人工智能

作者：朱松纯，杨志宏

发表于：视觉求索公众号

人物简介：朱松纯，加州大学洛杉矶分校统计学和计算机科学教授；杨志宏，视觉求索公众号编辑

内容：

一、追溯计算机视觉源头的意义

（1）读史才能知得失。一个民族如果忘记了历史，她也注定失去了未来，这也同样适用于学科。

（2）目前做学术的人大多只关注进行近几年的文章，只知道这几年的历史和流行的方法。

（3）各种工业界、资本和投资界都在往里面炒作。

（4）网络上的信息良莠不齐，年轻的研究生通常缺乏免疫力，无法看穿一个推送是否软文。

二、计算机视觉和人工智能、机器学习的关系

（1）计算机视觉和人工智能的关系是：计算机视觉是人工智能的一个至关重要的组成部分。没有计算机视觉，人工智能就无法进入现实世界，只能成为一个空架子，做符号推理。

（2）计算机视觉和机器学习的关系是：计算机视觉是一个领域，而机器学习基本上是一个方法和工具。机器学习应用于计算机视觉，二者大概有百分之六七十是重合的。

　　简单来说，机器学习中的“机器”就是统计模型，“学习”就是用数据来模拟模型。

（3）计算机视觉的起源的代表人物：David Marr, King-Sun Fu 和Ulf Grenander

三、视觉的开创者之一：David Marr的学术思想

Daivd Marr, 1945-1980。剑桥大学毕业，后来到MIT做博士后，然后是教授。他博士论文研究的是从理论的角度研究大脑功能。他的工作横跨了计算机视觉、认知科学和神经学，这三个学科。David Marr写了一本书《视觉：从计算的视角研究人的视觉信息表达与处理》。

David Marr的学术贡献主要有三条，从而基本上定义了计算机视觉的格局：
（1）理清了计算（表达或者模型）、算法和实现这三个层次。在计算的层次，进行问题的描述，定义任务与输入、输出。在算法的层次，选择不同的算法，可以并行也可以串行。在实现的层次，选择合适的硬件进行实现。当前的深度学习存在的一个很大的问题就是它将这三者混在一起，当它性能不好的时候，我们不知道是因为表达不对，算法不对还是实现不对。

（2）理清视觉到底要计算什么。他提出了一个系列的表达，从首要简约图，到深度简约图再到3D简约图。这里面包含了纹理，立体视觉，运动分系，表面形状等等。

（3）提出计算机视觉是一个计算的过程。他觉得计算机视觉不是单纯的求一个解，而是一个连续不断的计算过程。视觉是受任务驱动的，而任务是时刻在改变中的。这个贡献点在算法层面。

四、视觉的开创者之二：King-Sun Fu的学术思想

King-Sun Fu,1930-1985。美国伊利诺大学博士，后来到普渡大学做博士后，然后是教授。他之前的研究领域是计算机科学。他是ICPR,PAMI,IAPR的主席和创始人。

King-Sun Fu的学术贡献主要有三条：

（1）对学科和学会的建设，以及工程师的培养上。他是模式识别的开山鼻祖。

（2）句法结构性的表达与计算，就是句法模式识别。

（3）句法模式识别支撑了自底向上或自顶向下的计算的过程。

五、视觉的开创者之三：Ulf Grenander的学术思想

Grenander, 1923-2016。Stuckholm university博士，中间去了很多大学，1966年到他退休一直都在布朗大学。

Ulf Grenander的学术贡献主要有三条：

（1）提出analysis-by-systhesis的思想。这是产生式建模的核心理念

（2）提出了一整套的理论和方法，把代数，集合和概率整合起来。

（3）提出了很多求解非凸问题的方法。

朱松纯访谈录：初探计算机视觉的三个源头人工智能

推荐阅读