首页 > 技术文章 > 朱松纯访谈录:初探计算机视觉的三个源头人工智能

whatyouknow123 2018-06-20 16:26 原文

作者:朱松纯,杨志宏

发表于:视觉求索公众号

人物简介:朱松纯,加州大学洛杉矶分校统计学和计算机科学教授;杨志宏,视觉求索公众号编辑

内容:

一、追溯计算机视觉源头的意义

(1)读史才能知得失。一个民族如果忘记了历史,她也注定失去了未来,这也同样适用于学科。

(2)目前做学术的人大多只关注进行近几年的文章,只知道这几年的历史和流行的方法。

(3)各种工业界、资本和投资界都在往里面炒作。

(4)网络上的信息良莠不齐,年轻的研究生通常缺乏免疫力,无法看穿一个推送是否软文。

 

二、计算机视觉和人工智能、机器学习的关系

(1)计算机视觉和人工智能的关系是:计算机视觉是人工智能的一个至关重要的组成部分。没有计算机视觉,人工智能就无法进入现实世界,只能成为一个空架子,做符号推理。

(2)计算机视觉和机器学习的关系是:计算机视觉是一个领域,而机器学习基本上是一个方法和工具。机器学习应用于计算机视觉,二者大概有百分之六七十是重合的。

  简单来说,机器学习中的“机器”就是统计模型,“学习”就是用数据来模拟模型。

(3)计算机视觉的起源的代表人物:David Marr, King-Sun Fu 和Ulf Grenander

 

三、视觉的开创者之一:David Marr的学术思想

Daivd Marr, 1945-1980。剑桥大学毕业,后来到MIT做博士后,然后是教授。他博士论文研究的是从理论的角度研究大脑功能。他的工作横跨了计算机视觉、认知科学和神经学,这三个学科。David Marr写了一本书《视觉:从计算的视角研究人的视觉信息表达与处理》。

David Marr的学术贡献主要有三条,从而基本上定义了计算机视觉的格局:
(1)理清了计算(表达或者模型)、算法和实现这三个层次。在计算的层次,进行问题的描述,定义任务与输入、输出。在算法的层次,选择不同的算法,可以并行也可以串行。在实现的层次,选择合适的硬件进行实现。当前的深度学习存在的一个很大的问题就是它将这三者混在一起,当它性能不好的时候,我们不知道是因为表达不对,算法不对还是实现不对。

(2)理清视觉到底要计算什么。他提出了一个系列的表达,从首要简约图,到深度简约图再到3D简约图。这里面包含了纹理,立体视觉,运动分系,表面形状等等。

(3)提出计算机视觉是一个计算的过程。他觉得计算机视觉不是单纯的求一个解,而是一个连续不断的计算过程。视觉是受任务驱动的,而任务是时刻在改变中的。这个贡献点在算法层面。

 

四、视觉的开创者之二:King-Sun Fu的学术思想

King-Sun Fu,1930-1985。美国伊利诺大学博士,后来到普渡大学做博士后,然后是教授。他之前的研究领域是计算机科学。他是ICPR,PAMI,IAPR的主席和创始人。

King-Sun Fu的学术贡献主要有三条:

(1)对学科和学会的建设,以及工程师的培养上。他是模式识别的开山鼻祖。

(2)句法结构性的表达与计算,就是句法模式识别。

(3)句法模式识别支撑了自底向上或自顶向下的计算的过程。

 

五、视觉的开创者之三:Ulf Grenander的学术思想

Grenander, 1923-2016。Stuckholm university博士,中间去了很多大学,1966年到他退休一直都在布朗大学。

Ulf Grenander的学术贡献主要有三条:

(1)提出analysis-by-systhesis的思想。这是产生式建模的核心理念

(2)提出了一整套的理论和方法,把代数,集合和概率整合起来。

(3)提出了很多求解非凸问题的方法。

 

推荐阅读