米乐m6(中国)官方网站

新闻中心

米乐m6人工智能的兴起|钱颖一对话汤晓鸥

2023-03-21
浏览次数:
返回列表

  米乐m62017年9月8日,钱颖一与斯坦福大学教授布莱恩•克比尔卡(左二)、腾讯公司董事会主席兼首席执行官马化腾(左三)、斯坦福大学教授张首晟(右三)、北京大学教授饶毅(右二)、商汤科技创始人汤晓鸥(右一)在清华经管学院对话

  钱颖一:我们这儿有一位人工智能的专家汤晓鸥教授。人工智能在这一年受到了全球的关注,从清华本科招生的情况中就可以看出来。我作为清华经管学院院长非常高兴地看到,今年清华计算机成了最受追捧的专业,显然跟人工智能是紧密相关的。在过去的几十年,你一直从事人工智能的研究,所领导的在中国研究团队的实验室,入选全球十大人工智能先锋实验室,做得非常出色。我想请你来讲讲,人工智能在过去这几年的突破,根本原因是什么?人工智能在未来的10年,哪些方面还会有新的突破?哪些方面不太可能有重大的突破?

  非常感谢今天邀请我过来。这里是中国最顶级的、最大的舞台,但是来了以后,没有想到这个“舞台”这么小(指报告厅的前台)。

  人工智能为什么变得这么热?从更高的层次讲,我跟饶毅的观点有一点像。如果不做人工智能,反过来说,那就是一种说法,就叫“自然的傻瓜”,所以不得不做人工智能。这个领域为什么会兴起来?从20世纪50年代开始就在做人工智能了,但是从50年代到2011年,我们线年,其实我们大家都不敢把自己的领域叫人工智能,有做多媒体的,有做计算机视觉的,有做机器识别的,有做语音识别的,没有人说自己是做人工智能的,因为什么都没有做出来。

  但是现在如果不管自己的领域叫人工智能,根本就融不到钱。所以每个人都管自己的领域叫人工智能。2011年是一个分水岭,为什么会有这个分水岭呢?有四个方面原因。

  第一,需求。之前手提电脑非常多,虽然这个电脑能移动,但是大部分情况下,人们不会拎着电脑去吃饭,不会出去旅游拎着电脑拍照。手机出来以后,摄像头变成了人的第三只眼睛,我们在微信上发得最多的就是照片或者是视频。一图胜千言,这时候产生了大量的数据,这些数据要分析,所以有刚需,这是第一点。

  第二,产生了大量的数据。这个量起来了,有手提电脑的人,1万多块钱一台还是很少的,但是红米手机一出来,500块钱一台,一个农民兄弟有两个。不到1亿的用户一下子变成10亿、20亿的用户。数据体量出来了,也是产生了训练数据的激烈竞争。

  第三,硬件的训练平台。原来我们用CPU、用超级计算机的时候,做人脸识别用了1000多个核,要跑两个月才能把一个算法跑出来。后来采用GPU,6台机器、10台机器,6个小时就跑出来了。所以,这给了实验室和小公司能力做这个事情。

  十几个人手设计的参数想解决全球的问题,设计各种各样的便捷条件,结果到现实中一用,没有一个条件是满足的,马上就不管用了。发表了大量的文章,一出来用不了。

  深度学习用网络框架,允许我用几千个、几万个、几十亿个参数,干脆不用去理解,直接覆盖就好了。这个时候再推出来,就可以在一些单向的应用上超过人类。在单向的应用上超过人的操作,就是可以代替人类来做这个工作。所以说这几个原因加起来,实际上是取得突破的主要原因。

  近期和远期人工智能在哪些领域是可以突破的呢?我觉得有三个方向用得比较多。一个是语音识别,这个相对成熟,也是第一个突破的。紧接着就是视觉,现在的主战场就是在视觉领域。我们先把听的能力解决了,第二个是看的能力。看的能力的场景是非常多的,这个是目前的主战场。第三个就是对自然语言的理解,是我们真正的大脑的功能。这件事情目前完全没有解决。关于视觉这个领域,回过头来我们讲到工业应用时再讲。

  人工智能在自然语言领域的应用变得很热,很多公司推出对话机器人,包括国外的公司。但是实际上这是一件非常难的事情,因为要求的背景知识和各种条件非常多。比如说我讲一句话:上次你交给我的事情我给你办了。“上次”是哪一次?是昨天、前天、一个星期前、一个月前、一年前?不知道。这个“事情”是关于什么事情?这个也不知道。所有这些背景都要知道,才能理解这句话,这需要非常多的信息。或者我评价一下台上的人,今天有化学家,有物理学家,有生命科学家,有“赚钱学家”,其实我说的是企业家。你说你是做经济的,跟我太太一个行业的,我管你们都叫“忽悠学家”。你想想,对自然语言的理解,机器怎么能做得到?“忽悠”这个词,是我们“东北特产”,一般人是理解不了的。

  要想真正理解我们这些对话是很难的。现在市面上的智能产品是什么呢?就是出门的时候找一些餐馆,问在哪儿看电影,诸如此类这些固定的场景。还有一些机器人,好像是能跟人很聪明地对话,实际上这些机器人,好多五点钟要下班的。我当时纳闷为什么要五点钟下班呢?因为后台有人在帮助解决问题,后台的人下班了。这是核心的点。

  是不是中国人这么忽悠呢?其实不是的。我有一个学生在苹果公司工作,他有一段时间很核心的工作就是召集各个团队的人过来每周开会。这些人就是来回答反馈回来的最难的那些问题,问得最多的问题,需要他们给出一个标准答案,每次回答就是那个答案了。

  所以实际上这个不是人工智能,是“人工智障”。我儿子对这个最喜欢,他拿了机器以后就骂,人家不理他,他就拿两台机器,让它俩对话。一直也没有骂起来,因为后台的人不骂。

  我再讲一个长远的,人工智能到底可能不可能控制人类?这个事情讲的是最多的。

  你听到的名人、网红讲的所有的事情,都是不可能的事情。这就够了,怎么说呢?我们做这个行业的人,在第一线做的时候很苦。过去几十年一直没有做出什么来,不好意思见人。我招生的时候说,到我们这个行业来,因为我们这个行业会持续很长时间,因为我们这个行业一辈子都做不出来。我们每年的成长速度是,前一年1%的成长,你算一下,22%到100%需要80年,这个活儿,我们是准备干80年的。深度学习一出来,我们真的是几年以内就干到了将近70%,识别率是95%以上。

  如果有一天我们这个领域的大佬从实验室出来了,米乐m6说我解决了机器人控制人类这件事情,我觉得只能说明一件事情,就是他该退休了,因为他太老了,这是绝对不可能的事情。一个是不要相信权威,权威说的话不一定是这个领域的权威。当然我的话是可以信的,因为我也不是一个权威。

  钱颖一:今天你说的最权威的一句话是:不要相信权威,但是你不是权威,所以你的话是可以信的。

  你来评价一下现在AI领域的投资,米乐m6热得不得了,你来评价,因为你是这里面的专家。AI的技术水平,咱们国家的这么多的研究团队,他们的研究水平跟世界其他的国家相比,现在是处在一种什么样的状况呢?原来是否法国人比较厉害呢?现在是不是还是美国的技术最好呢?

  汤晓鸥:这个今天讲不完,我简单讲一下。现在国家的规划是,到2035年赶上世界先进水平,大概是18年以后。核心研究,比如深度学习算法,真正的最早做的一批人,实际上确实是没有我们什么事儿。2006—2011年很多人做了很多的工作,他们在学术界受到了很大的打压。他们的前期研究没有跟传统的算法结合,不懂视觉,不懂语音,拿深度学习的理论去拼,拼不过。所以说,实际上他们是蛮痛苦的。但他们坚持下来了,2011年跟微软合作,微软懂语音以及深度学习,又有大量的数据,双方一结合,就线年开始发展起来,谷歌、脸书就把他们给收到公司里了,这一下子就发展起来了。

  中国人在里面其实没有起到什么作用。在2011年的时候,很幸运,我在微软研究院管过那个视觉组,有很多的合作,所以我第一时间听到了“深度学习”这个事情时,我们就压上了。现在学术界有一个特点,越“大佬”的学校越是不愿意转向,如果我做传统的,你让我做深度学习,我就承认我输给深度学习了。但是我们转得很快,我们在传统领域做得相当好,体量又大。转向以后,在前三届的学术会议上,总共有29篇文章涉及深度学习的研究,我们一个实验室做了14篇文章,将近占了全球研究的一半。在2014年人脸识别技术上,我们的技术是第一个超过人类眼睛功能的,后来跟谷歌竞争,取得了很好的成绩。我们开始做新的、实际的算法,18个专项技术,我们都是全球第一个做的。我们在起跑线上没有输,一直是领先的。但是基础研究领域,没有我们什么事儿。再往下走,我们拥有大量的数据,这个数据肯定比美国大,我们的人口就是美国的五六倍,我们有很多的应用场景,我就不说了。

  从国家的相关法律方面讲,其实是没有那么严格的。在限制方面,不像美国的法律制度很严,米乐m6中国的这个领域现在是一个灰色地带。所以我相信中国是有很多优势的,应该是不会太落后的,所以我还是很看好中国的人工智能的发展的。

搜索