米乐m6人工智能的兴起｜钱颖一对话汤晓鸥

新闻中心 NEWS CENTER

您当前位置：首页 > 新闻中心 > 行业资讯

米乐m6人工智能的兴起｜钱颖一对话汤晓鸥

2023-03-21

浏览次数：次

返回列表

　　米乐m62017年9月8日,钱颖一与斯坦福大学教授布莱恩•克比尔卡(左二)、腾讯公司董事会主席兼首席执行官马化腾(左三)、斯坦福大学教授张首晟(右三)、北京大学教授饶毅(右二)、商汤科技创始人汤晓鸥(右一)在清华经管学院对话

　　钱颖一：我们这儿有一位人工智能的专家汤晓鸥教授。人工智能在这一年受到了全球的关注，从清华本科招生的情况中就可以看出来。我作为清华经管学院院长非常高兴地看到，今年清华计算机成了最受追捧的专业，显然跟人工智能是紧密相关的。在过去的几十年，你一直从事人工智能的研究，所领导的在中国研究团队的实验室，入选全球十大人工智能先锋实验室，做得非常出色。我想请你来讲讲，人工智能在过去这几年的突破，根本原因是什么？人工智能在未来的10年，哪些方面还会有新的突破？哪些方面不太可能有重大的突破？

　　非常感谢今天邀请我过来。这里是中国最顶级的、最大的舞台，但是来了以后，没有想到这个“舞台”这么小（指报告厅的前台）。

　　人工智能为什么变得这么热？从更高的层次讲，我跟饶毅的观点有一点像。如果不做人工智能，反过来说，那就是一种说法，就叫“自然的傻瓜”，所以不得不做人工智能。这个领域为什么会兴起来？从20世纪50年代开始就在做人工智能了，但是从50年代到2011年，我们线年，其实我们大家都不敢把自己的领域叫人工智能，有做多媒体的，有做计算机视觉的，有做机器识别的，有做语音识别的，没有人说自己是做人工智能的，因为什么都没有做出来。

　　但是现在如果不管自己的领域叫人工智能，根本就融不到钱。所以每个人都管自己的领域叫人工智能。2011年是一个分水岭，为什么会有这个分水岭呢？有四个方面原因。

　　第一，需求。之前手提电脑非常多，虽然这个电脑能移动，但是大部分情况下，人们不会拎着电脑去吃饭，不会出去旅游拎着电脑拍照。手机出来以后，摄像头变成了人的第三只眼睛，我们在微信上发得最多的就是照片或者是视频。一图胜千言，这时候产生了大量的数据，这些数据要分析，所以有刚需，这是第一点。

　　第二，产生了大量的数据。这个量起来了，有手提电脑的人，1万多块钱一台还是很少的，但是红米手机一出来，500块钱一台，一个农民兄弟有两个。不到1亿的用户一下子变成10亿、20亿的用户。数据体量出来了，也是产生了训练数据的激烈竞争。

　　第三，硬件的训练平台。原来我们用CPU、用超级计算机的时候，做人脸识别用了1000多个核，要跑两个月才能把一个算法跑出来。后来采用GPU，6台机器、10台机器，6个小时就跑出来了。所以，这给了实验室和小公司能力做这个事情。

　　十几个人手设计的参数想解决全球的问题，设计各种各样的便捷条件，结果到现实中一用，没有一个条件是满足的，马上就不管用了。发表了大量的文章，一出来用不了。

　　深度学习用网络框架，允许我用几千个、几万个、几十亿个参数，干脆不用去理解，直接覆盖就好了。这个时候再推出来，就可以在一些单向的应用上超过人类。在单向的应用上超过人的操作，就是可以代替人类来做这个工作。所以说这几个原因加起来，实际上是取得突破的主要原因。

　　近期和远期人工智能在哪些领域是可以突破的呢？我觉得有三个方向用得比较多。一个是语音识别，这个相对成熟，也是第一个突破的。紧接着就是视觉，现在的主战场就是在视觉领域。我们先把听的能力解决了，第二个是看的能力。看的能力的场景是非常多的，这个是目前的主战场。第三个就是对自然语言的理解，是我们真正的大脑的功能。这件事情目前完全没有解决。关于视觉这个领域，回过头来我们讲到工业应用时再讲。

　　人工智能在自然语言领域的应用变得很热，很多公司推出对话机器人，包括国外的公司。但是实际上这是一件非常难的事情，因为要求的背景知识和各种条件非常多。比如说我讲一句话：上次你交给我的事情我给你办了。“上次”是哪一次？是昨天、前天、一个星期前、一个月前、一年前？不知道。这个“事情”是关于什么事情？这个也不知道。所有这些背景都要知道，才能理解这句话，这需要非常多的信息。或者我评价一下台上的人，今天有化学家，有物理学家，有生命科学家，有“赚钱学家”，其实我说的是企业家。你说你是做经济的，跟我太太一个行业的，我管你们都叫“忽悠学家”。你想想，对自然语言的理解，机器怎么能做得到？“忽悠”这个词，是我们“东北特产”，一般人是理解不了的。

　　要想真正理解我们这些对话是很难的。现在市面上的智能产品是什么呢？就是出门的时候找一些餐馆，问在哪儿看电影，诸如此类这些固定的场景。还有一些机器人，好像是能跟人很聪明地对话，实际上这些机器人，好多五点钟要下班的。我当时纳闷为什么要五点钟下班呢？因为后台有人在帮助解决问题，后台的人下班了。这是核心的点。

　　是不是中国人这么忽悠呢？其实不是的。我有一个学生在苹果公司工作，他有一段时间很核心的工作就是召集各个团队的人过来每周开会。这些人就是来回答反馈回来的最难的那些问题，问得最多的问题，需要他们给出一个标准答案，每次回答就是那个答案了。

　　所以实际上这个不是人工智能，是“人工智障”。我儿子对这个最喜欢，他拿了机器以后就骂，人家不理他，他就拿两台机器，让它俩对话。一直也没有骂起来，因为后台的人不骂。

　　我再讲一个长远的，人工智能到底可能不可能控制人类？这个事情讲的是最多的。

　　你听到的名人、网红讲的所有的事情，都是不可能的事情。这就够了，怎么说呢？我们做这个行业的人，在第一线做的时候很苦。过去几十年一直没有做出什么来，不好意思见人。我招生的时候说，到我们这个行业来，因为我们这个行业会持续很长时间，因为我们这个行业一辈子都做不出来。我们每年的成长速度是，前一年１％的成长，你算一下，22％到100％需要80年，这个活儿，我们是准备干80年的。深度学习一出来，我们真的是几年以内就干到了将近70％，识别率是95％以上。

　　如果有一天我们这个领域的大佬从实验室出来了，米乐m6说我解决了机器人控制人类这件事情，我觉得只能说明一件事情，就是他该退休了，因为他太老了，这是绝对不可能的事情。一个是不要相信权威，权威说的话不一定是这个领域的权威。当然我的话是可以信的，因为我也不是一个权威。

　　钱颖一：今天你说的最权威的一句话是：不要相信权威，但是你不是权威，所以你的话是可以信的。

　　你来评价一下现在AI领域的投资，米乐m6热得不得了，你来评价，因为你是这里面的专家。AI的技术水平，咱们国家的这么多的研究团队，他们的研究水平跟世界其他的国家相比，现在是处在一种什么样的状况呢？原来是否法国人比较厉害呢？现在是不是还是美国的技术最好呢？

　　汤晓鸥：这个今天讲不完，我简单讲一下。现在国家的规划是，到2035年赶上世界先进水平，大概是18年以后。核心研究，比如深度学习算法，真正的最早做的一批人，实际上确实是没有我们什么事儿。2006—2011年很多人做了很多的工作，他们在学术界受到了很大的打压。他们的前期研究没有跟传统的算法结合，不懂视觉，不懂语音，拿深度学习的理论去拼，拼不过。所以说，实际上他们是蛮痛苦的。但他们坚持下来了，2011年跟微软合作，微软懂语音以及深度学习，又有大量的数据，双方一结合，就线年开始发展起来，谷歌、脸书就把他们给收到公司里了，这一下子就发展起来了。

　　中国人在里面其实没有起到什么作用。在2011年的时候，很幸运，我在微软研究院管过那个视觉组，有很多的合作，所以我第一时间听到了“深度学习”这个事情时，我们就压上了。现在学术界有一个特点，越“大佬”的学校越是不愿意转向，如果我做传统的，你让我做深度学习，我就承认我输给深度学习了。但是我们转得很快，我们在传统领域做得相当好，体量又大。转向以后，在前三届的学术会议上，总共有29篇文章涉及深度学习的研究，我们一个实验室做了14篇文章，将近占了全球研究的一半。在2014年人脸识别技术上，我们的技术是第一个超过人类眼睛功能的，后来跟谷歌竞争，取得了很好的成绩。我们开始做新的、实际的算法，18个专项技术，我们都是全球第一个做的。我们在起跑线上没有输，一直是领先的。但是基础研究领域，没有我们什么事儿。再往下走，我们拥有大量的数据，这个数据肯定比美国大，我们的人口就是美国的五六倍，我们有很多的应用场景，我就不说了。

　　从国家的相关法律方面讲，其实是没有那么严格的。在限制方面，不像美国的法律制度很严，米乐m6中国的这个领域现在是一个灰色地带。所以我相信中国是有很多优势的，应该是不会太落后的，所以我还是很看好中国的人工智能的发展的。

上一篇：智能新科技交通新未来米乐m6

下一篇：赛创意拼脑力重庆市青少年米乐m6智能机器人编程大赛复赛顺利举行

米乐m6(中国)官方网站

首页

关于米乐m6

新闻中心

产品展示

留言板

咨询研究

联系米乐m6

新闻中心 NEWS CENTER

米乐m6人工智能的兴起｜钱颖一对话汤晓鸥