山东招生咨询网

首页<<校园文化 > 玩转校园

搜狗CEO王小川：未来人工智能的未来之路

更新时间：2017-2-16 8:48:24

在第三届世界互联网大会上，搜狗公司首席执行官王小川发表了关于人工智能的主题演讲，王小川认为，未来的人工智能有三个方向：识别、创造与判断，而其中有重要意义的是在判断。王小川相信随着技术的突破，搜索引擎会自然而然演化成为问答引擎。
    AlphaGo，作为引爆人工智能的开端，深度学习在其中承担了最重要的责任。AlphaGo之后，最重要的突破领域是在语音和图像领域，在文字领域的进展很缓慢。今天我们在机器翻译方面取得了一些突破，但是问答和对语义的理解是不够的。回到图灵测试，上个世纪五十年代图灵提出了问答机器推想这样一个概念，今天我们直观感受是语音图像进步很快，但是自然语言的处理其实是比较慢的。
    抛开技术，人工智能有三个产品方向，一是识别——语音识别、图像识别、视频识别；二是图像——我们去生产图像，生成识别；三是创造。大家提到了人工智能进步的层次，我想换一个方式描述——工程师在人工智能时代会处于越来越重要的位置。我们开始提到传统的方法是把规则教给机器，随着统计系统的发展，包括深度学习，我们开始更容易地将答案教给机器。在数据的积累下我们就可以让机器变得更加聪明。这里面更前沿的方式是将目标教给机器，AlphaGo融合了几套算法，但这样把目标教给机器的强化学习，还并不成熟，也就是说如果没有之前三千万局人机对战的棋谱的话，AlphaGo没能够做到只通过强化学习来战胜人类，这是技术层面需要往下突破的重点。如果将目标教给机器，机器能够做自我学习，这方面有新的突破，那我们离新的人工智能时代就更近了。
    那么现在以深度学习为代表的人工智能技术，还有哪些不靠谱的地方？在产品上不适用之处有哪些？
    第一个问题，语音识别靠谱吗？在百度、腾讯，都提到了语音识别的能力，今天我给大家的演示也用到了语音识别，这是搜狗自己的技术。在安静的环境里面我们的识别准确度已经到了95%，甚至97%，但是一旦有噪音，准确率迅速下降。当噪音还只是汽车的引擎噪音、风的噪音时，我们把噪音当成原始数据进入监督学习系统里去，把这种噪音变成机器见过的问题之一。但是事实上我们见到更多的情况，如果同时两个人说话会怎样？在今天的学术界依然无解。
    那么人和机器在语音识别上的区别，究竟怎么破解？我们用机器的时候，采用立体声的方式做定向的识别，也就是说我们做一个麦克风矩阵，通过立体的方式知道其中一个人在说话，把另外一个人说话去掉，但人本身是这样干的吗？如果把一只耳朵堵上，我是否没办法分离出谁在说话？或者把两个说话的声音录在一个单声道里面，人可以识别吗？人当然是可以的，所以人的方法和机器不一样。人怎么识别？因为人的音色不一样，还是因为两个人的一个声音大一个声音小，还是因为他们不同的语音，博士说但凡同时两个人说话的时候，只要能够找到差别，人就能够把其中的一个声音识别出来，所以人在和机器处理过程当中有巨大的不同。语音识别最成熟的领域其实还是和人有很大的区别。
    另外一件事情是语义靠谱吗？对语言的理解，谷歌在之前是用知识图谱的方法解决，现在遇到了瓶颈，谷歌实验室最先进的人机对话系统，这个系统可以帮助用户订餐订酒店，对话过程当中机器的表现非常惊艳，我们上去试，有一个环节，机器问你：“你是需要停车位还是不要停车位？”这个时候我们回答要或者不要都没问题，如果回答“我没车”，大家知道机器会怎么样吗？他们完全不理解我没车代表着我不需要停车位，因为今天的机器，在自然语言概念的理解方面，还是远远不够的。所以自然语言处理是可以做的，但是语义理解到现在还是一个不靠谱的阶段。谷歌也在今年发布了一套对于自然语言能够做句子分析的引擎，把主语、谓语、宾语提出来，但是准确度只有90%，提不上去了，因为这个时候光靠统计靠语法已经不能支撑，往下是需要对句子当中的具体概念有理解才能消除歧义。我们知道不能把马路放在冰箱上面，这对于人来讲非常好理解，但是对计算机的挑战非常大，这是深度学习人工智能还不够的地方。
    很敏感的问题，无人驾驶靠谱吗？今天百度在大会上也提出了发布无人驾驶汽车，但是从我的了解，如果以今天人类的技术，我们确实再见过的场景和封闭场景中都可以使用。但是对于真正开放的环境，不只跑在高速上的汽车，以现在人类的技术是不安全的，因为这个场景只要没见过，可能会犯严重的错误，就像AlphaGo下棋一样会突然发疯，所以作为辅助驾驶是可以的，无人驾驶在真正的技术突破以前还做不到。今天的深度学习缺乏推理，缺乏对符号的理解，如果没有符号，对自然语言的理解就会成为瓶颈。
    即便是这样，我们也提到了（人工智能）能够取代一些行业，比如说棋手、医生、司机，机器在里面都可以做很好的辅助，但是对于大家没见过的创造性的事情，比如规划、科研，其实对于机器来说还很难，今天在媒体上机器自动写文章、自动画图，在科研层面展示出了一些魔力，但是还没有到可以取代人的阶段，所以在这里面我先把大家对人工智能预期降低下来。
    目前有很多人比较关心，人工智能是否会出现第三次退潮，前两次我们都认为人工智能到来了，但是这次可能会比之前好，这次是人工智能第一次真正进入到了使用，切实在语言处理、声音处理、图象处理，和在一些高维数据空间上能够比人做的更好。所以这次的区别就是大量资金、资本投入到了人工智能。也有大量的研究人员在毕业以后从事人工智能工作，这是和之前不一样的。所以一方面我们开始使用这项技术，另外一方面我们开始期待不断产生新的突破。
    目前很多公司都在做人工智能，苹果、微软、亚马逊、谷歌。这里面起步最早做对话系统的是苹果的 Siri。但是这个系统并不成功，在中国用的人很少。为什么？因为现在技术没有到来，对于自然语言的处理能力、自然语言的理解能力非常有限。那么为什么苹果这样一个追求极致的公司，会把这个系统发布出来呢？一种可能性是苹果对技术了解不够；另一种可能性是我认为这是乔布斯的一个遗愿。我们知道发布iPhone手机的时候，乔布斯病重，只能躺在病床上看发布会，发布会完成之后，他很快就离开人世了，所以Siri就像一个早产的婴儿，在iPhone4s里面发布出来，所以我认为这样的系统代表着人类终极人机交互的畅想。
    事实上在大量的文学作品、科幻电影里面，都会提到问答机器人，不管是《星球大战》、《超能陆战队》，还是《星际穿越》都提到了。阿西莫夫的短篇小说《最后的问题》，描绘就是人类造了一个机器，把所有的资源都用了上去。这个机器可以回答其他任何问题，却有一个问题回答不了，就是“宇宙是怎么诞生的”，这是文学作品对问答机器的思考。
    在我们讨论问答技术和讨论人机对话的时候，输入法也许是最好的一个切入场景。输入法作为一个人的分身，更容易帮助你建立思考。输入法也会从一个拼音工具走向一个对话和问答系统。
    搜狗有两个核心产品，一个是输入法一个是搜索，一个是搜索信息一个是表达信息。随着AI技术的发展，我们能更好地解放人的思考。我们有一个理念，包括两件事情：一个是做自然的交互，不只是语音，还包括语言；另外就是做知识的计算，能让机器开始逐步建立推理的能力。搜狗输入法在中国拥有最大的语言数据处理积累，我们有机会在这个领域取得突破。
    期待人工智能能够真正取得技术上的突破，给未来世界带来便利。

热点新闻

教育书籍

热点新闻

招生就业

假期旅行