雷锋网 - Percy Liang:机器学习的可解释性如此重要,我在努力,我们都需要努力

上一篇(左方向键) 下一篇(右方向键) 回目录(回车键) 粗体(B键)  正常(N键) 随机浏览(S键)   浏览次数:43    发布时间:2018/2/15 19:18:41   出处:雷锋网   

  雷锋网 AI 科技评论按:近日,外媒 Future of Life 对人工智能界知名研究者 Percy Liang 进行了采访,介绍了他对机器学习的一些看法以及研究目标。雷锋网 AI 科技评论全文翻译如下。

Percy Liang:机器学习的可解释性如此重要,我在努力,我们都需要努力 - 后花园网文 - 科技新闻

  2017 年底,美国众议院通过了《自动驾驶》法案,为自动驾驶汽车的监管建起了初步框架。实际上,在过去的 20 年间,自动驾驶汽车就已经在公共道路上进行着各种测试,而随着这项法案的通过,以及自动驾驶技术安全性的持续提高,自动驾驶汽车未来也将在我们的日常生活中占据更多的地位。其他医疗、法律、安全保护等领域的各种各样的无人化技术也会慢慢普及开来。

  为了人类未来可以和自动化的机器们和谐共处,学术研究者、企业开发者以及用户都需要对这些依赖人工智能的技术有足够的信心。不只是自动驾驶汽车这样明显的案例需要人们的信心,安全保护设施以及手机里的虚拟个人助理,都使用了人工智能,都需要人们的信心。

  机器学习的可预测性

  Percy Liang 是斯坦福大学计算机科学系的一名助理教授,他介绍道,人类的日常互动总需要一些可预测性,不管是对于其他的人类,还是对于汽车之类的自动化系统。创造这种可预测性的方法之一就是通过机器学习。

  机器学习领域中,人们基于以往收集的数据创建人工智能算法。开发者并不需要为 AI 明确地编写代码告诉它应该怎么做、应该如何思考,而是由系统自己从数据中观察、学习数据模式,然后根据数据做出符合数据模式的行动。整个过程和「试错学习」有点像。

  对于机器学习系统来说,人们在研究和开发测试中经常考虑的一个关键问题是,「为什么系统做出了这个预测?」对研究和开发人员们来说,这被称为「机器学习的可解释性」。对于这为什么是个重要的研究课题,Percy Liang 举了个例子说明:「假设你正在过马路,一辆车向着你开着过来。对于一般的人类司机,你心里大概能猜到他会怎么做。但是如果开这辆车的是 AI,人类要如何知道它会怎么做呢?」

  系统执行任务得到了好的结果固然重要,但是也许更重要的是能够用简单、好理解的话语解释清楚它为什么那样做了。即便系统并不是很准确,它也需要能够被解释、被预测。为了能够安全地大规模部署 AI,这些自动化系统必须是基于广为理解的、实际的、经得起测试的基本假设和原理才行。

  目前开发 AI 的理论指导都是让 AI 能够符合训练数据中可观测的输出。然而在 Percy Liang 看来,这可能会导致「自动驾驶系统能在验证测试中发挥出良好表现,但是并不理解在人类想要的输出背后的人类价值判断。」

  进行许多的测试当然很重要。根据 Percy Liang 介绍,这种种模拟测试方法「都是很好的 debug 技巧,我们可以借助它们更轻松地进行控制变量测试,而且也可以帮助我们更快地迭代系统。」

  不过,要真正地知道某种技术是否有效,「必须在真实环境中测试,没有什么讨巧的方法,」Percy Liang 说,「对语言、视觉、机器人技术来说都是这样」。一辆自动驾驶汽车很有可能可以在所有测试环境中都表现良好,但是我们没有什么办法可以准确预测它在无法预知的自然灾害面前会做出什么。

  可解释的机器学习系统

  许多领域中,能取得最好表现的系统都是基于深度神经网络的,比如识别图像和生成语音中深度神经网络都已经称为了默认的方法,而这些方法当然也都是很复杂的。同时它们也被称为「黑盒系统」,因为就算解释系统的行为有那么一些可性能,实际解释起来也非常难。

  Percy Liang 和他的团队也在研究如何解释这些模型,他们在尝试研究某个具体的训练场景是如何对模型的预测产生影响的。

  从这个视角观察模型已经变得越来越重要,因为 AI 在做的任务也越来越复杂,比如对于 AI 医疗给出的诊断结果,如何理解、如何解释是真的「生死攸关」。「如果训练数据中有不符合的,或者对抗性生成的数据,这就会影响到模型(损害模型),后果就是接下来针对新的输入做出的预测可能是错误的。我们正在研究的影响函数(influence functions)可以让我们准确地追踪训练数据中的单个点是如何对某个给定的新输入的预测产生影响的。」Percy Liang 说。

  简单来说,通过理解一个模型是如何做出它自己的那些决定的,Percy Liang 和他的团队希望可以改进模型运作的方式、找到新的科学技术,并且给最终用户提供一些解释,让他们明白会对他们造成影响的行为是如何做出的。

  Percy Liang 的研究的另一个目的是确保 AI 能够理解自己的限制,而且能够和人类沟通自己的限制。传统上,测试 AI 系统的重要指标之一是平均准确率,但 Percy Liang 认为「对于 AI 的安全问题来说,这并不是一个多么好的讨论方式。毕竟,对于一个可靠性是 80% 的系统,人类到底应该怎么做呢?」

  Percy Liang 其实也没打算追寻一个任何时候都能给出 100% 正确率的答案的系统。相比之下,他更希望的是,当系统对自己的答案不确定的时候,它能够明确表示出来。如果用户问系统:「我需要吃多少止疼药?」相比给出一个可能造成危险的不准确的预测,系统直接回答「我不知道」可能会更好一点。

  Percy Liang 和团队针对这个问题提出的方法是尝试沿着模型的学习算法追踪模型的预测,一直反向追踪到模型参数产生的源头。他们希望这种方法——从训练数据的视角审视模型——可以成为开发、理解、诊断机器学习的标准方法的一部分。他解释道,这种方法可以联系到许多种不同的应用中,医学、计算机科学、自然语言理解系统,以及各种各样的商业数据分析应用。

  「我觉得」,Percy Liang 总结说,「大家对于模拟测试起到的作用有一些混淆,有的人会完全回避模拟测试,而有的人却很喜欢在模拟测试中做完一切。也许我们需要改变整个研究文化,两种做法其实需要共存。」

  正如采访中透露出的,Percy Liang 和他的团队希望给新一代的机器学习算法设置一个新的框架,让它们可以更可靠、更优雅地运行,当然也要带来更少的风险。

  viafutureoflife.org,雷锋网 AI 科技评论编译

  

雷锋网』的更多其他内容(随机显示)

01、还在纠结 Python 的数据导入问题吗?有这张速查表就够啦

2018/2/15 19:18:40

02、主打业务安全的顶象技术,完成数亿元第二轮融资

2018/2/15 19:18:36

03、能用强化学习买卖比特币赚钱吗?能能能,当然能!

2018/2/15 17:16:33

04、听我介绍完区块链,婶婶露出迷之笑容 区块链迎春特辑

2018/2/15 0:30:49

05、豪客互联CEO孙良:HAWK重磅登录泰国,优质产品进军东南亚

2018/2/14 19:14:16

06、吓坏网友:波士顿动力机器人 SpotMini 给伙伴开门(附视频)

2018/2/14 8:46:27

07、新年来临之际,我们准备了一份 1196 页的大礼包 AI 科技评论 2017 年度特辑

2018/2/13 14:02:44

08、多伦多企业级数字化解决方案提供商Blanc Labs加入R3区块链联盟

2018/2/12 19:15:49

09、P图界的全能王!随机初始化CNN当仁不让

2018/2/12 15:09:49

10、Apple Watch 大爆发:上季度销量超越整个瑞士钟表业总和

2018/2/12 15:08:52

11、绿盟科技:沈继业将成第一大股东

2018/2/11 22:31:49

12、1 月份国内手机出货量下滑 16.6%,3G 手机几乎绝迹

2018/2/11 21:36:42

13、人脸识别有歧视?识别准确率黑人比白人差很多,厂商们这样回应

2018/2/11 21:36:42

14、技术详解DAG区块链项目SPECTRE:围绕一致性建设,投票机制甄别攻击杜绝交易冲突

2018/2/11 21:31:09

15、挖矿产业对英伟达贡献有多大?黄仁勋:现在还小 未来可期

2018/2/11 20:25:53

16、一文看懂富士康招股书:27万员工的巨无霸即将登陆中国股市

2018/2/11 17:28:24

17、iBoot源代码疑被实习生泄露,苹果:呵,不Care

2018/2/11 15:12:58

18、阿里新零售战线再升级,54亿元入股居然之家,进军家居零售

2018/2/11 15:12:58

19、战友变“仇敌”:亚马逊欲推出企业送货服务SWA,直怼UPS与联邦快递

2018/2/11 3:45:16

20、滴滴年会程维演讲:宣布滴滴成立战略事业部 升级智慧交通事业部

2018/2/10 21:37:01

21、比你年轻,还比你们会赚钱!TFBOYS粉丝玩起区块链追星

2018/2/10 16:27:52

22、GitHub泄露苹果iBoot源代码?苹果:全网删,谢谢

2018/2/10 1:46:22

23、2017年,人工智能圈迸发出哪些火花和观点? AI 科技评论 2017 年度特辑

2018/2/9 21:37:35

24、北京近30家医院安装人脸识别系统,打击“号贩子”;腾讯联手深圳市第二人民医院共建医疗服务云平台 AI 掘金晚报

2018/2/9 19:37:11

25、中国国际贸易促进委员会:韩中合建虚拟货币交易所ZENIEX12日上线

2018/2/9 17:32:16

26、香港证监会向七家数字货币交易所和ICO组织发出警告信

2018/2/9 16:34:32

27、通过 Apple Watch 就能预测糖尿病?这家公司专门开发了一款 AI 应用

2018/2/9 14:20:32

28、一再延期!币安仍系统维护中,预计最快1-2小时修复

2018/2/9 14:20:29

29、欧洲证券和市场管理局:加密货币和区块链是2018年主要任务 首次纳入监管议程

2018/2/9 0:45:34

30、Google 硬件部门终于将 Nest 纳入麾下,但为什么这么晚?

2018/2/8 20:46:05

31、恒生电子发力联盟链 马云在区块链领域再下一城?

2018/2/8 19:46:35

32、瑞士区块链项目DFINITY获6100万美元新一轮融资,Andreessen Horowitz领投

2018/2/8 18:33:54

33、新加坡航空的区块链之旅:为空中飞人开发数字钱包

2018/2/8 18:33:54

34、维也纳能源集团正在测试一系列区块链使用案例

2018/2/8 15:32:49

35、SEC听证会之后,主流数字货币全线回暖

2018/2/8 15:21:26

36、AAAI 2018 经典论文获奖者演讲:本体论的昨天和今天

2018/2/8 13:16:14

37、原子多路径支付加强隐私性,比特币支付功能再优化

2018/2/8 13:14:40

38、福布斯发布首个数字货币领域富豪榜,瑞波创始人第一,以太坊创始人第二

2018/2/7 22:32:49

39、通联数据薛昆:算法改变世界,机器智能时代如何进行投资管理?

2018/2/7 20:29:02

40、阿里云将训练 ET 大脑,用于 AI 养猪;饿了么上线骑手人脸识别功能 AI 掘金晚报

2018/2/7 19:22:45

41、高盛发重磅警告:做好准备!多数加密货币价值恐归零

2018/2/7 18:23:28

42、Netgear 宣布剥离 Arlo 安防摄像头业务,计划独立 IPO

2018/2/7 18:22:47

43、以人工智能升级传统教育,乂学教育累计融资2.7亿,开店500余家

2018/2/7 17:22:28

44、负面!瑞波币被曝遗失32570个早期区块

2018/2/7 17:20:48

45、谷歌大脑提出TCN,能让机器人边看视频边模仿

2018/2/7 14:13:45

46、Coindesk:比特币当日跌落6000美元低点

2018/2/6 22:29:20

47、青莲云董方:以物联网安全为家,仗义行侠

2018/2/6 21:20:34

48、区块链界的“甲骨文”Bluzelle 上线币安交易

2018/2/6 21:15:59

49、中通联手百度 AI,推出快递行业人脸核身方案;7-11 正式进军无人便利店 AI 掘金晚报

2018/2/6 19:12:51

50、乱点网页上的 Flash Player 升级链接?小心变成黑客的免费挖矿机

2018/2/6 18:08:48