繁体中文 English
年度入围作品
年度获奖作品
获奖作品跟踪
成果转化
当前位置:返回首页 » 新闻中心

2019工业设计与品牌国际会议主题演讲 吴建福

2019工业设计与品牌国际会议主题演讲  吴建福

美国国家工程院院士,台湾中研院院士,美国乔治亚理工学院教授,中国科学院“质量与数据科学研究中心”学术委员会海外主任  吴建福)

    我第一次来成都是2004年,那时候我全家来玩,参加旅行团,主要是到九寨沟跟四川的西部,成都只来了两天,今天是我第二次来。今天是因为文杰邀请我来,那我要说汉语,但是我所有的这个幻灯片都是英文的,唯一跟你们比较接近一点的是我做过的研究叫参数设计。我今天主要有两个主题,一个叫参数设计,第二个叫做数据科学。

    我首先要讲的是参数设计的来源及应用,统计科学及数据科学,还有大家最想知道的是大数据,还有机器学习等等。

    因为时间的关系,我可能只是把主要意思讲出来。

    参数设计是日本一个很有创意的,叫田口玄一,他是工程师,这是由他提出来的,他这个Idea,我们可以看一下系统,这个系统可以是一个工业的产品,也可以是一个想法,也是一个制造业的过程,这个时候一般有两种,一类就是可控因子,另外一个就是扰动、不可控因子,我这里讲的是工业设计,不是工程设计。在工业和产品设计的时候,你是要找可控的因子,使得你整个系统,表现不受扰动因子的影响。我们用这个图来介绍,我们可以这么想,左边是不可控因子,Nolse,这边一个黑箱的系统,可以用数学和微分子来表达。中间是一个可控的,拿出来的结果,各位看这红色的它变化很大,这是不好的意思。但是一般的变化,那个扰动的因素降低的话,那么右边这个就降低下来了,但是这个做法从工程来讲是相当贵的,不是最好的办法。那么什么办法比较好呢?就是中间这个东西,就是你可控的因子,你把它改变,改成另外一个也可以让你的AOpo(音)变小,是可控跟不可控之间有个交互作用。我用最简单的方法讲这个概念,这是很深的概念。可以用另外一个角度来看,,可是它是中子变,中子改变是很容易改变的,从工程的设计来讲,结果是斜率变小,中间这个斜率比较低,它就不敏感。这有一个宝洁的例子,这个项目我们也参加了,就是它的包装,包装有很多的机器制程的部分,可是它的材料,宝洁里有很多洗衣剂、清洁剂,它的是个很大的,就是它一年可以快卖到100亿美元,所以这个时候它还是有材料的变化,怎么做一个更好的时间使材料变化,因为材料变化没办法继续改。第二个例子是刮胡刀,刮胡刀的不可控因子,每个人的胡子不一样,每个人的皮肤不一样,你怎么设计好的刮胡刀,不会让它刮破脸,不会流血。第三个例子是试射飞弹,就是环境的变化,比如说风速等等是否会有影响。这里有一个奈米的例子,合作的对象是中科院的外籍院士,是乔治亚理工学院的教授,这个奈米发电机是他发明的,我们用一个比较有意思的例子来讲,他把他形容成一个科学的幻想。比如说我们在军队,打仗,你穿的军鞋,军鞋下面放入奈米线,走路的时候就会有基线,基线可以变成电脑。那么这里有个问题也是参数设计的问题,为什么呢?这个技术性就不细讲,我一直走的话,是不是发电量就降低了,那就不好。所以做实验的时候,我们在实验中就把奈米线扫描。长话短说,我们最后做出来的结果是上面红色的,这个发电量是稳定的,这个发电量是不稳定的,这个就是参数找得好。

    我现在讲另外一个例子是操作窗,这个我可能没有时间讲。所谓的操作窗可以想成,这是美国的一个公司,他的想法就是说有的产品有一个设计的参数,这个设计参数太低会失效,可是太高有另外的失效,中间就有个操作窗,操作窗里边的产品不失效,就表现好,这个叫操作窗。也就是说你做一个设计的时候,你要考虑怎么样找出一个好的做法可以当做操作窗,但操作窗越快越好,理由是这样的。可能你们做工业设计跟我的工程设计不一样,工程设计的话,你是一步一步的,所以你开的操作窗越大,设计越来越小,因为有各种不同的要求,是很多层的。所以你要开越大的操作窗,你往下才能设计下去。

    我用这个例子,这个例子是复印机,这个是一些纸,然后这有个弹簧,那么复印机最常发现两个失效,一个是你要按了,复印纸没送出来,复印机两张进去夹住了。这个时候这个东西它是有一个叫做,那么一般的做法,一般在操作还没发生以前就一个一个实验的做,这样可以找到它的方法,但是这个要花很多时间,从实验设计角度来讲是相当浪费时间的,问题就是这样做很多的实验。而且还有一个问题是你没法分辨哪一个设计比较好。而且有一个问题,这两个都是有冲突的,那怎么办呢?我们用操作窗,操作窗这个就是stack force,就是有多少的力量就把它推出来。stack force太大纸没送进去,还有其他的就没法做。

    这个用的是日本富士全录,原来做的是旧的操作窗,然后经过我们做了实验,用实验设计方法,操作窗变得很大,所以这个是相当有意思的例子,唯一可能跟你们比较接近的例子。

    我讲的所有的参数设计都叫Offine,就是说不只在生产线或操作线上用Offine来做,很多工程有线上控制,Offine有两类,现在把回馈控制的概念跟参数设计合在一起的话,那么就得到很好的效果。有个例子,故意弄个印度的图片,他是印度学生,后来到哈佛大学教书,在哈佛做教授,我乔治亚的博士生。我们装创造的一袋化肥要50镑,你装出来的花费,一天可以包装2000袋,化肥太多或太少都不太好,前几包装太少了,他量出来了,经过一个办法去修正它。这是原来在印度做的结果,这个结果的变化很大,中间是50镑,它变化很大,当时他就用的参数设计,但是没有回馈控制,这是在印度做的。这个是跟我合作的,是他博士论文的一部分,后来去哈佛教书,所以这是另外一个例子。

    我现在讲数据科学,数据科学这个名词跟我有点关系。我在1998年密歇根大学演讲的时候,我主要的研究是做统计的工作,但是很多年来,我就觉得统计这名字不好,应该叫数据科学,我的解释就是,统计是一种三部曲,所以我当时做一个很大胆的建议,现在不大胆了,现在都用数据科学。

    第一个,我说统计要改成数据科学,统计学家要改成Data Science,他的头衔都是数据科学家,不论他在什么公司都叫数据科学家。为什么这么说呢?比如说我到飞机场等飞机,有时候误点了在等飞机,就有人问我你做什么,我说我做统计,他说你做会计,在中国大陆和台湾早期都很像,早期统计会计是同一类,所谓的??,快跟统在一起,这其实不科学。为什么呢?因为统计这名词所代表的意思是描述统计。比如说你爱打球的,很多球类的统计,你爱做股票,有股票的统计。所以,这一类的统计其实是很简单的统计。还有一个东西很有意思,马克吐温是美国一个小说家,他说统计是混蛋的谎言,现在美国最会讲谎话的人是谁,我就讲了,也不告诉你。所以我觉得这个统计、会计很不好,所以事实上在日文、韩文,还有印度文,原来的都是一样的。希腊人听那个剧三个晚上看三部,三部曲。第一个是数据的搜集,第二个是数据的建模跟分析。第三是解决问题跟决策。2009年的《纽约时报》,这个人原来是加州大学的一个教授,后来到谷歌去了,他说未来的十年叫作统计,现在是工作最舒服,但也有最高的,排前十个,数据科学排的不是第一就是第二,因为早期统计不是这样。不过我太老了,如果年轻一点多好。

    现在更重要的是讲大数据,因为数据越来越多,但是我要强调是数据这么多,你必须要有能力去使用,去分析,这个分析很重要,你分析完要做决策,所以这个所谓的三部曲,到了大数据时代的三部曲,第一个是大量数据的采集,这是自动,自动采集,各位了解的是物联网,物联网以前就是这样,譬如说超级市场,美国像沃尔玛,它的收银机其实是自动采用数据,当时没有进行分析,后来因为整个物联网,最主要是这个。现在牵涉一个问题,这是研究的细节,我就不讲了。最主要是怎么样去概化,另外还要学习。数据这么多,要处理怎么把它变少,把精华拿出来,该怎么做。再来做决策。

    然后就看到这个工作机会越来越多,假如做一个统计学家或者所谓的数据科学家,它主要有三种知识,有计算的能力、统计的分析,还有你要应用的范围,譬如你不同的人用的数据是一样的还是不一样的,有各种领域都来做,有各种各样的人都来做数据。怎么样做数据科学,各位可以这么想,你收集数据,可是数据收集了要准备,准备的意思是数据这么大,你怎么样去准备它,准备到的阶段才能够有所谓的某个软件或统计方法能够去处理它。

    我现在要讲两个用大数据的例子,基本的方案都是这样的,你有各类的数据,可以有工程的数据,有思维的数据,比如说像互联网或制造业的数据,譬如说高铁的数据,数据有各类各样的。你要做很多数据科学的做法,但是你要解决问题,就是这个数据得到讯息,能够给你一个什么样的新的洞察与新的观点。我现在用一个可口可乐的例子,是可口可乐的某一部分,其实跟可口可乐的教授没有关系的,他是把钱交给乔治亚理工大学,这个项目因为可口可乐,有些很爱喝可乐的人参加一个协会,可以根据它的数据去分析出这些协会的成员是什么样的年纪、性别,哪个地区,社会的背景和经济收入等等,不止这些,还有很多可以分析,当时有2500万个这样的,我是没参加,可乐这个东西不是很好的东西,不健康,偶尔喝一下可以。所以它主要就是利用这么多数据进行分析,可以了解这些消费者对可口可乐品牌的各种印象跟感觉,怎么样能够让他们对这个品牌效忠。简单讲就是它经过大数据解析的做法,它这个协会的成员从2500万增加到5000万,你可以了解它互相怎么互动,他们对可口可乐这个品牌有什么样的感觉,他们应该用什么样的策略增加他们对品牌的忠实度。

    另外是一个Coupons,这个是厂商要卖的,还有消费者,比如说行销的公司,销售的管道等等,其实是非常复杂的东西。所以它可以得到各种数据,因为经过互联网,什么数据都有。所以它可以经过各种数据,各种的消费,比如我给你的Coupons,你去买了没有,买了多少。简单讲,把这样的数据由系统整合起来,它有各种的来源,是非常复杂的统计分析。经过这分析以后可以了解尤其对于这些公司或卖产品的,或是管这产品行销的公司,他们可以经过这个分析了解市场跟客户怎么想,他们的消费行为。这个东西要做得很快,为什么Coupons每年变很快,它可以掌握这个速度快到95%,也就是说它可以几分钟内就掌握,而不需要好久。这个就跟火箭不一样,这个不是高科技的东西,互联网是很好赚钱,但是并不是最难的科技,不像半导体。

    我要讲一个有意思的,就是机器学习,大家可能记得阿尔法狗,是谷歌把伦敦的一家公司给买下来,这家公司就做一个东西,它就想经过人工智能把围棋打败,西洋棋很容易打败,围棋很复杂。所以它的对手第一个叫李世石,为什么找李世石呢?李世石那一年不是世界第一,第一是柯洁。当时简单讲就是5:1,李世石被打败,唯一的一场打败是第四场,这一场阿尔法狗败掉了,简单讲李世石前三场都败掉了,他到韩国棋院,大家觉得说要出一个怪招,让机器学习不了,就是布一个点,是围棋史上没有做过的那一招,是白的第78号,他用了一个招,是日本的阿马棋。阿尔法狗的办法有非常好的计算,它用的方法是把几乎所有的计算全都计算好了,坦白讲这不公平的,早期它是先学你的棋谱,后来自己互相练,这个太技术性,我就不讲了,但是第78招,后来大家把这个招叫tesuji,我把它叫妙招,因为白的第78手是在围棋史上没被下过的。所以当时在训练中间没有这个东西,也就是说对机器的学习来讲是空洞的,它做计算是往前算,往前算的时候,等于计算的时候很多的路线,这个路线和方向根本没算进去,没想到。我当时对这个很有兴趣,是因为我从学者的角度。我先看《纽约时报》,我们是科学家,我的兴趣不是一个新闻,是新闻背后的一个原因,我就发现新闻走了一个新招,没办法看到。所以,也就是说你在机器学习没有这知识,后来,中国鼓励这是神之一手,中间红色78,李世石下白,阿尔法狗是黑棋,你现在看它79,你要把它拿掉。我当然没办法找到,把它清除掉,最好是我给你棋盘,第一手是78手,你可以看出来很奇怪。

    我们来看另外一个例子,是无人车,也是用机器学习,而且做大量的计算,你想我测试有各种的感应器,它做了很多,但有一个问题是很危险的,为什么?所以这就是我们做测试有感应器,有好多大数据,它可以做工程跟计算机及图具的模型,那你说这出去可以开车了,但是这有问题,很危险的。为什么?因为各位已经看到很多无人车出事就是意外状况,意外状况跟刚才的白78手有点像,意外状况是没有的。所以我总结一下,我们讲意外状况,意外状况怎么加入机器学习呢?你要先把可能的意外状况全部考虑进去,是做测试中没有的,你要故意制造意外状况,像统计的实验设计,制造意外状况,然后加入机器学习,把意外状况知道,假如它没有的话是没法预测的,它一样会出事实

    也就是说这个深度学习是不得了,做得非常好。因为它可以在下一手之前,把超大量的可能性都算了,它有非常复杂的算法,整个公司就做这件事情,谷歌买这个公司没有损失的,为什么?品牌,而且很多新的技术,你能围棋打败,你中间的算法就是最好的高科技,因为谷歌的估值大概是8000亿美元。我要讲后来柯洁跟它打完,结果柯洁四场全败,因为它的核心锻炼了把弱点补掉,利用一个机器学每天练兵,可是很不公平,人下围棋要下二十万场、三十万场,你再好的能下多少场,所以不公平,柯洁还是输掉了。假如它训练的数据没有考虑到没有想到的情况。同样的,无人驾驶出了意外情况也不是深度学习导致的。

    物理现象很多是微分方程,微分方程也不是深度学习能够掌控的,所以深度学习也不是什么东西都能掌控的,台湾的科技部把好多经费都投入到人工智能,这是错误的。因为很多东西不是深度学习可以学来的,微分方程就学不来。好,我们今天就讲到这为止。

 

媒体链接:
海内外机构及媒体:

四川工业经济联合会 © 版权所有 ICP备案号:蜀ICP备0901834号
地址:成都市鼓楼北三街82号德盛大厦13楼 电话:028—86712003 传真:028-86712003
邮编:610017 E-mail:scsgjl@126.com 技术支持:四川经济网
您是第 位访客