商汤科技杨帆:AI基础设施为其发展提供规模化、高效率、低成本的基础支撑
搜狐科技讯
5月17日,全新升级的“2022搜狐科技峰会”盛大开幕,嘉宾规格创历届之最,活动内容的广度和深度实现重大突破。
商汤科技联合创始人、副总裁杨帆作为嘉宾,带来题为《人工智能基础设施助推创新新范式》的演讲。
杨帆表示,在人类历史上,创新是有不同范式的,一种是经验归纳,一种是推理演绎。后来的机器时代、智能时代出现了第三、四范式,被称作仿真模拟。仿真模拟是通过机器替代人去做推理演绎,把更多的数据给到它,把更多的初始条件给到它,它去推公式的效率和能力可能远远超过自然人。
今天应用深度学习,可能人们并不太清楚这个数据为什么就能归纳出这样的结论,但是机器能够辨别得准。杨帆表示,在所谓的一、二、三、四范式之外,真正驱动我们大量创新的,很多时候往往是超脱出归纳、超脱出推理的,我们叫作“天才的脑洞”。
有人说,爱因斯坦广义相对论是超越了时代的智慧,换一个说法就是完全没有基础的,没有前有体系支撑下的偶发性或必然。类似于天才的脑洞,这种突变性的思考和创新,机器或许能够做类似的事情的,也就是“机器会猜想”。特别是在最近的两年,我们也看到了人工智能应用对一些跨领域的学科和学术领域的前沿创新产生了很大的影响。
人工智能具备明确的杠杆效应,能为它所服务和支持的行业带来巨大价值。杨帆表示,人工智能产业发展需要一个更好的、更具备支撑能力的基础设施。人工智能基础设施为AI所需要的算力、算法、数据核心三要素提供更加规模化、更加高效率、更加低成本的基础支撑能力,服务各行各业人工智能应用快速的发展和落实。
商汤从2019年开始做自己的人工智能基础设施,叫SenseCore商汤人工智能大装置。在上海临港建设的人工智能基础设施实体商汤智算中心(AIDC)2022年1月已经正式启动运行,峰值算力高达3740P,是迄今为止国内最大的人工智能通用的基础设施。
以下为演讲全文:
商汤科技联合创始人、副总裁杨帆:尊敬的张朝阳主席,尊敬的各位嘉宾,大家上午好!非常荣幸搜狐邀请我代表商汤来跟大家汇报一下我们最近几年做的新的相关的工作。
今天是科技峰会,大家其实也可以看到,科技在我们当今时代貌似跟大多数人有一定的距离,但实际上跟每个人都息息相关,是很重要的一个问题。
我们去看整个人类发展的历史。人类作为一个整体,生活水平、物质水平得到大幅度的提高,人类几千年、上万年的历史,我们整体的物质水平,整个人类基本可以在温饱以上,享受到充裕的物资生活是从什么时候开始?就是从蒸汽机、从工业革命开始。
科技的进步、科技的突变带来了我们生产力巨大的提升,生产力的巨大提升带来了我们今天异常充沛的物质生活和精神生活。包括蒸汽革命之后,我们也都知道电气革命、信息时代。这些年,有人讲第四次工业革命,信息化进一步的发展,我们去看最近的40年,整个人类基础科学的演进的速度是相对变慢的。
我记得我上大学的时候,刚开始接触核物理,觉得特别厉害、特别牛。那会儿讲可控核聚变还有多少年?还有50年。今天我们说可控核聚变还有多少年?还是有50年。一些基础科学的创新似乎在我们这个年代受到了一些阻碍,这在某种层面上其实也反映到了我们今天的经济环境。
过去10年整个世界经济保持正增长,保持规模以上正增长的大经济体量的国家可能就中国和美国两个,绝大多数国家陷入停滞,甚至很多国家出现了发展的倒退。很多人讲背后关键性的原因就是我们需要新的规模化的更大体量的科学技术的突破,来去带领生产力的进一步提升,生产关系进一步的优化,从而去引领整个人类社会更好地发展。
我们可以看一看人类到底怎么去创新?在人类历史上,创新是有不同范式的。虽然范式说起来很高大上,但也很简单,相信大家在小学、中学都大量接触过。一种是经验归纳,我看了很多物理现象,我从中间去提炼、去总结,做出一个个假设,基于假设去验证,去做一些实证性的系统。这是传统的第一范式,我们叫经验的归纳。
第二个范式也很有名,推理和演绎,也就是推公式。基于一个理论的演算和推导,得出一些新的结论性的结果。这是过去,是在我们有计算机、有信息化、有电子之前。后来的机器时代、智能时代出现了什么新的范式,我们叫第三范式、第四范式,仿真模拟。仿真模拟无非是机器替代人去做推理演绎,我们把更多的数据给到它,把更多的初始条件给到它,它去推公式的效率和能力可能远远超过自然人。
这两年,有一个更新的概念:大数据,也有人讲人工智能某种意义上就是大数据的升级和演化。大数据是什么?大数据在我理解无非是经验归纳的升级和通过机器去做经验性的归纳。我们通过机器替代人,从更多的数据、从更多的现象中去寻找,并且挖掘规律。
今天我们用深度学习做,可能人并不太清楚这个数据为什么就能归纳出这样的结论,机器去做自动驾驶、做物理识别,为什么它就能辨别得准。我们今天可能并不能百分之百给住答案,但是没关系,这并不影响使用。人类自己在做经验归纳的时候,自己也是不知道为什么的。我们今天对于自己大脑运行的原理,对于日常生活中大量习以为常的技术和现象,其实也没有百分之百的解答。
打个比方,骑自行车,大家每天见到非常多的自行车,但是至今人骑在自行车上为什么不会倒,为什么能够保持平衡。今天去看物理学界,大家对于这个问题是有很多种不同解释的,至少到今天并没有得到绝大多数人认同的主流解释,说它是通过怎么样的计算,使得自行车不会倒。包括像飞机,飞机也是在今天工业实践生产中大规模应用的,飞机的上升推力,为什么这样一个推力就能够支撑飞机去快速地飞起来,空气动力学在今天其实也有大量的问题,我们并没有完全地能够去解释。
在所谓的一二三四范式之外,我们去看到真正驱动我们大量创新的,包括驱动今天人类社会先进的技术成果的,很多时候往往是超脱出归纳、超脱出推理的,我们起个名叫天才的脑洞。很多人讲爱因斯坦广义相对论是超越了时代的智慧。什么叫超越了时代的智慧,换一个说法就是完全没有基础的,没有前有体系支撑下的偶发性的也罢,或者你把它认定为一种必然也罢,但是它是天才的超越了当时时代的一些猜想或者假设。在这个基础上,就会产生一个疑问,我们看到不管是归纳还是推理,在今天天的智能时代我们都可以让机器去类比,去替代人原来做的一些事情,引发出一些新的创新范式。
对于天才的脑洞,对于突变性的思考和创新,机器是不是能够做类似的事情,简单说机器会猜想。实际上今天在某种层面上,特别是最近的两年,我们会看到当我们把人工智能应用在一些跨领域的学科和学术领域的时候,其实在这中间已经出现了一些端倪。
去年AlphaFlod,测出30多万种蛋白质的结构,解决了50多年生物学界一直没能解决的蛋白质测序的问题。再比如DeepMind,我们用强化学习,首次在模拟的环境下实现了控制核聚变,虽然它离我们真正生产和生物意义上的距离还很遥远,但是可能把50年变成了49年。我们能够看到今天我们已经用人工智能在过去可能困扰整个人类几十年的学术问题上,逐步取得一些关键性的突破,我相信我们有理由畅想未来在更多的技术领域上,物理、化学、天文、材料、生物、医药等等方面,是不是人工智能能够帮助我们带来更大更多的惊喜。这其实也是今天学术界把人工智能这样一个新的体系和工具方法应用于本领域科研,也是最近两到三年整个学术界非常关注的一个方向。
为了做好这件事情,我们无疑需要一些基础支撑。大家都知道人工智能的三要素,算力、算法、数据。我们可以看,过去的10年,整个人工智能伴随着它的技术发展,伴随着大量生产和现实的产业实践,它对于算力的需求,对于数据的需求,对于模型参数量级的需求,都是呈指数型爆发式的增长趋势。
过去7-8年的时间,单一的人工智能模型参数,比如今天可能比起2014年大概要差三四十万倍,这就意味着每三个多月它就要翻一番,它的翻倍速度是远远超过摩尔定律的。AI软件类的技术创新,特别是人工智能跟海量数据消耗新的技术范式的创新和迭代,包括它的成长速度,对于基础环境是有一个极其高的规模化的要求的。
最近两年,很多行业巨头斥巨资建设自己的人工智能基础设施,Facebook做了自己的AI超级计算机,用它去推动他的元宇宙。超过16000块英伟达A100的PPU,超过5000Pflops的算力,单精度幅点数计算,1P是1000万亿次/秒,5000P大概就是500亿亿次/秒的计算量级。还有特斯拉,也是今天最火的新能源车企,他也在建专属于他自己的Dojo AI基础设施,去做下一代自动驾驶技术,包括去做它的技术研发和技术创新。一些行业的巨头公司其实都在去推动大量的AI基础设施创新。
这件事情能带来什么?中国过去7、8年的时间,人工智能对于产业其实产生了巨大的渗透和提升的作用。过去我们已经在超过30个行业,把AI的技术能够普惠地用到各个行业的应用和场景中。据统计,去年中国AI应用市场就超过2000亿。可能有些人觉得2000亿还不大,比起一些大的产业来说还有很大的规模差距。
数字时代更重要的是数字怎么样赋能到实体经济,数字怎么样支撑支持到线下真正的支柱产业工业的发展,人工智能有一个很明确的杠杆效应,人工智能这个产业它自身创造1块钱的经济价值,它就会对它所服务和支持的行业带来约10倍的经济杠杆。你可以理解成AI应用2000亿的市场,意味着它对整个全产业经济带来了2万亿的增长,而且它到今天仍然保持着非常高的增速。这是我们过去7、8年间,整个AI在产业中的快速发展。
当它再往下一步发展的时候,它需要什么?它就需要一个更好的更具备支撑能力的基础设施。打个比方,我们今天讲数字化的基础设施,跟过去我们讲基础设施建设,某种意义上是一样的。今天我们去讲新经济、新农村,农村里的一些好的经济型作物能够快速地通过电商平台销售到每个人手里,大家今天吃水果会更便宜,也更方便、更快捷,背后支撑它的除了电商平台之外,更重要的是中国在过去10年、20年,把高速公路、把基础的物流网络修到了几乎所有的村子里。这件事情为今天农村电商、消费下沉种种新经济提供了基础支撑。
我们讲AI的基础设施对于AI的应用,不管是产业的应用,还是科研的应用,我刚才提过了,我们在生物、医药、化学大量的领域都具备技术的研究和创新的潜质,以及围绕它所产生的一系列的产业生态,都能够带来巨大的加持作用。人工智能往下走,很重要的事情是人工智能的基础设施,我们把它叫做新基建,为AI所需要的算力、算法、数据核心三要素提供更加规模化、更加高效率、更加低成本的基础支撑能力,通过这样的支撑能力,服务各行各业人工智能应用快速的发展和落实。
我们可以把三个要素逐一打开来看,首先是算力。人工智能伴随着它的技术应用的发展,它对算力需求的增长是非常快的,同时它还具备大量自身的特性。今天AI所需要的从硬件到软件,整个体系和过去20年我们做信息化,我们讲云服务,完全是不一样的。云服务是以传统的CPU为主,提供计算,存储可能在中间占据了更大的比重。但是如果你去看人工智能,计算的占比和它对计算的需求是远远大于对于存储的需要的,而且它的计算是广泛地应用在各种不同异构的硬件结构之上。包括它中间所使用的软件,也是大量新的专用的软件。
我们今天用CPU去做一个AI技术的创新或创造,比起你用GPU做,它们之间的效率可能会差几千甚至上万倍。所以对于AI的算力,专用的硬件、专用的软件其实就会产生极其重要的依赖性。AI是重计算的,今天行业内都会把海量的数据聚集在一起,做一个超大规模的人工智能模型,用它去做新的领域的创新。它就会是一次性的极高峰值的计算,当然这种计算本身是有周期性的。
在这种情况下,我们如果不能提供通用的、开放的、共享的基础设施去达到巨大算力的共享,而是每一个人都搞人工智能,你先搭一套体系,你去建一套算力,你去收集大数据,这无疑是对当前社会资源极大的浪费。计算科学,今天海量的硬件,智能计算、数据中心本身是高耗能的,它对资源的开销和使用是极其巨大的。过程中,我们怎么样更好地去提升它的应用效率,降低使用成本,其实是非常有意义的一件事情。
刚才讲了算力,再来讲算法。最近三年,商汤从2014年、2015年开始做,到2019年,经过6、7年,我们有一个很强烈的感受,在早年,行业里基本找不到会用人工智能算法的科技人员,所以我们在去做一个产业应用落地的时候,会被迫把产业链所有的事情都做掉。比如做摄像头,我们甚至要去写一个说明书、写一个应用指南,一个智能化摄像头要怎么安装、调试,什么怎么修,甚至我们会派一个工程师帮助他们到现场去修。不是商汤自身的业务边界需要我们这么做,而是在那个年代,整个产业链上这样的人才是极度匮乏的,你根本找不到。但是从2019年、2020年开始,慢慢地发现伴随着产业的发展,人才越来越充裕,产业分工也开始自然地出现。我们今天发现有大量高价值的应用场景,但是我们用人工智能的方法去解决问题的成本太高,导致很多时候场景很难落地。
举一个例子,高铁每天要做沿线检测,因为整个高铁线路运行的稳定化对于它的安全是极其重要的,所以每天晚上会有一辆专门的车,在高铁不跑的时候,车会在线路上来回跑,把高铁沿线的设备用高清的相机都拍下来。当然这个技术本身也是进步的,最开始是人沿着沿线走,走一遍要走几个月的时间,现在有一辆车,每天晚上可以自动沿着高铁沿线,用高清摄像机把所有相关的线路、设备都拍下来。拍下来之后,一条沿线跑下来大概是几千万张的照片,需要在照片中检查线圈、线路、绝缘电子是不是有老化,是不是出现了裂纹,是不是需要更换。
大家知道,高铁很多设备预期寿命是10-15年左右,很多设备逐步进入老化期之后,这样的工作的重要性就会越来越强。过去可能是通过30人左右的专家组看照片,把所有照片看完一遍大概需要20多天,而且中间对于问题的检出率大概在百分之六七十左右。我们今天用机器做识别和检测,可以在几个小时之内把所有照片都看完,而且它的检出准确率可以达到95%以上。这看起来是一个很好的应用,但是我们为了做这个应用,可能我投入了比如说10个人工智能的科学家,他们收集大量数据,加上数据的标注,再加上算法的研究,做这样一个应用本身需要付出极大的人力和资源的成本,这就会导致应用本身,当它在使用的时候会出现巨大的商业上的不匹配,投入产出比不划算。
走到今天,阻碍人工智能技术在各个产业、各个行业中的各项场景进一步地去发挥价值、进一步地去产生应用,最大的阻碍是今天人工智能创新的成本越来越高。最开始做一个单点创新就有极大的应用,大部分都被做掉了,未来是大部分散碎的“长尾场景”的成本。我们做智慧城市,有地方治理部门说这块有一个河道,万一有人掉进河里,我需要能够紧急报警去救助。
掉进河里的事件是极其小的概率,他不可能花更多的钱去买单,这种情况下就要求我们去做一个算法,进行技术创新的成本要足够低。今天整个行业演进的方向是把更多的数据汇集起来,用一个更大的模型去支撑我在每一个小的场景应用上的快速迭代和创新,你会发现做单一技术成本的创新被极大的摊薄了。当然这件事情的前提是我们在技术上、在数据上都要具备大规模开放共享的能力。
另外一个就是数据。在智能科技时代,我们都讲数据是新时代的生产资料,数据是推动整个人工智能领域技术创新最核心的燃料,但我们今天仍然面临大量的问题需要去解决,数据的孤岛问题在很多行业中依然是广泛存在的。
数据很有意思,它具备非线性的效应,你把10倍的数据放在一起,它所能够创造出来的技术各方面的能力是远远超过单一份数据的10倍的,它可能是100倍,甚至更大。过程中,怎么把更大的数据量汇聚在一起,汇聚在一起是有成本的,怎么让汇聚在一起的更大量的数据能够被更多人更加广泛地去使用,同样反过来需要我们提供人工智能的基础设施,在这些基础设施上完成更大规模的数据的汇聚,当然中间还涉及到数据的安全、数据隐私保护等等的问题。通过这样的基础设施去提供更好的支撑。
讲人工智能基础设施,从技术层面分很多层,包括基础的物理环境,包括芯片的适配,包括一整套软硬件的配套,过程中我们有相当的优势。商汤从2019年开始去做自己的人工智能基础设施,我们给它起了个名字,叫SenseCore商汤人工智能大装置。为什么叫大装置?因为国家在推很多科学的大装置。也就是通过更大规模能够把关键要素完成汇聚的基础设施,去推动某一个领域重大的基础性的科研创新和科研突破。
在AI领域,AI的基础设施就是具备这样能力的一种通用的技术。通过它对于算力、数据、算法大量的汇聚,以及对于过程中软硬件问题的一体化解决,形成一个更加好的支撑,支撑整个应用体系更加开放的应用。我们2019年开始在上海临港建设人工智能基础设施实体商汤智算中心AIDC,2022年1月份已经在上海正式启动运行,峰值算力高达3740P,应该是迄今为止国内最大的人工智能通用的基础设施。我们现在利用它跟整个上海,包括长三角区域大量头部的行业领域,包括一些科研单位和企业,提供刚才我讲到的从算力到数据到算法全领域的核心能力服务,支撑人工智能在更大产业领域的应用。
具体看一看应用,我们用它去做科学创新,去做蛋白质的预测,包括生物医药领域基础科研的创新。包括我们用它去做智能交通,我们现在做车路协同,它需要海量数据,从模拟到规划和预测的一体化。包括我们用它去支撑做虚拟世界、虚拟的物理引擎、虚拟的智能化引擎大量的技术创新。这样的基础设施商汤在做,行业里也有其他的厂商,大家一起做这件事情。相信通过核心基础设施的汇聚,能够实现从算力到数据到算法更大规模高效率低成本的提供,以及在这个上面去支撑更好的开放。通过开放,先把路修好,把人工智能创新所需要的路修好。在其上,未来人工智能作为极其通用的行业的技术领域,它能够对于今天千行百业所面临的各种各样的应用方案就能够进行大量的创新,能够快速地驱动各个产业的发展和进步。
站在全球巨变的十字路口,人类对未来的探索从未停止。
在“十四五”规划的指导下,数字经济与实体经济的虚实融合发展成为业界共识,加快建设信息网络基础设施、增强网络安全防护能力成为重要目标。科技发展日新月异,人工智能、5G技术由“虚”向“实”,元宇宙、智能汽车等新商业生态随之孕育,万物互联的智慧社会初具雏形。
聚焦新技术、新商业下的新趋势,搜狐科技广邀学术泰斗、行业大咖与头部企业,为观众呈现十余场精彩纷呈的主题演讲和高端对话。除本篇外,搜狐科技还会通过多种方式全方位呈现此次峰会与会嘉宾关于产业新变局的思考,为广大读者带来技术演进与行业热点的详情报道。
了解更多“2022搜狐科技峰会”信息,请关注大会专题:WAP专题链接、PC专题链接。
文章来源:环球网
文章链接:http://biz.huanqiu.com/article/482r0HW3hTT
七龙珠剧场版布罗利篇在线,召唤的拼音,che, http://www.xinzhiliao.com/zx/jinji/42179.html- 标签:中国最大的岛屿是什么,全本小说txt下载,吴洪刚,
- 编辑:杨保录
- 相关文章
-
商汤科技杨帆:AI基础设施为其发展提供规模化、高效率、低成本的基础支撑
搜狐科技讯 5月17日,全新升级的“2022搜狐科技峰会”盛大开幕,嘉宾规格创历届之最,活动…
-
快手杜铮:互联网广告更多在“割草”,而非“种草”
5月17日,全新升级的“2022搜狐科技峰会”盛大开幕,嘉宾规格创历届之最,活动内容的广度和…
- 百度魏东:未来20年,我们将见证汽车机器人替代人类驾驶员
- 中国工程院院士沈昌祥:以可信计算3.0为核心技术,构建网络安全保障体系
- 国科嘉和王戈:技术资本正在走向舞台中央,助力技术企业越过“死亡之谷”
- 幸福消费金融去年利润1.35亿 客户投诉数量同比增长238%
- 两只基金业绩齐垫底 富安达基金“老将”孙绍冰掉队