人是铁,饭是钢,无米不硬朗;
社会是车轮,石油是燃料,无油必抛锚。
石油的找寻,不能指望天降洪福,
而是有赖精“芯”探测。
谁更懂“芯”、谁更用“芯”,
——谁就会让历史的车轮跑得更快……
石油,已经成为牵动世界各国的神经,其“跌宕起伏”的市场行情背后,其实还有着许多不为人知的秘密。石油的勘探和开采,是一种技术活,其对计算资源的需求和苛刻技术的要求,已经上升到空前的高度。
如要为刚刚过去的6月份选出几条热点新闻,相信国内油价再次下调必能入围。事实上,随着经济持续高速发展以及中国全面进入汽车社会,燃油价格的波动已经成为普通大众、行业企业与政府部门共同且时刻关注的话题。
在此背景下,2012英特尔高性能计算研讨会(第六届)在六朝古都南京举行。自2007年至今,英特尔(中国)已经成功举办了五届英特尔高性能计算研讨。该研讨会不仅已经成为英特尔的一项传统会议,而且在中国能源领域成为高性能计算需求和发展的风向标,深受业界同仁的支持和推崇。
本届英特尔2012年高性能计算研讨会将秉承往届传统,就关于高性能计算的现状及未来发展方向作进一步深入探讨,英特尔的尖端技术与中国能源行业高性能计算需求会有更精彩的对接。
此次高性能计算研讨会,有几位重量级嘉宾也齐聚一堂,他们包括:中国石化石油物探技术研究院副院长兼总工程师赵改善、中国石油东方地球物理公司研究院处理中心总工程师赖能和、英特尔能源及高吞吐计算团队高级主管工程师菲利浦•蒂埃里(Philippe Thierry)、英特尔(中国)有限公司企业解决方案部石油天然气行业资深企业客户经理杭晓东、英特尔数据中心事业部亚太和中国区高性能计算/工作站方案架构师何万青。
英特尔(中国)有限公司企业解决方案部石油天然气行业资深企业客户经理杭晓东,首先在此次研讨会上做了发言。
他表示,随着社会生活的发展,未来对石油的需求也会与日俱增,相应地,对于石油勘探的效率和精度的要求也随之高涨。传统高性能计算平台已经不能难以满足当前和未来使用勘探的需求,在这种情况下,特别需要有一种创新设计、能够拥有更高性能和灵活性、可靠性的高性能计算平台来帮助实现。
英特尔(中国)有限公司企业解决方案部石油天然气行业资深企业客户经理 杭晓东
今年英特尔最新推出的至强E5处理器平台,拥有更强大的性能和更多的创新设计。最新全球高性能计算TOP500排行榜,短短几个月时间就取得了骄人的成绩,也充分说明了该处理器平台能经受苛刻考验的种种优势特性。
最新推出的基于MIC集成众核架构的至强融合品牌及未来发布的全新产品,将加速英特尔在该领域的布局,联合业界合作伙伴,共同打造能够为石油、电力等能源行业提供更高性能、更低功耗的高性能计算平台。
为什么石油勘探和高性能计算这两个分属于能源领域和信息技术领域的事物会彼此拉上关系?对现阶段石油勘探方法的探究就能解开这个疑惑——目前全球石油勘探机构普遍使用的是地震波勘探法,它就是要对人工制造的、并由地下不同构造反射回来地震波进行采集分析,并将之转化成可视化的油藏模拟图像,帮助准确定位油气田的储藏。这一过程要涉及到TB级、甚至是PB级海量数据的快速处理,只有高性能计算技术才能担此重任。
那么百亿亿级高性能计算技术又能为石油勘探带来哪些新的助力呢?简而言之就是更高的相关数据处理效率与更出色的分析或模拟精度。百亿亿级高性能计算技术并不是高性能计算技术发展的终极目标,它只是未来数年这一领域能够达到的一个全新目标,但它所体现出的性能不断提升的趋势,却是石油行业用户以及所有正在利用高性能计算技术的行业用户们永远不变的追求。
英特尔能源及高吞吐计算团队高级主管工程师菲利浦•蒂埃里(Philippe Thierry)
菲利浦蒂埃里在大会上也表示,2010年的时候,所有的地震波计算方法都是基于二维发展。而目前从数据采集、处理都是基于三维来进行。地震波从纵向通过反射等不同波形,通过数学计算来获取地下的波形和模拟构造,从而帮助寻找石油蕴藏所在的精确位置。
由于地震波法勘探收集的数据通常都以TB计,近年来海洋油气勘探所采集的数据甚至都已开始向PB规模发展。为此,只有借助高性能计算机,才能在最短的时间内处理这些海量数据。
在这样的情况下,基于英特尔平台的高性能计算,在石油勘探中就能体现出更多的优势。根据应用的不同,可以选择不同的波传递求解方式。线性计算扩展性较差,可以采用全时域或者时域相交叉的方式。在模拟算法方面主要有两大类—基于MPI/OpenMP混合模型的并行地震数据处理,前者在扩展性方面很高,后者在英特尔MIC架构上拥有很大应用。
在石油高性能计算领域,中国石化石油物探技术研究院和中国石油东方地球物理公司研究院,每年的技术研发投入都数以千万计。如何缓解能源之痛,如何探讨出一条适合中国国情的石油勘探和开采之路,成为了与会代表一致关心的问题。
来自中国石化石油物探技术研究院院长赵改善先生,也在此次高性能计算研讨会上,分享了自己的观点。
中国石化石油物探技术研究院副院长兼总工程师 赵改善
他首先表示,英特尔高性能计算研讨会在石油行业属于行业的顶尖盛会。近几年石油行业也发生了翻天覆地的变化,面临了很多机遇,也遇到了很多挑战。目前,中石化物探院拥有大约7000平方米占地面积。其中一期设备已在去年9月正式投入运营,该其数据中心中拥有CPU数量总共为11000个,GPU为11万个。在计算能力方面,单精度可以达到400万亿次,双精度为200万亿次。
在挑战方面,当代石油物探高性能计算面临着地震勘探数据量海量增长的严峻形势。从上世纪80年代的2-36MB/KM^2的2D数据,增长至3D的30-300GB/km^2。地震数据源的增加,和多源地震(最高一天采集40000炮以上数据)和被动源地震(连续数据采集)息息相关,也与采用更为先进的采集技术有关。
挑战还体现在,海量数据的增加带来了IT系统的选型问题。目前,在加速器方面,赵院长表示,存在一个MIC和其他体系的权衡和选择的问题。随着系统的增大,还会出现运维成本、投资规模等问题,在选择中,性价比是一个决策的重要标准。虽然GPU计算能力比常规的CPU要强,但在很多应用方面并不能在GPU上实现运行。
赵院长还特别强调了,在目前国内高性能计算应用情形中,相比硬件平台,应用平台还未完全搭建起来。未来对应用的需求也会越来越大,针对上万、甚至数十万处理器内核的应用,其软件开发还有很长一段路要走。
在能耗方面,赵院长表示,中国石化石油物探技术研究院借鉴了其他超算中心的做法,将冷风道进行封闭。经过测算,封闭的施工成本在2个月内即可收回。这是一种简单可行的降低能耗的方法。此外,还使用了英特尔数据中心的节点管理器(Node Manage),将不使用的服务器的主频进行降低,从而帮助降低能耗。当然,还将探索使用直流供电和液冷等多种方式,全面帮助降低能耗。
中国石油东方地球物理公司研究院数据处理中心总工程师赖能和,也参加了此次高性能计算研讨会,并在会上做了精彩发言。
首先,赖能和介绍了中国石油东方地球物理公司研究院数据处理中心的现状。根据介绍,该数据中心目前拥有集群、GPU和多路服务器,其中集群方面具备处理器23620个,核心数量达到75686个,理论峰值可达695千万亿次。而就处理中心的的情况来说,拥有GPU数量为936个,约为458816个核心,可以实现576千万亿次理论运算峰值。
中国石油集团研究院(BGP)数据处理中心硬件资源概览
针对石油行业高性能计算应用,赖能和指出,特别需要对软硬件资源进行优化和管理。其中措施有优化和改造内存、接口、网络连接方式等硬件配置,合理配置作业系统的CPU资源分配,有效提高CPU运行效率。采用不同品牌的存储系统,充分利用各种优势I/O性能,满足海量数据处理和传输的需求。利用SAN架构建立全局共享存储系统,建立存储备份机制,提高数据安全。同时,还需要利用各种数字化信息技术,提高大规模计算机系统的运维水平。
他还表示,在石油行业也面临着大数据时代带来的挑战。目前,高效采集技术已经在海外项目中得到的全面应用。而SHELL、BP、TOTAL、ENI、REPSOL、PDO、SAUDI、ARAMCO等海外项目,均有超过70%的可控震源队采用了高效作业方法进行施工。
随着石油公司对成像质量的更高要求和装备技术的进步,20万道以上采集将成为现实。高密度空间采样、宽方位(全方位)、点激发、点接收、大道数可控震源宽频高效采集成为发展趋势,国外一些大油公司已经利用5-10万道以上接收排列、大吨位可控震源宽频激发、日效超过万炮的高效采集技术进行野外作业,每天的数据量就可高达5-10TB。
来自高密度地震采集、海洋、多波都导致地震源的海量数据,会带来海量数据的处理、如何有效解决I/O瓶颈,实现安全存储和拷贝海量数据等等一系列问题,从而对HPC提出新的挑战。为此,人们需要对架构、内存、本地硬盘、网络、存储等一系列系统进行优化和管理。
石油行业将面临大数据的挑战,基于此,来自英特尔亚太研发中心大数据部的王晓栋先生,为与会人员带来了Hadoop与大数据应用场景的有关内容介绍。
王晓栋表示,Hadoop是一个相当较新的技术,它是一个建立在普通服务器上的高度可扩展、高可靠的分布式系统,专为大规模计算和海量数据存储而设计。它的可扩展处理引擎主要包括两大部分:
——Hadoop Distributed File System(HDFS),分布式文件系统,可扩展、可自动修复的高带宽集群存储;
——MapReduce,并行计算框架。
英特尔亚太研发中心 王晓栋
随着数据量的增加,数据的查询、存储、分析会越来越依赖于大型存储、处理等设备,纵向的扩展也越来越困难。增加处理器、存储、网络资源,其性能却不会获得线性增长。最早感受到这种挑战的,来自于互联网企业,它们的数据,希望通过常见系统来实现难以完成的功能。
英特尔敏锐地发现了这一发展趋势,并成立了相关的研发团队,并推出了基于英特尔的Hadoop发行版。
对Hadoop的架构来说,它提供了两种模式,分别是分区模式和冗余方式。前者使计算节点和存储节点合二为一,对于英特尔构架的服务器来说,使用Hadoop模式特别适合。也可以使用机架上的更多存储和多路多核处理器,来解决磁盘I/O瓶颈等问题,其计算能力能得到线性式增长,数据和计算可以被分布到大量独立的节点上,进行分布式计算。
另一个优势则是冗余方式,为了实现可靠性,数据需要被复制到多个独立节点。可以实现服务的冗余、存储的冗余。
王晓栋先生,还特别提到了Hadoop在石油行业的未来发展前景。他认为,Hadoop自身的很多优势特性都是当前HPC集群的一个良好不错,能提供很多高可靠性设计,支持动态、智能地对计算集群资源的管理、优化和监控,以更优越的方式进行计算作业的管理。
此外,由于勘探采集方法和野外施工等原因,油气勘探采集到的原始数据资料十分珍贵,需要永久保留。在采用Hadoop的情况下,支持的数据容量可高达petabyte(PB级别),并且支持扩展。
前面讲了这么多石油与高性能计算方面的问题,那么,它们之间到底有何关系呢?
由于油田在地下并不是以所谓“油海”的形式存在,而是由一个个彼此隔离的“葡萄串”组成的,因此在不够精准的勘测结果面前,人们只能多钻井进行尝试,而且只有将油井钻到一个储有石油的“葡萄”顶部,才算是大功告成。然而,钻井的费用是非常高昂的,每打一口油井,其花费往往都会达到上千万甚至是上亿元,为提高石油勘探的能力和效率并降低其成本,石油企业很快就开始在勘探中采用了更为先进的地球物理方法,尤其是地震波法。
利用高性能计算摸拟油藏分布图(图片来自网络)
所谓地震波法,简而言之就是用炸药在地面激起人工地震波,这种地震波可传入地下深处,并在碰到不同形态的地质构成时形成不同的反射波,这些反射波经地面的检波器收集、转变成电子信号后可存储为数据,通过对这些数据进行计算处理,人们就能清晰地摸拟还原出勘测区域的地下地质构造,并找到那些存有石油或天然气的岩层的精确位置。由于地震波法勘探收集的数据通常都以TB计,甚至在近年来海洋油气勘探所采集的数据都已开始向PB的规模发展,这些海量数据的处理只有借助高性能计算机,才能在最短的时间内完成,以实现最佳的勘探效益。
英特尔的百亿亿级高性能计算愿景
2011年6月20日,在当时举办的国际超级计算大会(ISC)上,时任英特尔公司副总裁兼数据中心事业部总经理的施浩德(Kirk Skaugen)向与会者分享了英特尔计划在2011-2020这个十年期的末期实现每秒百亿亿次浮点计算性能(ExaFLOP/S)的宏伟愿景。
施浩德在详解该愿景时指出,高性能计算(HPC)市场增长潜力巨大。在二十世纪80年代,高性能计算机的性能为GigaFLOP/s(每秒十亿次浮点运算),而今天最快的高性能计算机的性能已经是它的数百万倍了。反过来,这也增加了市场对用于高性能计算领域的处理器的要求。据英特尔预测:到2013年,全球性能最强的前100套高性能计算机将使用总计100万颗处理器。到2015年,这个数字有望再翻一番;到2011-2020这个十年期的末期,预计这一数字将达到800万颗。英特尔还预测:2015年时,全球高性能计算机500强(TOP500)排行榜上排名第一的系统在性能上将有望达到每秒十亿亿次浮点计算,2018年时,它将越过每秒百亿亿次浮点计算的标杆,而到2011-2020这个十年期的末期时,地球上最快的计算机的性能则有望超过每秒4百亿亿次浮点计算。
施浩德表示,要实现这一愿景,不仅需要行业与政府的通力协作,还需要采用英特尔集成众核(Intel Many Integrated Core,Intel MIC)架构所开创的新方法。管理互联网共享数据的爆炸性增长、寻求应对气候变化的解决方案、管理不断增加的自然资源(如石油和天然气)开采成本以及应对各种各样的其他挑战,都需要更多的计算资源,而这些资源只能依靠越来越多的高性能超级计算机来提供。
英特尔的平衡计算理念及相关创新
英特尔公司认为,要推动高性能计算的快速可持续发展,除要提供专为高度并行化应用优化的集成众核架构产品外,还需要平衡计算理念及相应产品技术创新的支持。而所谓平衡计算理念,就是指整个数据中心的IT设备(包含服务器、存储设备、网络设备)就相当于一个智能的大脑,担负计算任务的服务器就如同其专门判断和处理信息的神经元;存储设备则是可以收纳海量信息,并随时准备接受访问和更新的记忆细胞,而网络就是连通所有这些神经元和记忆细胞的神经连接,惟有三者在性能和功能上尽量实现平衡,才能实现最无缝的配合,以及1+1+1>3的应用效果。
目前英特尔平衡计算理念的最佳实践载体,就是于今年三月上市的英特尔至强处理器E5产品家族。针对财务分析、媒体内容制作和高性能计算等计算密集型应用,该产品家族不但通过创新的微架构设计,例如对英特尔高级矢量扩展指令集 (Intel AVX)实现了比上一代至强处理器5600产品家族提升高达两倍的性能,而且由于在业内率先在处理器中集成支持PCI Express* 3.0标准的I/O控制器,以及在处理器中内置了英特尔集成I/O(英特尔IIO)和英特尔数据直接I/O(英特尔DDIO)技术,以及在平台层面以英特尔万兆位以太网控制器X540来提供低成本、低功耗的板载局域网(LOM)功能,至强处理器E5平台还为开放架构存储设备和网络设备的性能的提升及功能的丰富化奠定了坚实基础,为产业界推出下一代存储和通信系统,与先进的服务器搭配以迈向平衡计算带来了更强的助力。
业界对于高性能计算未来是否会与云计算融合,或者高性能计算应用负载是否会迁移到云计算平台的探讨早已开始。但很多的高性能计算用户对于打造高性能云的设想却一直存有疑虑,其原因就在于云计算平台虽然扩展更为方便,管理更为简单,资源分配更为灵活,但用于实现这些优势的基石——虚拟化技术,却不免会带来额外的性能开销,并可能形成新的性能瓶颈,这对于渴求更高性能,并将这些性能全部用于加速自身高性能应用负载执行效率的用户来说,是难以接受的。
然而,有助于推进平衡计算理念和实践的英特尔至强E5平台却在这个阻隔高性能计算与云计算的障碍上打开了一个缺口,带来了一个契机——得益于更强的计算性能、更强的系统内部及对外I/O能力,对于万兆位以太网的支持以及在硬件辅助虚拟化技术上的革新和升级,基于至强处理器E5产品家族的服务器系统已能够显著降低虚拟化技术产生的性能开销,例如整个数据中心或某个集群系统实现网络的虚拟化后,对其网络带宽和延迟带来的不利影响。
来自美国国家航空航天局(NASA)的“试验”就见证了这一趋势的可行性。它针对传统高性能计算集群系统实现扩展时面临的复杂性和成本过高,以及在作业安排上不够灵活的问题,专门推进了名为Nebula的,基于云的基础设施即服务(IaaS)环境,来寻求源于云计算技术的解决方案。这个环境的核心技术基石,就是英特尔架构服务器、万兆位以太网技术以及OpenStack开源软件项目。
英特尔积极参与了这个项目,与NASA的性能工程师密切配合,致力于充分发挥英特尔架构平台上的虚拟化技术的性能潜力,以验证架构在云上、基于虚拟化环境的高性能计算系统与传统“裸机”形态(即非虚拟化)的高性能计算系统相比,是否会产生性能开销或其他干扰性能的因素。而测试的结果则表明,在英特尔架构平台所提供的单根I/O虚拟化技术和所支持的万兆位以太网技术的助力下,Nebula环境在MPI性能基准测试中给出的网络传输吞吐率和延迟测试成绩,已经超过了“裸机”方案。这初步证明高性能计算应用走向开放架构的云计算平台或环境是可行的,虽然还有一些技术问题有待解决,但采纳应用平衡的计算平台,无疑将是此后相关验证或尝试工作继续前行的重要支柱。
英特尔集成众核架构及英特尔至强融核产品线预览
2012年6月18日,英特尔公司正式宣布未来所有基于英特尔集成众核架构(英特尔MIC 架构)的产品将采用全新品牌——英特尔至强融核。第一代英特尔至强融核产品家族(代号为“ Knights Corner”的协处理器)将于 2012 年年底推出,届时它将成为英特尔至强处理器 E5-2600/4600 产品家族的重要补充,并为高度并行的工作负载带来全新性能。其第一代产品将主要用于高性能计算( HPC)市场,而未来的英特尔至强融核产品还将满足企业数据中心和工作站的需求。
英特尔至强融核协处理器
英特尔至强融核协处理器的主要优势在于具备出色的易用性,能够充分利用在英特尔架构上使用的常见编程模式、技术和开发者工具。由于它能够更充分地利用并行 CPU 代码,软件公司和 IT 部门将无需重新为其开发人员提供与加速器有关的专用编程模型的培训。
除了兼容 x86 编程模式外,英特尔至强融核协处理器还能够适用于专为高性能计算优化且高度并行的独立计算节点。它可以独立于主机操作系统来运行自己的基于Linux的操作系统。这一特性将可以为实施无法采用其它 GPU 技术的集群解决方案带来更大的灵活性。
英特尔至强融核协处理器将采用创新的22 纳米 3-D 三栅极晶体管制程技术,可在 PCI-e 插卡形态下集成超过 50 颗内核和支持最低 8GB容量的GDDR5 内存。此外,它还具备支持512b SIMD 指令的特点,可在单个指令控制下同时处理多个数据元素,从而能显著提升性能。在去年使用 DGEMM 进行的协处理器现场演示中,英特尔进行了使用单颗“ Knights Corner”协处理器提供超过 1 TeraFLOPs(每秒 1 万亿次浮点计算)双精度实际性能的展示。而在 2012 年国际超级计算大会上,英特尔使用行业基准测试工具Linpack (Rmax) 1展示了同样超过 1 TeraFLOPs 的卓越性能。相比之下,在 1997 年,ASCII RED* 高性能计算机采用超过 9,000 颗英特尔奔腾处理器才突破 了1 TeraFLOPs 性能大关。
虽然英特尔至强融核协处理器计划于 2012 年下半年推出,但英特尔宣布首个基于英特尔至强融核协处理器的集群已经投入使用,并在2012年6月发布的最新的第39届全球高性能计算机500 强排行榜上位列第150位,具备了每秒118万亿次浮点计算的卓越性能。
英特尔至强融核协处理器已获得了广泛的行业支持,包括 Bull、Cray、戴尔、惠普、IBM、浪潮和NEC 在内的44家制造商已承诺将推出采用该款协处理器的系统。
英特尔软件工具助力真实应用负载性能调优
不论是旨在推进平衡计算的至强处理器E5,还是专为高度并行化应用负载开发的至强融核新品,其性能的充分发掘和释放都离不开英特尔一系列软件开发与优化工具的支持,这些工具,也是英特尔在高性能计算市场上强大竞争力的重要组成部分。
这些工具包括了VTune性能分析器、英特尔编译器(Intel Compilers)、Intel Thread Checker、Intel Performance Libraries、Intel Threading Tools、Intel Cluster Tools等,它们可以帮助高性能计算应用软件开发商或最终用户分析自己的高性能计算系统及应用软件特性,并最大限度优化其高性能计算机软硬件系统,发掘其最大性能潜力。世界领先的石油服务公司斯伦贝谢(Schlumberger)技术服务副总裁Jim Brady指出,“通过与英特尔的紧密合作和其行业领先的软件使用工具,我们很好地优化了我们的软件的扩展能力的性能。因此,我们的石油和天然气客户可以更好地理解液体流动和地质因素,更迅速,更确性,高效地推动能源勘探的发展。”
以这些工具为基础,英特尔公司还推出了“真实应用负载计划”,来帮助用户针对其真实的应用负载,而非通用的基准测试软件来进行调优,从而帮助他们从自己的系统上获取最大化的收益。截止目前,英特尔中国高性能计算团队已经和一些国内用户合作优化和测试了一系列真实应用负责,包括复旦大学(VASP应用),中国海洋大学(WRF-ROMS应用),中科院生物物理所(EMAN,I3和NAMD应用),上海交通大学(KLAPS和CFD程序)等。目前该团队还提供了由16个节点至强E5服务器构成的,用于真实应用负载测试的基准集群环境。