技术专家和应用专家亮相曙光SCC13大会_中科曙光服务器

1高性能计算应用专家

9月24日，由曙光公司主办，中国科学院计算机网络信息中心协办的第二届曙光超算技术大会（SSC13）在北京召开。此次会议以汇“技”智慧深植应用为主题，汇集了来自中国科学院计算机网络信息中心、中国科学院北京生命科学研究院、中国科学院微生物研究所、中国科学院高能物理研究所、中国科学院计算技术研究所、中国科学院地质与地球物理研究所等多领域业内权威的专家以及Nvidia、Intel、Mellanox、NAG等软硬领导厂商，并同与会者一起探讨中国高性能计算的创新与应用发展方向，帮助用户了解高性能领域的前沿技术。

第二届曙光超算技术大会（SSC13）

　　应用专家：

　　1、中国科学院计算机网络信息中心研究员金钟

　　嘉宾介绍：1997年7月毕业于北京大学，获学士学位；2006年7月毕业于美国Emory University，Cherry Logan Emerson科学计算中心，获博士学位。现任中国科学院超级计算中心多学科/重点科学大规模计算软件与实现主管、计算化学虚拟实验室执行负责人兼技术主管和中美联合科学计算中心执行负责人。

　　近年来，作为项目负责人主持国家863计划重大项目1项(“高性能计算化学应用系统”)、CNIC青年基金1项(“基于e-Science应用的高性能计算化学增值服务模式研究”)，国际合作项目2项。作为主要成员先后参加并完成科技部、基金委、中科院和美国国家科学基金(NSF)、能源部(DOE)、 ONR(Office of Naval Research)资助科研项目、课题十余项。主要从事高性能计算应用和并行软件实现、应用网格、高性能计算化学软件算法和应用技术等交叉学科方面的研究工作，先后发表论文三十多篇，其中SCI收录十余篇。

　　演讲主题：面向中科院新一代超级计算机ERA的应用

　　主题概述：目前，我国高性能计算机的硬件研制水平已达到国际领先水平，但应用软件的研发和应用水平却大大滞后于硬件的研制。中国科学院作为我国高性能计算应用的先锋和“国家队”，在应用研发和高性能计算的应用领域一直处于国内的前列。而随着中国科学院“十二五”科研信息化项目的开启，第六代超级计算机ERA的研制与部署已步入快车道。我们将介绍针对ERA的应用开展和预研成果。

　　2、中国科学院北京生命科学研究院研究员赵方庆

　　嘉宾介绍：赵方庆，博士，研究员。中科院“百人计划”入选者。2001年获青岛海洋大学海洋生物学、计算机技术及其应用专业学士学位。2006年在中国科学院海洋研究所获博士学位，研究方向为海洋微藻的进化基因组学。2006年7月至2007年底在美国宾州州立大学生物化学和分子生物学系做博士后研究，方向是光合微生物的基因组学。2008年1月至2010年底在该校的比较基因组学和生物信息学研究中心，从事计算生物学的研究工作。2010年10月被中国科学院北京生命科学研究院聘为“百人计划”研究员，主要研究方向为计算基因组学。现为中国科学院北京生命科学研究院计算生物学联合研究中心秘书长。目前已在国际刊物上发表研究论文30余篇。

　　演讲主题：高性能计算与基因组科学

　　主题概述：新型高性能仪器设备的开发和运用，一直推动着科技的不断创新和进步，也在生命科学相关领域的发展中发挥着不可替代的作用。近几年来，以新一代测序仪和质谱仪等为代表的大型仪器设备，在基因组学和蛋白质组学分析中得到了广泛的应用，通过生成大规模数据实现了真正意义上的“组学”研究，并对学科发展产生着极其深远的影响。然而，新一代的检测技术也从根本上撼动了传统的组学数据分析模式，在计算生物学算法方面给研究者们带来了巨大的挑战。当前对基因组学的研究已经不仅仅局限于序列的测序与组装，更多的是通过大规模深度测序识别基因组结构及其变化的生物学意义，如通过基因组测序来认识疾病的发病机理与进化发展过程，从而来防止疾病的发生或找出医疗的方法。针对第二代测序仪生成的大规模测序数据，并行化和自动化的高性能计算有助于进行高效的序列处理，分析各类基因组学问题，帮助研究者更加快速准确地从海量、零散的信息中挖掘出生物学本质。

　　3、中国科学院微生物研究所副研究院张新宇

　　嘉宾介绍：

　　张新宇，博士，副研究员。1995年获山东大学生物化学学士学位。2007年在清华大学获博士学位，研究方向为生物信息学。2009年至2011年在清华大学计算机系做博士后研究，方向是异质高通量数据整合算法研究。2011年3月至今在中国科学院微生物研究所真菌学国家重点实验室负责生物信息学平台，任创新性平台中心主任。目前已在国际刊物上发表研究论文20余篇。

　　演讲主题：高通量测序生物信息学平台及分析案例简介

　　主题概述：着人类基因组测序计划的完成，以及下一代测序技术的迅速推广普及，全球两千多台测序仪每时每刻都在产生数以T计的测序数据，数据的产生速度远超数据储存和计算能力增长速度。如何管理以及全面分析这些生物学数据，从中去粗取精，去伪存真，并提取其中的生物学知识，已经成为生物学家和生物学实验室的难题。在此，我们介绍一个以曙光高性能计算集群系统作为硬件支持，以国际先进流行的专业分析流程作为软件系统，通过生物信息学专业团队构建的一个高通量数据分析平台。该平台架构于功能基因组学，比较基因组学，系统生物学等三个不同层次，可以对基因组和转录组测序数据以及蛋白质组数据进行深入分析，包括从测序生数据质控开始，一直到系统生物学分析（对各种组学数据的整合）。该平台自2011年建设以来，已经成功分析了14个新测序的真菌基因组和转录组，2个放线菌基因组及转录组，合作发表SCI论文5篇。

　　4、中国科学院计算机网络信息中心研究员王龙

　　嘉宾介绍：王龙，研究员，理学博士，中科院超算中心技术总监，中科院计算机网络信息中心学位委员会成员。主要研究方向为计算宇宙学与材料第一原理计算中大规模并行算法与异构算法及其软

　　件实现。已发表SCI论文5篇，SC11会议（超算顶级会议）文章1篇，Springer专着1本（第二主编）。主持863、基金委、院信息化重点应用等项目，参与基金委培育项目、院交叉团队等项目。入选中科院首批“青促会”成员及北京分院“启明星”人才计划。

　　演讲主题：第一原理与流体的异构计算应用

　　主题概述：流体力学计算和材料科学中的第一原理计算是目前高性能科学计算中最常用的两类应用之一。基于第一原理和计算流体的传统MPI并行算法及软件实现已有相当多的工作，但随着异构计算逐渐成为高性能计算机发展的重要趋势，对这两类应用的异构计算软件需求也日益迫切。在这一软件开发进程中，传统并行算法往往不再适用，需要全新的算法设计和软件实现技术，特别是内存的精简使用、依赖于特定部件的细粒度优化技术和算法的重新设计。以发挥异构部件的计算能力，并屏蔽由于异构部件引入导致的额外数据传输开销（这往往是制约并行性能的主要瓶颈）。我们将以自主研发的平面波赝势的第一原理GPU加速软件Ultra-Mat和计算宇宙学的高阶流体计算软件：P-Widgeon为例进行介绍。

　　5、中国科学院高能物理研究所研究员陈莹

　　嘉宾介绍：陈莹，1992年毕业于北京大学地球物理系；获理学学士，1997年毕业于北京大学物理系理论物理专业，获博士学位；1997年到中国科学院高能物理研究所从事博士后研究并于1999年11月留所工作至今，期间曾于2002年9月至2003年12月赴美国Kentucky大学访问交流；2006年被聘为高能物理研究所研究员。

　　陈莹研究员主要从事格点QCD的数值模拟研究工作，研究内容包括轻强子、粲夸克偶素、胶球和混杂态的质量谱以及强子激发态等,在国内外重要期刊发表文章40余篇。他利用手征费米子作用量研究核子及核子激发态的研究工作受到国际同行的广泛引用；关于胶球质量谱的计算结果被Particle Data Group(PDG) 2006-2012年的Review of Particle Physics连续收录；和国内本领域的专家于2005共同组建中国的格点QCD合作组--China Lattice QCD, 利用国内的超级计算系统从事格点QCD的大规模数值模拟计算，已取得一系列重要进展

　　演讲主题：格点量子色动力学--高性能计算在高能物理中的应用

　　主题概述：格点量子色动力学（格点QCD）是研究强相互作用非微扰问题的一种理论方法，研究手段是从第一原理出发利用蒙特卡罗方法进行大规模的数值模拟计算。格点QCD数值模拟研究已经成为高能物理理论研究的重要方面，研究结果日益受到高能物理实验和理论研究重视。从科学计算角度来讲，格点QCD也一直是国际上高性能计算的最重要应用领域之一。我们将阐述格点QCD的理论背景和计算特点，介绍格点QCD研究的国内外发展现状以及我们的若干应用成果。我们期望国内的格点QCD研究在未来几年有大的发展。

　　中国科学院计算技术研究所副研究员谭光明

　　嘉宾介绍：谭光明，中国科学院计算技术研究所副研究员、博士生导师。主要研究方向为并行算法、编程与体系结构，负责计算机体系结构国家重点实验室和曙光团队的并行算法小组的研究工作。作为科研骨干参加了863项目曙光4000/5000/6000（星云）系统的研制；承担并参与了多项国家自然科学基金项目和973项目；2006年8月至2007年8月访问University of Delaware，参与了IBM Cyclops-64众核体系结构的研究。在高性能计算方面发表了论文三十余篇，包括超级计算领域的国际会议和期刊如SC、ICS、SPAA、PPoPP、TPDS和JPDC等。曾担任多个国际会议的程序委员会委员（ICS 2010、ICPP 2012、HiPC 2011-12等），并担任了多个期刊的审稿人（TPDS、JPDC、PC、IJHPCA等）。2007年获得中国科学院院长优秀奖，2008年获得中国计算机学会优秀博士论文奖，2010年获得中科院卢嘉锡青年人才奖，2011年入选中科院青年创新促进会。

　　演讲主题：面向GPU的快速稠密矩阵乘算法设计和实现

　　主题概述：双精度稠密矩阵乘（DGEMM）是科学与工程计算应用中重要的性能关键的核心算法，本工作介绍一种基于现有的GPU体系结构如NVIDIA Fermi和AMD Cypress的高度优化的DGEMM设计和实现。针对两种GPU存在的共同的存储墙问题，开发了算法性能模型确定最优分块因子的以缓解其内存带宽瓶颈。进一步考虑到两种GPU上不同的来自体系结构方面的性能瓶颈，提出了新的半自动自动调度算法和细粒度软件流水算法，并分别在NVIDIA Fermi和AMD Cypress的GPU平台上实现了优化的DGEMM程序。在NVIDIA Fermi平台上，优化DGEMM的浮点峰值从原来的302GFLOPS（效率58%）提升到362GFLOPS（效率70%），超过比CUBLAS4.0版本20%；在AMD Cypress平台上，浮点峰值从优化前的438GFLOPS（47%）提升到758GFLOPS（82%）。二者都是目前为止公开报道的在上述两种GPU体系结构上性能最高的DGEMM实现，在NVIDIA Fermi上优化实现的DGEMM已经被集成到评测CPU-GPU超级计算机的基准测试程序HPL GPU版本中。

　　中国科学院地质与地球物理研究所研究员郭光军

　　嘉宾介绍：郭光军，博士，研究员，现任中国科学院地球深部研究重点实验室副主任、计算模拟实验室主任。研究方向：天然气水合物、页岩气、地幔矿物等的计算模拟研究

　　承担科研项目情况：青年基金项目：天然气水合物成核过程的分子动力学模拟，2002.1-2004.12（负责人）；面上基金项目：天然气水合物成核过程的分子动力学模拟（II），2007.1-2009.12（负责人）；973二级课题：南海北部天然气水合物成藏的温压条件研究，2009.1-2013.8（负责人）；院重要方向项目：用分子动力学模拟和冲击波动高压实验研究地幔转换带的速度和密度结构，2011.1-2013.12（负责人）。

　　演讲主题：高性能计算在固体地球科学中的应用

　　主题概述：高性能计算在当代固体地球科学中有十分广泛的应用，中国科学院地质与地球物理研究所开展高性能计算已有近20年历史，我们主要关心各种矿物和地质流体的物理化学性质、与成矿有关的微观机制、地幔对流动力学过程、空间电磁现象等。目前随着利用计算机开展地学研究的广度和深度越来越大，对计算资源的需求与日俱增。

品牌：中科曙光服务器

2高性能计算技术专家

　　曙光数据中心研究所所长沈卫东

　　嘉宾介绍：沈卫东，中科院高级工程师，国家高性能国家高性能计算机工程技术研究中心数据中心技术研究所所长，中科曙光研发中心数据中心部总监，多年来一直从事国外最新数据中心基础设施领域的技术研究、技术引进、技术创新和产业化工作。

　　演讲主题：超级计算中心基础设施发展趋势

　　主题概述：介绍了超级计算中心基础设施的基本概念，分析了目前超级计算中心存在的技术挑战，展望了未来超级计算中心的发展趋势。

　　曙光存储方案部首席工程师刘冠川

　　嘉宾介绍：

　　曙光公司解决方案中心存储方案部高级存储方案工程师。

　　毕业于中国科学院高能物理研究所，粒子物理与原子核物理专业。

　　曾担任曙光信息产业（北京）有限公司技术支持中心解决方案部高性能计算物理、化学、生物领域的售前及售中工作，拥有扎实的科学计算实践经验。

　　2010-2011年间曾负责上海超算中心日常运维工作和曙光公司华东地区的售前及售中支持。积累了丰富的超算运维和应用经验。

　　在上海超算期间，主要研究了Lustre、GPFS、HDFS等海量存储系统，并进行了大量的Lustre优化及Debug工作。

　　2012年3月回到北京加入曙光公司解决方案中心存储方案部。目前主要致力于曙光存储方案（云存储、大数据、容灾备份）的推广。

　　演讲主题：科研大数据最新技术探讨

　　主题概述：近几年，在互联网及云计算应用的推动下大数据技术获得了前所未有的发展，涌现出以Hadoop为代表的一系列新的计算框架、新的算法和新的思想。

　　目前，大数据正迅速地渗透到社会的各行各业，改变着我们的生活。各国纷纷将大数据上升到国家战略加以重视、推动和发展。

　　科学研究是大数据的重要生产者，大数据技术天然的实验田和大数据人才的孵化器。在科学研究领域进行大数据技术的研究和应用大有可为。

　　作为国内最大的存储厂商，最早的大数据技术研发企业，曙光公司一直致力于大数据技术的研发和推广，本文将通过大数据时代、科研领域的大数据挑战、Hadoop带来的机遇、相关技术发展趋势探讨、曙光大数据解决之道以及科研领域大数据应用介绍等几个方面阐述曙光对大数据技术的理解以及科研领域应用大数据技术的看法。

　　曙光高性能计算方案部经理李斌

　　嘉宾介绍：李斌，博士，曙光解决方案中心，高性能计算方案部经理

　　2004年本科毕业于北京师范大学化学系，2009年博士毕业于中国科学院化学研究所分子反应动力学国家重点实验室，理论与计算化学专业，研究生期间主要从事小分子体系的量子动力学计算方法研究。2009年博士毕业后加入曙光解决方案中心，从事高性能计算解决方案规划、用户技术支持、高性能计算技术研究等工作，在高性能计算集群的配置与管理、高性能计算应用软件的调试和优化等方面具有丰富经验。

　　演讲主题：Linux下程序编译与运行

　　主题概述：C、C++、Fortran等高级语言编写高性能计算程序，需要进行编译后才能在高性能计算集群上运行。如果自己开发编写计算程序，或者使用提供源代码的计算软件，常常需要在Linux环境下进行程序编译。本课程将介绍Linux环境下串行、OpenMP并行和MPI并行程序的编译流程，包含头文件的指定、库函数的连接、编译优化等。此外，还将通过实例介绍Linux下主流的源代码管理工具make以及makefile的编写规则

　　Intel软件事业部HPC应用软件工程师王哲

　　嘉宾介绍：从２０００年开始在中国科学院计算技术研究所高性能室参与曙光２０００，３０００，３０００Ａ等高性能服务器的底层通信协议的开发。于２００３年中，进入ＳＧＩ中国，负责亚太地区的高性能项目的支持。２００６年起，进入Intel公司，负责中国地区高性能项目的技术支持和应用软件在Intel平台的性能优化和分析。同时，也支持全球的环境科项目和环境科学软件的优化和能源软件在Intel Xeon Phi平台的软件移植和优化。

　　演讲主题Intel Xeon Phi架构概述及案例分享

　　主题概述：基于Intel Xeon Phi的架构的软件工具和该架构支持应用软件模型。详细介绍了以下内容：如何使用Intel的软件将现有的软件移植到Intel Xeon Phi平台上或开发一个基于Intel Xeon Phi平台的应用软件；如何使用Offload制导语句，在Intel Xeon Phi平台上移植和开发应用软件；如何简单有效快速在该平台上移植和运行软件；最后介绍了如何在Intel Xeon Phi上简单的优化代码。本讲义通过介绍硬件架构，支持软件，从简单移植，复杂移植，优化角度让读者能够快速的在Intel Xeon Phi平台上开发和移植，优化软件。以及Intel Xeon Phi应用案例分享

　　英特尔软件开发产品高级技术咨询工程师段小平

　　嘉宾介绍：2003年初加入英特尔公司, 一直从事软件开发产品的技术咨询，客户支持和培训等工作。

　　演讲主题：一、Intel Cluster Studio XE简介

　　二、针对Intel Xeon Phi的编程方式和程序优化

　　曙光高性能计算方案部气象领域首席工程师田相桂

　　嘉宾介绍：毕业于北京航空航天大学，硕士学位，2011年加入曙光公司解决方案中心，现任高性能计算方案部气象行业首席工程师，负责气象、环境等行业的高性能计算项目支持。精通Linux Shell程序开发、数值模式程序调优等工作，熟悉HPC集群配置、Infiniband高速网络和并行文件系统等相关技术，具有非常丰富的HPC项目售前支持经验。

　　演讲主题：Shell程序设计

　　主题概述：Linux shell是用户与Linux操作系统内核之间交互层，是Linux操作系统的使用接口。Shell提供了用户与操作系统之间通讯的方式。这种通讯可以是交互方式，或者是shell脚本形态的批处理方式。因此shell也被认为是一种脚本编程语言。Linux Shell通常是高性能计算用户的主要工作环境，我们需要在Shell环境中完成计算数据准备、计算任务提交、结果数据处理等一些操作流程，熟悉shell环境以及shell脚本编程可以使我们的日常工作更加方便、快捷、高效和智能。本课程将介绍目前最主流的Linux shell--bash的基本结构和语法，涵盖bash的执行方式、变量、函数、输入输出、分支判断和循环等流程控制等内容，此外还会介绍regex正则表达式，以及grep、sed、awk等Linux下常用的字符和数据处理工具。

　　曙光高性能计算方案部众核技术首席工程师何沧平

　　嘉宾介绍：毕业于中国科学院计算数学研究所，研究MPI/GPU并行算法、OpenACC编程语言。在曙光公司负责并行程序移植与调优、高性能集群的GPU/MPI工具研发、主流商业软件性能分析。

　　曾将用户的海洋天气预报程序加速20倍。将OpenACC编程标准1.0版、2.0版译为中文，撰写多篇OpenACC技术文档，维护一个OpenACC技术交流群。

　　演讲主题：OpenMP并行程序设计

　　主题概述：多核处理器需要共享内存程序来挖掘硬件潜能。OpenMP是一个功能强大、应用简单的并行程序开发工具，本报告介绍它的主要功能和设计原理，示例丰富，易学易用。

　　NVIDIA高性能计算开发技术工程师王泽寰

　　嘉宾介绍：毕业于北京邮电大学多媒体与模式识别专业，硕士学位。拥有多年CUDA开发经验与丰富的实际工作经验。在NVIDIA公司高性能计算开发技术组主要负责视频分析领域的项目研究，协助多家企业开发过指纹识别，入侵检测，车辆识别等多款基于GPU的产品。并且在分子动力学方向参与过大学与研究机构的多个重点项目。

　　演讲主题：CUDA 编程与优化

　　主题概述：在CUDA编程部分首先通过对比CPU与GPU架构，介绍异构计算的概念。通过几个实例Helloworld, Memory Management, 与VectorAdd介绍CUDA编程的基本方法。然后进一步通过实例介绍GPU内存的层次模型。

　　在优化部分，主要介绍基于分析的优化方法。然后针对三种不同的bottle neck，内存受限型，指令吞吐受限型，延迟受限型，介绍各自的优化策略。

　　NVIDIA高性能计算开发技术工程师刘文志

　　嘉宾介绍：工学硕士，毕业于中国科学院研究生院，拥有七年高性能计算经验，五年基于GPU并行计算算法移植实践；目前在NVIDIA 担任高性能计算开发者技术工程师。

　　演讲主题：OpenACC编程介绍

　　主题概述：主要介绍OpenACC的编程模型、各种编译制导语句、实例讲解OpenACC优化手段

　　NAG大中华区软件工程师郭瑞源

　　嘉宾介绍：郭瑞源，毕业于东吴大学，财务工程硕士，取得财金与财务工程 (应用数学) 双硕士，曾荣获 Phi Tau Phi Scholastic Honor 奖项，专长领域为软件开发与金融工程应用，目前为英商纳格信息 (NAG) 大中华地区软件工程师。

　　演讲主题：以多核算法库加速海量数据之科学计算

　　主题概述：该演讲将介绍 NAG 历史、成功案例和NAG 算法库，我们将进一步讨论 NAG 算法库组成的内容以及讨论数值计算当前所面临的困境。AG 支持多核运算的算法库已被当今世界享有盛誉的大部分超级计算中心使用，能够在对称式多处理器 (SMP) 系统中，让开发人员与程序设计师作出最佳的并行处理功能，而这些支持多核运算包含以下的算法库，我们将讨论其应用与性能比较。

　　(1)NAG Matlab 工具箱

　　(2)NAG 多核算法库

　　(3)NAG Xeon Phi 算法库 (最新技术)

　　曙光高性能计算方案部海洋领域首席工程师苗春葆

　　嘉宾介绍：苗春葆，男，毕业于中国海洋大学物理海洋学专业，获博士学位。现任职于曙光信息产业（北京）有限公司，担任解决方案工程师。主要负责气象海洋环境领域的售前支持以及气象海洋领域数值模式的调试、优化等，曾独立开发了一个海洋数值模式，在MPI并行程序设计方面具有丰富的经验。

　　演讲主题：MPI并行程序设计

　　主题概述：本课程从零开始一步步介绍如何使用MPI编写并行程序，是一门MPI并行程序设计的入门课程。课程内容包括认识MPI、六个基本的MPI函数、高级MPI通信函数、派生数据类型、其它MPI函数五部分内容。除了讲解MPI并行程序设计的基本概念，以及常用的MPI函数的用法外，本课程还设计了大量的练习，并提供示例代码。通过示例代码的现场运行演示，可以使学习者能够更直观地体会MPI函数的用处，加深对MPI函数的理解，从而获得更好的学习效果。