3分钟看懂材料科学中的高性能计算和常用计算软件

高性能计算是研究材料的成分-结构-性质三者之间关系的有力工具。材料科学中的计算模拟主要使用密度泛函理论研究原子到微米尺度的材料，其并行实现方式主要分为并行K点、并行能带和并行平面波，具有较高的并行效率和大量的软件实现。

材料科学与计算模拟

材料科学是一个高度跨学科的领域，它主要研究原子尺度的基本物理化学性质与工程应用材料宏观性质之间的关系。这种关系不仅由化学成分决定，还与材料的微观结构密切相关。计算模拟是研究材料的成分-结构-性质三者之间关系的有力工具。

目前，物理和化学领域的基础理论和算法实现已较为成熟，已经可以对材料进行较为准确的预言性计算研究。此外，很多材料很难或还没有被实验制备出来，因而无法测量性质；有些材料比较危险，对人体健康有害；有些材料需要了解其在某些极端条件（如高压、超低温、强磁场等）下的性质时，实验测量很难实现或耗费巨大。所有这些都凸显了计算模拟的重要性和必要性。

对材料的计算研究，可以从空间尺度上进行划分，也相应地发展了不同的计算模型和方法。

在原子分子层次（埃到数百纳米的量级，10^-10m到10^-7m），人们可以了解材料的电子、光学、磁性、热学、力学等基本物理化学性质。在这个尺度内，量子力学效应显著，第一性原理计算和分子动力学是成熟而广泛应用的方法，蒙特卡洛方法也常有应用。

在纳米到数百微米的尺度（10^-9m到10^-4m）范围内，分子力场和分子动力学是常用的工具，用来研究晶体缺陷（掺杂、位错、晶界等）、材料生长、有机分子自组装等物理化学现象。

从微米尺度（10^-6 m）向上，由于体系粒子数增多，出现了新的物理作用机制，涌现出很多复杂的多体作用效应，因而需要新的理论和模型来描述。从这个尺度开始一直到宏观尺度，很多工程力学上的方法得以应用，从而对材料进行合适的模型化，屏蔽更小尺度的细节

此外，对材料的研究还包括对外场的响应以及动态性质，例如信息能源材料中的光电转换、各种压电和热传导效应、材料的生长过程、新的催化材料的寻找和性能优化等。。一般声子振动在飞秒皮秒量级（10^-14s 到10^-12 s），蛋白质折叠在微秒到毫秒量级（10^-6 s 到10^-3 s），腐蚀过程等在年（约 10⁷ s）的量级。此类计算模拟一般采用分子动力学方法处理皮秒到微秒量级的动态过程。

材料的空间时间尺度划分并不是绝对的，要做成一个实际可用的材料，需要了解从原子层次到工业生产应用的尺度，材料的特殊性能是否能够真正保持。

这通常需要进行多尺度研究，即把两个相邻的不同空间时间尺度连接起来。人们可以采用某种重整化的策略，即用第一性原理计算得到的参数直接提供给高一级的粗粒度方法使用，或者是用精确耗时的方法训练更高一级方法的参数，来进行快速大体系的计算，而又不太损失精度。另外一种有效手段是分而治之的策略，即将体系分成若干区域，重要的部分（如催化、光化学反应中心等）使用高精度的方法，外围相连的不太重要的部分（如酶催化反应中心以外的蛋白质、水分子等）使用低精度的方法。常用的方法包括QM/MM（quantum mechanics/molecular mechanics）方法、第一性原理/有效介质近似与有限元方法的结合等。

目前，计算材料科学已成为高性能计算应用特别广泛特别活跃的领域。该领域研究和应用的快速发展不仅归功于理论、算法和软件进步，更得益于计算机硬件能力的指数性增长，包括处理器速度和数目的增加、内存容量和速度的增长、大规模并行处理能力的提高等。

越来越大体系的第一性原理计算，长时间尺度的分子动力学，更详尽精确的模型计算都成为可能。材料科学的计算结果也越来越接近现实，发挥了越来越大的作用。

计算方法

对一个现实材料的理论模拟，考虑到研究成本和时间等因素，在计算量相似的前提下，计算方法的选择与模型体系的尺度等因素密切相关。

对于几个原子数的分子或团簇体系，人们可以使用高精度的量子化学方法，包括Hartree-Fock、MP2、CC、CI、MCSCF 等从头算（ab initio）方法，研究小分子的物理化学性质、化学反应、势能面等，此类研究一般归于量子化学范畴。

对于几十个甚至几百上千个原子的体系，人们使用密度泛函理论（density functional theory，DFT）进行模拟，并有大量的软件实现。

对于几百到更大的成千上万原子的体系，则一般采用分子动力学方法。这类方法直接以原子或离子为处理对象，使用实验或以上两类计算（从头算和DFT）中得到的参数来拟合力场数据，然后进行分子动力学模拟、蒙特卡洛计算、解析求解经验公式等。

另一种方法是使用分子力学和量子力学结合的QM/ MM方法，将关键反应位置用高精度量子力学描述，环境用分子力学描述。

工业中的材料粒子数一般都在阿佛加德罗常数（6×10²³）量级，这种体系含有大量缺陷、晶界等，不能近似成上述各种较小的模型。在现有的计算条件下，用分子力学或量子力学直接处理这么大体系的粒子是不现实的。通常做法是进一步抽象和模型化，使用晶界动力学、相场模型等理论方法，或者使用有限元、有限差分法等求宏观尺度下的平均性质。

DFT方法

比较狭义的高性能计算的材料科学应用，是指使用DFT和分子动力学方法的计算模拟。对于具有空间周期性的晶体体系，DFT方法是最好的选择，原因包括：

（1）DFT 只依赖于单粒子波函数，可以直接实现周期性；

（2）使用平面波和赝势的DFT对于材料科学体系的典型尺度（几百个原子）具有较好的计算复杂性，其计算复杂性约为O(N²)~O(N³)，N为原子数目。

对于非常大的体系（超出1 000 原子），单粒子波函数正交化，复杂度为O(N³)，是计算最耗时的部分。对于这样的体系，人们发展了各种线性标度（O(N)复杂度）的DFT方法、紧束缚近似方法（density functional based tight binding，DFTB）等。

密度泛函理论（DFT）是一种处理多电子问题的单电子近似方法，它既有较为准确的计算结果，又有较高的计算效率，因此得到了非常广泛的应用，尤其是在材料科学领域中。

DFT 的基本方程是Kohn- Sham方程（KS方程），在DFT中，多电子相互作用被处理成与电子密度相关的交换相关项，一般来说，这个交换相关项是非局域化的。DFT中的关键问题就是处理这个交换相关项。

尽管DFT在形式上是确切的，但在实际实现中，主要依赖于对电荷密度交换相关泛函的近似。人们提出了很多近似方法，包括纯密度形式的局域密度近似（local-density approximation，LDA）和广义梯度近似（general gradient approximation，GGA）（如PW91、BLYP、PBE96等），以及更复杂的杂化形式（如B3LYP、PBE0、CAM-B3LYP等）。材料科学中最主要采用的泛函是LDA 和 GGA，这两类泛函都具有较高的准确性和较好的数值性能。

DFT方程原则上可以数值求解，但实际上都是用基组展开的方式求解。一类是局域基组方法，另一类是平面波方法，两类方法各有优缺点。在材料科学领域中，由于计算体系的典型尺度为几百个原子，使用平面波和赝势的DFT 对于这个尺度具有较好的计算复杂性，从而平面波方法应用更为广泛。

在平面波方法中，电子轨道用平面波基组表示，因此可以无缝地结合周期性边界条件（periodicboundary conditions，PBC），并使用快速傅里叶变换（fast Fourier transform，FFT）算法快速计算能量和力。但是平面波基组也有其缺点：不能充分描述原子核附近区域或原子实区域的电子波函数。

赝势平面波方法中，赝势产生的赝原子和真实原子具有相同的散射性质。赝势的根本原理在于成键时波函数的变化仅仅在价电子区域，因而适当地去除原子应该不会影响体系成键性质的预测。价电子波函数在这个区域变化非常快，而在成键区域变化要慢得多。准确描述波函数在原子实区域的快速变化需要非常大的平面波基组。

赝势平面波方法（pseudo-potential plane-wave，PSPW）可以很好地解决这个问题。在该方法中，原子势能快速变化的原子实区域和实电子被去除或用变化平缓的赝势来伪装和替代。赝势产生的赝原子和真实原子具有相同的散射性质。赝势的根本原理在于成键时波函数的变化仅仅在价电子区域，因而适当地去除原子应该不会影响体系成键性质的预测。

投影增强型平面波（projector augmented wave，PAW）方法是对赝势的进一步改进，改善了传统PSPW 方法的缺陷。平面波是固体应用的天然选择，因为晶体易于用周期性边界条件来表示。

并行实现

目前，已有很多方式来并行实现平面波DFT程序，一般包括3类并行方式：并行k点、并行能带、并行平面波。

对于许多固体计算来说，计算可以分布在布里渊区采样空间（并行k点）。k点并行的方式来源于所研究体系的平移对称性。该方法的有效性和所研究体系的尺寸大小有关。随着晶胞尺寸的增加，计算收敛所需的k 点数减少，因而该方法不能用于大晶胞的Γ点（k=0）计算。

另外一种方法是将单电子轨道在CPU上分发（并行能带）。并行化CPMD方法的另外一种直接方式是空间分解单电子轨道（并行平面波）。

并行K点方式具有较好的扩展性，但不适合于计算大晶胞体系；并行能带方式对于中小晶胞体系效率较高；并行平面波方式适合于大晶胞体系，但对全局通讯的依赖性较高，并行扩展性较差。充分利用最新的硬件技术，如加速卡、众核技术等，改写或重新设计材料科学计算软件已成为最近的发展趋势。

计算软件

由于计算模拟的重要以及计算方法的完善，材料科学领域内的高性能计算软件（包括商业化和非商业化软件）非常丰富，并拥有大量的用户，是全球各大超级计算中心的主要应用软件。这些软件一方面及时跟进利用物理、数学等领域的最新研究成果；另一方面又充分利用高性能计算软硬件技术的发展，已形成一个开发活跃、功能丰富、风格多样、用户广泛的软件群体。下面以最为常见、使用最为广泛的几种材料科学高性能计算软件为例进行介绍。

VASP（Vienna Ab-initiosimulation package）是研究材料电子结构比较成熟和广泛使用的软件包。它使用密度泛函理论、平面波基组、超软赝势或投影缀加波方法以及周期性边界条件。该软件的优点包括：实现了多种密度泛函和方法，功能比较齐全；官方提供比较精确的赝势；文档比较详尽，和物理性质联系得较好；以源码包形式发布；结构优化能力较强；新的功能和方法实现比较快。缺点有输入文件较多，参数定义不够直观，前后数据处理相对比较麻烦等。但它有很多第三方的可视化软件和前后处理软件，如p4vasp、vaspview、VESTA等。

DMol³是Accelrys公司商业软件Materials Studio套件中的一个闭源的密度泛函理论组件。它以数值原子轨道为基组，既可以进行全电子计算，也可以使用赝势，既可以使用周期性边界条件，也可以使用非周期性边界条件。它的优点包括：Materials Studio 套件在Windows下的图形界面简单易用，参数设置友好；前后处理方便；计算速度较快，常用来做体系的预优化，也能够较快地寻找过渡态。其他特色包括可以考虑溶剂效应等。缺点有基组不够完备，磁盘使用随着并行进程数增加而增加等。

CASTEP（Cambridge sequentialtotal energy package）是Materials Studio套件中另外一个密度泛函理论组件，对英国学者免费提供源码发布。它使用周期性边界条件、平面波基组、超软赝势、模守恒赝势，还能够在计算时生成赝势。此外，它还可以计算芯能级光谱和核磁共振谱。

WIEN2K是使用密度泛函理论进行电子结构计算的软件包，包含很多互相配合的模块，计算的前后处理结合比较紧密。它的特色是使用了完全势线性缀加平面波和局域轨道方法，是能带结构计算最精确的方法之一。它常被用来处理晶体的电子结构和磁性质、旋轨耦合等，但计算体系相对较小。

SIESTA（spanish initiative forelectronic simulations with thousands of atoms）是一个比较流行的开源软件包，开发目的是用线性标度的方法计算较大原子数的体系。它使用密度泛函理论、数值原子轨道基组和赝势方法，进行电子结构计算和从头算分子动力学模拟。它的优点包括参数比较简单易懂，能够进行较快的大体系计算，开源代码。此外，它还可以用非平衡格林函数计算电子输运。缺点则包括原子基组不是完备基组，收敛性能较差，精度不高，赝势库不够全面可靠，文档不够详细等。

QUANTUM ESPRESSO（open- source package for research in electronic structure，simulation，and optimization）也是广为流行的开源软件套件。它包含电子结构计算、分子动力学（包括CPMD和BOMD）、声子和电子输运计算等很多组件，有很多较有特色的功能，常被用来计算电声相互作用、介电张量等响应性质，以及X射线吸收谱、电子激发等光谱性质。其优点在于开放友好的接口，新方法实现快，提供的算例比较有代表性。缺点有文档不够完备，参数意义较难理解，缺少可靠赝势库，速度较慢等。

ABINIT是一个较早实现准粒子计算GW方法和较早有投影缀加波方法的开源软件包。它使用密度泛函理论、周期性边界条件、平面波基组和赝势方法，较多地被用来计算宏观极化、介电常数、电声相互作用等响应函数性质。此外，它还可以确定DFT+ U的Hubbard U值。缺点是文档组织、参数定义等都偏向于从开发者出发，对用户不太方便。

CPMD是一个从头算的电子结构和分子动力学的开源程序。它使用平面波基组和赝势，既能计算孤立分子，也能计算周期性边界条件。它主要实现 Car-Parrinello 发明的将电子波函数和离子一起进行动力学模拟的CPMD方法，以及路径积分分子动力学（path integral molecular dynamics，PIMD）。该软件功能强大，能处理多种系综，也包含线性响应理论、含时密度泛函、QM/MM等比较新的方法。此外，它的并行效率较高，常被用于作为高性能计算机的基准测试程序。CPMD理论方法本身不太适合金属体系。

CP2K是一个开源程序，可用于计算固体、液体、分子和生物体系，也支持图形处理单元（graphics processing unit，GPU）。它的特点是使用高斯和平面波混合基组，兼顾速度和精度。它包括密度泛函理论、密度泛函紧束缚方法、分子力场和QM/MM方法，可以用于X射线吸收谱、核磁共振等光谱计算。缺点是文档比较粗略，没有直接的技术支持。

LAMMPS（large-scaleatomic/molecular massively parallel simulator）是使用分子力学和分子动力学方法研究材料最流行的开源软件。它能够处理多种模型体系；实现了很多力场，包括描述化学键形成和断裂的反应性力场reaxff；支持多种系综，多种不同边界条件；并行效率高，并且支持图形处理单元和IntelXeon Phi平台。它可以模拟很多实验过程，例如压痕、拉伸、溅射、沉积、晶界等，并且更接近现实的模型，较多地用来计算力学性质、化学反应等。邮件列表非常活跃，开发者和用户的交流直接快速，交流成果能非常快地体现在最新版的软件发布中。

目前，材料科学已成为高性能计算应用领域最活跃，成果最丰富的领域之一。在理论和算法方面，人们发展了大量的计算模拟方法并不断改进，解决了很多挑战性问题和限制，例如半导体材料的能带隙问题，基态计算绝对零度限制等。人们已经逐渐能够模拟现实空间尺度和时间尺度的材料。在计算硬件技术方面，材料领域的研究人员不断跟进最新硬件发展，改写或重新设计软件，以充分利用最新硬件特性，例如利用ClearSpeed 加速卡的大规模并行DFT软件，VASP在GPU上的移植，利用多核系统的特性加速DFT计算等。随着计算资源的进一步丰富，计算能力的飞速提高，材料科学的高性能计算应用也将获得巨大进步。

内容来源：王涛《材料科学中的高性能计算》

原创文章，作者：菜菜欧尼酱，如若转载，请注明来源华算科技，注明出处：https://www.v-suan.com/index.php/2023/11/24/0c37f6a724/

3分钟看懂材料科学中的高性能计算和常用计算软件

相关推荐

分享到：