第一性原理计算中的结构优化：从入门经验到实战策略

April 14, 2026

Published in 计算科学

Abstract

结构优化（structure optimization 或 structure relaxation）是第一性原理计算中最基础、也最容易"算了很久却不一定算对"的环节。它的目标是通过调整原子坐标、晶格形状或晶胞体积，使体系到达一个能量更低、受力更小的稳定构型。对于 VASP 而言，优化的自由度主要由 ISIF 控制，优化算法主要由 IBRION 控制，而是否收敛通常由 EDIFFG 等参数判断。

Keywords: 第一性原理计算, VASP, 结构优化, 计算材料科学, DFT

很多初学者把结构优化理解成"让程序自动跑到最低能量"，但在实际计算中，程序通常只能从给定初始结构出发，找到离它最近的局域极小值，而不是保证找到全局最小结构。也正因如此，结构优化的结果往往依赖于初始构型、磁性设定、K 点密度、优化路径甚至人为施加的对称性破缺方式。

什么是结构优化

结构优化就是在 0 K 的电子基态框架下，通过反复电子自洽与离子步更新，使体系的总能量下降、原子受力减小，最终得到一个稳定或亚稳的结构。它不同于分子动力学：分子动力学描述的是随时间演化的运动轨迹，而结构优化更接近于"顺着力把原子推到势能谷底"。

在具体任务上，结构优化可以分成几类：

只优化原子位置；
只优化晶格常数或晶胞体积；
同时优化晶格和原子位置；
分步优化，例如先定胞优化原子，再放开晶胞继续优化。

VASP 中这些自由度由 ISIF 选择：它决定是否优化原子位置、晶胞形状和体积；如果还需要冻结部分原子，则可结合 POSCAR 中的 selective dynamics 一起使用。

为什么结构优化如此重要

结构优化几乎是一切后续计算的基础。无论你是要算吸附能、缺陷形成能、能带、态密度、弹性性质，还是过渡态与反应路径，前提通常都是先得到一个可信的几何结构。特别是缺陷、掺杂、吸附和表面反应问题，如果不先优化结构，很多电子结构结论会失去物理意义。

但"优化完成"并不等于"结果可信"。一个看似收敛的结构，可能只是停在了某个错误的局域极小值；也可能总能已经稳定，但力还没有真正收敛；还可能在 Gamma 点优化时看上去没问题，换更密的 K 点静态计算后却暴露出明显残余力。这些都是结构优化中最常见、也最容易被忽视的问题。

结构优化的核心参数

在 VASP 中，结构优化最核心的几个参数是 IBRION、ISIF、NSW、EDIFF 和 EDIFFG。这些参数分别对应"怎么动原子""允许哪些自由度变化""最多走多少离子步""电子步何时收敛""离子优化何时停止"。

`IBRION`：选择优化算法

IBRION 决定离子更新方式，常见选择有：

IBRION = 1：RMM-DIIS / quasi-Newton 类方法，速度快，适合已经比较接近平衡结构的情况
IBRION = 2：共轭梯度（CG），更稳健，通常是最通用的默认选择
IBRION = 3：阻尼分子动力学，适合某些较难优化的初始结构
IBRION = -1：不移动离子，用于静态单点计算，不应与 NSW > 0 混用

从经验上说，如果初始结构离目标结构较远，IBRION = 2 往往更可靠；如果已经比较接近极小值，IBRION = 1 会更快。也可以采用分阶段策略：先用 IBRION = 2 粗优化，再切换到 IBRION = 1 做精修。

`ISIF`：控制优化自由度

ISIF 决定结构优化中哪些自由度被放开。它不仅影响是否计算应力张量，也影响是否优化原子位置、晶胞形状和体积。

常见做法包括：

表面、缺陷、分子吸附体系：常用 ISIF = 2，只优化原子位置，不改晶胞；
体材料体相结构：常用 ISIF = 3，同时优化原子和晶胞；
某些更复杂情况：先 ISIF = 2，后 ISIF = 3，分阶段提高稳定性。

一般来说，自由度越多，优化越难收敛。因此在不需要变胞的情况下，不要轻易放开晶胞自由度。

`NSW`：最大离子步数

NSW 控制离子弛豫的最大步数。它只是"最多允许走多少步"，不是"必须走这么多步"。如果在达到 NSW 之前满足收敛条件，计算会自动停止。

经验上：

正常优化常设为 50–100；
初步粗优化可设得更小，如 20–60；
如果一个结构长期不收敛，盲目把 NSW 设到 500 或更大通常不是好主意，往往说明初始结构或参数本身有问题。

`EDIFF` 与 `EDIFFG`：电子步与离子步收敛标准

EDIFF 控制电子自洽（SCF）的收敛精度；EDIFFG 控制离子优化的停止条件。

其中 EDIFFG 的物理含义尤其重要：

EDIFFG > 0：按相邻离子步的总能变化判断是否停止；
EDIFFG < 0：按所有原子受力是否都小于 |EDIFFG| 判断是否停止，这通常更常用，也更有物理意义

例如：

EDIFFG = -0.02 表示当所有原子的力都小于 0.02 eV/Å 时停止；
EDIFFG = -0.05 是较常见的中等精度优化标准；
EDIFFG = -0.1 或更松，只适合非常初步的粗优化阶段。

对于绝大多数结构优化问题，我更倾向于以力为判据而不是仅以能量为判据，因为力往往比能量更敏感，也更能反映几何结构是否真正稳定。

为什么"力收敛"比"能量收敛"更关键

很多计算中，总能量看似已经稳定，但原子受力仍然不小。这并不矛盾，因为力本质上是能量对坐标的一阶导数，数值噪声和积分误差会被进一步放大，所以力的收敛通常比能量更苛刻。

这在超胞、表面、缺陷和吸附体系中尤其明显。例如一个结构在 Gamma 点优化后已经满足 EDIFFG = -0.02，但如果用更密的 K 点重新做静态计算，有时仍会发现某些敏感原子的力偏大。这时不能简单地说"优化已经完成"，而应考虑提高 K 点密度继续优化，直到更严格的静态条件下力也足够小。

因此，如果你的研究问题对几何结构很敏感——例如催化反应、分子吸附、缺陷局域、相变路径——那么"力是否真的收敛"往往比"总能是否变化很小"更值得关注。

初始结构决定优化质量

结构优化最重要的前提不是 INCAR 写得多漂亮，而是初始结构要合理。VASP 官方也明确指出：优化器通常要求起始结构已经离某个极小值"足够近"，否则算法会变得困难，甚至失效。

初始原子位置要有物理依据

对于吸附、掺杂、空位、小分子在表面上的构型，初始设置不能完全拍脑袋。典型经验包括：

参考已知键长、配位环境和实验结构；
参考类似体系文献中的吸附位点与取向；
对小分子吸附同时测试水平、垂直、倾斜等多种初始姿态；
避免原子离得过近导致强排斥，也避免离得过远导致相互作用太弱、收敛很慢。

例如 CO 吸附在表面 O 顶位时，可以参考 CO₂ 中 C–O 键长并做适度调整，而不是随意放一个位置。很多失败的优化，并不是算法不行，而是一开始模型就不合理。

磁性、电荷、对称性也属于初始结构的一部分

初始结构不只是几何坐标，还包括：

自旋极化是否打开；
初始磁矩如何设置；
是否引入对称性破缺；
是否施加选择性冻结；
是否考虑缺陷诱导的局域电子态。

对于过渡金属氧化物、空位体系、局域电子相关明显的体系，这些因素会显著影响优化终态。一个过强的对称性约束，可能把体系"锁"在错误的局域极小值里；适当打破对称性，反而更容易得到正确的局域结构。

分阶段优化是最实用的策略

在实际工作中，一步到位做"高精度全参数优化"通常既慢又不稳。更有效的办法往往是分阶段优化：先粗后细，先稳后准。

一个比较实用的流程可以写成：

第一阶段：粗优化

适用于初始结构离平衡态较远时，例如新搭的表面吸附模型、缺陷模型、掺杂模型。

建议特征：

较松的电子收敛：如 EDIFF = 1E-3
较松的力收敛：如 EDIFFG = -0.2 ~ -0.3
较少的离子步：如 NSW = 30 ~ 60
较粗的 K 点，甚至 Gamma-only
暂时不考虑复杂磁序、DFT+U 等细节（前提是问题允许）

这样做的目的不是得到最终结构，而是让体系快速从明显不合理的区域回到"正常的势能面附近"。

第二阶段：常规优化

当结构已经比较合理之后，再进入正常精度优化。

常见设置思路：

EDIFF = 1E-4
EDIFFG = -0.05 或更严格
IBRION = 2
NSW = 80 ~ 100
使用更合适的 K 点密度
对该考虑的自旋、U、展宽方式逐步补上

这一阶段的目标是得到可靠的平衡构型。

第三阶段：精修

当体系已经接近稳定后，可以用更快但对起点更敏感的方法精修，例如：

切换 IBRION = 1
适当减小步长参数
使用更严格的力收敛标准
提高 K 点密度
对关键结构做更高精度静态校验

这种"粗调—细调—精修"的方式，通常比单次高精度硬跑更节省时间，也更稳妥。

优化路径依赖：为什么不同初始构型会得到不同结果

理论上，我们总希望结构优化找到最低能量结构；但实际数值计算面对的是复杂多维势能面，局域极小值往往很多。不同的初始构型、不同的约束方式、不同的优化参数，都可能把体系引向不同终点。

这在以下问题中特别明显：

小分子吸附在表面上，水平放置和垂直放置可能收敛到不同构型；
缺陷附近局域电子是否落在某几个原子上，可能受初始对称性影响；
具有多种磁序的材料，不同 MAGMOM 初值可能收敛到不同磁态；
表面重构、空位重排、极化畸变等问题，对优化路径很敏感。

因此，一个可靠的研究不应只依赖单一初始结构，而应对多个合理起点分别优化，然后比较总能、局域结构和物理性质。否则你得到的很可能只是"某个局部答案"，而不是问题真正关心的稳定构型。

粗优化时不要让体系"跑飞"

在实践中，最危险的一种设置是：电子收敛要求很松、离子力收敛却不算很松，而且 NSW 还设得特别大。这样体系可能在一个数值上并不可靠的势能面上走很远，最终偏离你原本关心的物理构型。

更稳妥的原则是：

如果 EDIFF 很松，那么 EDIFFG 也应相对放松；
初步粗优化时 NSW 不宜太大；
先走少量几何步，检查轨迹是否合理，再决定是否继续。

也就是说，粗优化的目标是"快速把结构拉回合理区域"，而不是"在低精度条件下跑到天荒地老"。

优化过程中要学会"看中间结果"

结构优化不是提交作业后完全不管。真正高效的做法，是在计算过程中不断检查结构演化是否符合预期。

建议重点观察：

原子是否出现不合理靠近或飞散；
吸附分子是否跑到不相关位点；
表面是否发生非预期的大重构；
局域几何是否朝着你理解的物理图像发展；
后几步中最大力是否在稳定下降。

对于表面吸附、反应中间体和缺陷重排问题，查看 XDATCAR 或中间结构序列尤其重要。很多"错误结果"其实在前几步就已经能看出来，只是没有及时检查，最后浪费了大量机时。

目的导向的结构优化：不是"自动求解"，而是"带着物理图像去引导"

到了更高层次，结构优化不再只是数值技术问题，而是物理建模问题。为了验证某个猜想、诱导某种局域态、获得某个特定构型，你往往需要主动设计初始模型，并谨慎调整参数，让优化朝着物理上更合理的方向演化。

例如在空位、极化、强关联体系中，适当打破局部对称性，可能比机械地从高对称结构直接优化更能得到真实的局域结果。某些情况下，DFT+U 参数、初始磁矩、局部扰动方式甚至优化步长，都会影响最终构型。

这说明一件事：结构优化并不是"软件自动替你思考"。越复杂的问题，越需要研究者先有清晰的物理图像，再据此设计模型与优化路径。

过渡态与 NEB 中的"结构优化"其实更讲究

过渡态搜索和 NEB 计算本质上也是结构优化，只不过优化对象不再是单个结构，而是一串图像沿着反应路径共同演化。此时，优化的重点不是让体系掉进某个局域极小值，而是找到连接初态与终态的最小能量路径以及鞍点。

做 NEB 时，关于结构优化有几个要点：

初态（IS）和终态（FS）都应先各自充分优化；
插值后要检查中间路径是否合理；
NEB 收敛通常应以力为判据，而不是能量；
初始 NEB 可以先用较粗糙参数快速试跑，再逐步提高精度；
如果路径不合理，增加精度往往也无济于事，应先回头修改模型。

VTST 文档与教程也都强调，NEB/CI-NEB 更关注图像上的受力是否收敛，必要时需要增加中间 images，以获得更合理的最小能量路径。

给初学者的结构优化建议

最后，把前面的经验压缩成几条最实用的建议：

不要迷信"一次优化跑到底"，先粗后细通常更好。
不要只看总能，要重点看最大力和最终结构。
不要只做一个初始构型，尤其是吸附、缺陷和磁性体系。
不要让程序闷头跑几百步而不检查中间结果。
不要在不必要时放开晶胞自由度。
不要把"收敛"直接等同于"正确"。
如果结果对研究结论很关键，就要做更严格的 K 点、ENCUT 和力收敛校验。

结语

结构优化看起来只是 VASP 流程中的一个前处理步骤，但它实际上决定了后续几乎所有物理结论的可信度。一个好的结构优化，不只是参数设置得对，更重要的是你是否理解了体系的物理图像、是否提供了合理的初始模型、是否知道什么时候该放松、什么时候该收紧，以及是否有意识地检查优化路径。

从这个意义上说，结构优化既是计算技术，也是研究判断力。初学时多看手册、多做测试、多检查中间结构，能让你很快从"会跑程序"进步到"会做计算"；而再往上走，则需要你把数值方法和物理理解真正结合起来。

参考资料

VASP 计算问题小结