Parameter details
本节介绍了所有模型中可由用户定义的参数,可以分为必要参数和高级参数两类。必要参数需要用户指定,高级参数采用了默认值,用户可以在 json 文件中根据需求手动修改。在下面的参数中,"相对路径(relative path)" 表示相对于当前工作目录的路径,而 "绝对路径(absolute path)" 表示从根目录开始的文件或目录的完整路径。
必要参数
对于任何模型,以下参数需要用户输入。
model_type
该参数用于指定用于训练的模型类型。您可以使用LINEAR
模型、NN
模型、DP
模型或 NEP
模型。
atom_type
该参数用于设置训练体系的元素类型。用户可以按照任意顺序指定元素的原子序数。例如,对于单元素系统如铜,可以设置为 [29],而对于多元素系统如 CH4,则可以设置为 [1, 6]。您也可以使用元素类型的名称,例如["Cu"] 或者 ["H", "C"]。
max_neigh_num
最大邻居数,其默认值为100
。然而,对于某些系统来说,这个值可能不足以容纳所有的邻居,导致特征生成失败。在这种情况下,将会弹出以下警告信息:
Error! maxNeighborNum too small
在该情况下,请调大该值。
raw_files
该参数用于指定训练任务的分子动力学轨迹文件所在的路径。您可以使用相对路径或绝对路径。
- 对于 DP 和 NEP 模型,支持的文件格式有 PWmat, VASP, CP2K (对应
format
参数为pwmat/movement
,vasp/outcar
,cp2k/md
) - 对于 LINEAR 和 NN 模型,仅支持
pwmat/movement
格式
format
该与 raw_files
配合使用,参数用于指定原始轨迹文件的格式,默认值为 pwmat/movement
。 PWmat, VASP, CP2K 对应 format
参数分别为 pwmat/movement
, vasp/outcar
, cp2k/md
。
datasets_path
该参数用于 DP 和 NEP 模型,用于指定 pwmlff/npy
格式的数据所在路径。对于 DP 和 NEP 模型,如果指定了raw_files
,在训练或者测试中会把raw_files
中的轨迹自动转换为pwmlff/npy
格式。转换工具为 PWDATA
。
train_movement_file
该参数在PWMLFF-2025.5之前的版本
中,用于 LINEAR 和 NN 模型做训练,提供 movement 文件路径。当前版本(2024.5)已经修改为raw_files
,并且兼容该参数,即您可以使用train_movement_file
或者 raw_files
皆可。
test_movement_file
该参数在PWMLFF-2025.5之前的版本
中,用于 LINEAR 和 NN 模型做测试,提供 movement 文件路径。当前版本(2024.5)已经修改为raw_files
,并且兼容该参数,即您可以使用test_movement_file
或者 raw_files
皆可。
model_load_file
该参数用于指定用于测试
任务的模型所在的路径。
高级参数
用户只需要设置必要参数即可完成模型的训练、测试和相关分子动力学过程。相应的高级参数,如模型超参数和优化器超参数,将被设置为默认值。这些高级参数也可以在 json 文件中进行设置。
train_valid_ratio
该参数指定 训练集与验证集的比例。例如,0.8 表示将 MOVEMENT 中前 80% 的 images 作为训练集,剩余的 20% 作为验证集。默认值为 0.8
。
recover_train
该参数用于从中断的 DP 或 NN 训练任务中恢复训练。默认值为 true
work_dir
该参数用于设置执行训练、测试和其他任务的工作目录。它可以设置为绝对路径或相对路径。默认值是相对路径./work_dir
。
reserve_work_dir
该参数用于指定在任务执行完成后是否保留工作目录 work_dir
。默认值为 False
,意味着在执行完成后该目录将被删除。
- 注意,
work_dir
,reserve_work_dir
,train_movement_file
和test_movement_file
参数仅用于 LINEAR 和 NN 模型。并且 LINEAR 和 NN 模型仅支持 movement 文件格式。train_movement_file
和test_movement_file
参数在PWMLFF-2024.5 版本
中,已经被raw_files
替换,同时也兼容该参数。
type_embedding
"model_type"="DP"
时,在model
参数中设置"type_embedding":true
表示用 type embedding 训练 DP 模型,默认值为false
。
model 参数
完整的 DP
模型包括 描述符(descriptor)
、拟合网络(fitting_net)
和 type_embedding
三个部分;NN
不包含type_embedding
; 对于 Linear
模型,则不需要指定拟合网络和优化器。对于 NEP
模型参数需要单独设置。
Linear model
Linear 模型的完整参数设置如下:
"model": {
"descriptor": {
"Rmax": 6.0,
"Rmin": 0.5,
"feature_type": [3,4]
}
}
Rmax
特征的最大截断半径。默认值为 。
Rmin
特征的最小截断半径。默认值为 。
eature_type
该参数用于特征类型,与NN 模型
中的设置相同。支持的选项有[1, 2]、[3, 4]、[5]、[6]、[7]和[8]。默认值为[3, 4],即 2-b 和 3-b 高斯特征。有关不同特征类型的更详细信息,请参考附录1。