Molecure Ethylene carbonate system
下文将以 C3H4O3 孤立体系为例,介绍如何使用 PWMLFF Neural Network Model 进行训练,以及如何使用训练好的模型进行预测。该例位于源码/example/EC
整个程序运行逻辑大致分为:
1. 产生数据集
以 PWmat AIMD 模拟得到的 C3H4O3 数据为例,数据文件为MOVEMENT
,包含 200 个结构,每个结构包含 10 个原子。
etot.input输入文件示例:
8 1
JOB = MD
MD_DETAIL = 2 200 1 400 400
XCFUNCTIONAL = PBE
Ecut = 60
ECUT2 = 240
MP_N123 = 1 1 1 0 0 0 3
ENERGY_DECOMP = T
OUT.STRESS = F
IN.ATOM = atom.config
IN.PSP1 = C.SG15.PBE.UPF
IN.PSP2 = H.SG15.PBE.UPF
IN.PSP3 = O.SG15.PBE.UPF
- 可选项
ENERGY_DECOMP
:是否将总 DFT 能量分解为属于每个原子的能量(原子能量)。结果输出在MOVEMENT
文件中。如需使用或训练原子能量,需要将其设置为T
。 - 可选项
OUT.STRESS
:是否输出应力信息,如需训练Virial
,则需要将其设置为T
。 - 其他参数含义参考PWmat manual。
2. 训练过程
2.1 提取特征
新建目录,放置MOVEMENT*
文件。或者MOVEMENT*
文件也可以放置在其他目录下,只需要通过修改输入文件*.json
中的 raw_files
参数(或者train_movement_file
,为NN 2024.5前的版本
参数) 路径进行训练。
2.2 训练输入文件
当前目录下,新建*.json
文件(如train.json
),该文件包含一系列需要传入的参数。
输入文件示例 (输入文件其他参数说明):
{
"raw_files":["./EC_MOVEMENT"],
"model_type": "NN",
"atom_type":[8,6,1]
}
raw_files
:MOVEMENT
文件存放名。可以设置同时多个文件。请根据实际情况进行修改。2024.5前的版本
该参数为train_movement_file
,新版本兼容该参数。model_type
:模型类型,现在训练所使用的模型。其他模型类型的训练及参数配置参考参数细节。atom_type
:原子类型,8, 6 和 1 分别为 O, C 和 H 的原子序数.
2.3 运行
以下 slurm 示例脚本适用于 Mcloud,提交任务时确保已经加载必要的环境和模块。
#!/bin/sh
#SBATCH --partition=3080ti
#SBATCH --job-name=mlff
#SBATCH --nodes=1
#SBATCH --ntasks-per-node=1
#SBATCH --gres=gpu:1
#SBATCH --gpus-per-task=1
# mcloud 已安装环境加载
source /share/app/anaconda3/etc/profile.d/conda.sh
module load conda/3-2020.07
conda deactivate
conda activate PWMLFF
module load pwmlff/2024.5
PWMLFF train train.json > log
交互式运行:
$ srun -p 3080ti --gres=gpu:1 --pty /bin/bash
# mcloud 已安装环境加载
$ source /share/app/anaconda3/etc/profile.d/conda.sh
$ module load conda/3-2020.07
$ conda deactivate
$ conda activate PWMLFF
$ module load pwmlff/2024.5
$ PWMLFF train train.json
产生feature与train可以单独运行:
PWMLFF gen_feat train.json
- 仅用于产生特征。PWMLFF train train.json
- 用于加载特征,对特征进行处理后开始训练。直接运行train
会自动调用gen_feat
。如果gen_feat
已经运行过,可以在.json
文件中设置train_feature_path
来指定feature所在路径,同时注释掉raw_files
(2024.5前的版本
该参数为train_movement_file
)。
程序运行后,会在程序执行目录下生成forcefield
和model_record
目录:
EC_system/
└── dir
├── forcefield
│ ├── forcefield.ff
│ ├── fread_dfeat
│ │ ├── data_scaler.txt
│ │ ├── feat.info
│ │ ├── vdw_fitB.ntype
│ │ └── Wij.txt
│ ├── input
│ │ ├── (egroup.in) # 仅对MOVEMENT中存在ATOMIC ENERGY时起作用
│ │ └── *feature.in
│ └── (output)
│ └── grid* # feature 1, 2时使用
│
└── model_record
│ ├── epoch_train.dat # 每个 epoch 的训练误差
│ ├── epoch_valid.dat # 每个 epoch 的验证误差
│ ├── iter_train.dat # 每个 batch 的训练误差
│ ├── iter_valid.dat # 每个 batch 的验证误差
│ ├── nn_model.ckpt # 模型文件
│ └── scaler.pkl # extracting scaler values of the model
loss
对应训练总误差RMSE_Etot
对应训练能量误差RMSE_F
对应训练力误差
3. 验证/测试
训练完成后,可以对模型进行验证/测试,以确定模型的拟合效果。
新建目录(如MD
),将另一个的MOVEMENT
文件复制到该目录中。同时在.json
文件中设置raw_files
(2024.5前的版本
该参数为test_movement_file
,新版本兼容该参数),test_dir_name
参数以及添加model_load_file
参数。
相关输入示例:
"raw_files":["./MD/MOVEMENT"],
"test_dir_name":"test_dir",
"model_load_file":"./model_record/nn_model.ckpt",
验证程序运行示例:
将PWMLFF train train.json中的train
修改为test
:
PWMLFF test train.json
程序运行完成后,验证结果保存在test_dir_name
设置的test_dir/
目录下