硅体系案例(大模型采样)
硅体系案例(大模型采样)
本案例为硅体系的主动学习过程,采用了大模型(eqv2)和direct采样。在 PWact/examples/ 下准备了多种组合设置,每种组合的信息请参考PWact/examples/README.md。对于 Mcloud用户,请访问路径/share/public/PWMLFF_test_data/pwact_examples/25-pwact-demo即可。这里以[PWact/examples/si_pwmatgaussion_bigmodel_direct] 为例介绍 大模型和 direct 方法的参数设置、脚本设置。
对于 init_bulk 构造初始训练集,以examples/si_pwmatgaussion_bigmodel_direct/init_bulk_bigmodel为例:
- step1. 用 PWmat (gaussion 基组) 做relax;
- step2. 对结构调用大模型(seventnet)做分子动力学;
- step3. 对分子动力学得到的轨迹做 direct 采样,去掉轨迹中相似的结构,筛选出的结构用于后续主动学习
请注意,本目录中使用的是 gaussian 基组的 PWmat,仅用于快速测试,例子生成的数据不具有可靠性。
预训练数据制备 init_bulk
启动命令:
进入 examples/si_pwmatgaussion_bigmodel_direct/init_bulk_bigmodel 目录 ,这里提供了在 mcloud 上的执行脚本,也可以通过如下命令执行。
pwact init_bulk init_param.json resource.json
init_bulk 目录结构
init_bulk 目录与 si_pwmat 案例 相似,只是多了一项 bigmodel 目录,如下所示。
.
├── datapath.txt
├── init_config_0/
├── init_config_1/
└── bigmodel/
├── 0-bigmodel.job
├── 0-tag.bigmodel.success
├── 1-bigmodel.job
├── 1-tag.bigmodel.success
├── ...
├── direct/
│ ├── 0-direct.job
│ ├── 0-tag.direct.success
│ ├── candidate.json
│ ├── candidate.xyz
│ ├── Cov_score.png
│ ├── direct.py
│ ├── PCA_direct.png
│ ├── PCA_variance.png
│ ├── PWdata
│ ├── select_idx.dat
│ ├── select.xyz
│ └── tag.direct.success
├── init_config_0/
│ ├── 0.95_scale/
│ │ ├── 3_bigmodel/
│ │ │ ├── npt.log
│ │ │ ├── POSCAR
│ │ │ ├── sevennet_md.py
│ │ │ ├── tag.bigmodel.success
│ │ │ ├── tmp.traj
│ │ │ └── traj.xyz
│ │ ├── 4_bigmodel/
│ │ └── 5_bigmodel/
│ ├── 0.9_scale/
│ └── 1.0_scale/
└── init_config_*/
*-bigmodel.job和*-tag.bigmodel.success为 大模型运行 MD 的slurm脚本和执行成功的 tag 标记文件init_config_0、init_config_1、... 目录为执行大模型 MD 的工作目录direct目录为执行direct方法筛选结构的工作目录