运行错误记录
本章节整理了 MatPL
、Lammps
接口 运行时常见错误。
MatPL 常见运行时错误
环境变量检查
由于未正确加载或者未加载相关环境变量,导致的运行时错误,一般表现为找不到 MatPL
命令 或者 一些 ***.so
的动态库缺失。此时请检查下列环境变量是否都已经加载。
# python 环境,是否激活了python 环境
source /the/path/etc/profile.d/conda.sh
conda activate matpl-2025.3
# intel 和 cuda 工具集是否加载
module load intel/2020 cuda/11.8
# MatPL 的环境变量是否加载
source /the/path/MatPL-2025.3/env.sh
动态库加载错误-mkl库
错误描述
exec(code, run_globals)
File "/the/path/MatPL-2025.3/main.py", line 6, in <module>
from src.user.dp_work import dp_train, dp_test
File "/the/path/MatPL-2025.3/src/user/dp_work.py", line 6, in <module>
from src.PWMLFF.dp_network import dp_network
File "/the/path/MatPL-2025.3/src/PWMLFF/dp_network.py", line 42, in <module>
import src.pre_data.dp_mlff as dp_mlff
File "/the/path/MatPL-2025.3/src/pre_data/dp_mlff.py", line 11, in <module>
from src.lib.NeighConst import neighconst
ImportError: libmkl_rt.so: cannot open shared object file: No such file or directory
解决方法
没有加载 Intel Math Kernel Library (MKL),intel/2020 模块( Intel Parallel Studio XE 2020 或 Intel oneAPI Toolkits 2020 版本中的一个模块化软件) 通常包含 Intel MKL 库。加载这个模块时,MKL 库将可用于你的编译和运行环境中。
module load intel/2020