Linux TAR SH

Driverless AI 软件可作为自解压 TAR SH 存档在纯用户模式的环境中使用。此安装形式不要求是特权用户才可安装或运行。

此工件具有与 RPM 和 DEB 软件包(组合)相同的兼容性矩阵,只是打包方式略有不同。请参见相应章节的内容,获取受支持环境的完整列表。

这些安装步骤假设您已有 Driverless AI 的有效许可证密钥。请访问 https://www.h2o.ai/products/h2o-driverless-ai/,了解如何获取 Driverless AI 许可证密钥。获取密钥后,首次登录时系统将提示您将许可证密钥粘贴至 Driverless AI UI 中。

注解

为确保在本机安装上正确生成 AutoDoc 管道可视化,推荐安装 fontconfig

要求

  • RedHat 7 或 Ubuntu 16.04

  • 推荐 NVIDIA 驱动器 >= 471.68 (仅 GPU)

  • OpenCL(需要在 GPU 驱动系统上完全支持 LightGBM)

  • Driverless AI TAR SH,可从 https://www.h2o.ai/download/ 获取

请注意 :Driverless AI 软件包中包括 CUDA 11.2.2(适用于 GPU)、cuDNN(在 GPU 上支持 TensorFlow 时需要)。

安装 OpenCL

在 GPU 驱动系统上完全支持 LightGBM 时需要 OpenCL。要安装 OpenCL,以 root 用户身份运行以下命令:

mkdir -p /etc/OpenCL/vendors && echo "libnvidia-opencl.so.1" > /etc/OpenCL/vendors/nvidia.icd && chmod a+r /etc/OpenCL/vendors/nvidia.icd && chmod a+x /etc/OpenCL/vendors/ && chmod a+x /etc/OpenCL

注解

如果没有安装 OpenCL,则自动使用 CUDA LightGBM。仅 Pascal 驱动(及更高)系统支持 CUDA LightGBM,可使用 enable_lightgbm_cuda_support config.toml 设置手动将其启用。

安装 Driverless AI

运行以下命令以安装 Driverless AI TAR SH。

 # Install Driverless AI.
 chmod 755 dai-1.10.1.2-linux-x86_64.sh
 ./dai-1.10.1.2-linux-x86_64.sh

现在,您可以将目录更改为已解压的目录并可更改 config.toml

启动 Driverless AI

# Start Driverless AI.
./run-dai.sh

启动 NVIDIA 持久模式

如果您使用 NVIDIA GPU,则必须运行以下 NVIDIA 命令。每次重启时均需运行此命令。更多信息,请参阅:http://docs.nvidia.com/deploy/driver-persistence/index.html

sudo nvidia-smi -pm 1

安装 OpenCL

需要 OpenCL 方可运行 GPU 版本的 LightGBM。对于使用 yum 和 x86 架构的 Centos7/RH7 系统,请运行以下命令。

yum -y clean all
yum -y makecache
yum -y update
wget http://dl.fedoraproject.org/pub/epel/7/x86_64/Packages/c/clinfo-2.1.17.02.09-1.el7.x86_64.rpm
wget http://dl.fedoraproject.org/pub/epel/7/x86_64/Packages/o/ocl-icd-2.2.12-1.el7.x86_64.rpm
rpm -if clinfo-2.1.17.02.09-1.el7.x86_64.rpm
rpm -if ocl-icd-2.2.12-1.el7.x86_64.rpm
clinfo

mkdir -p /etc/OpenCL/vendors && \
    echo "libnvidia-opencl.so.1" > /etc/OpenCL/vendors/nvidia.icd

查看 Driverless AI 日志文件

less log/dai.log
less log/h2o.log
less log/procsy.log
less log/vis-server.log

停止 Driverless AI

# Stop Driverless AI.
./kill-dai.sh

卸载 Driverless AI

若需卸载 Driverless AI,只需移除解压过程中创建的目录即可。默认情况下,Driverless AI 的所有文件均位于此目录中。

升级 Driverless AI

警告

  • 此版本不支持 1.7.0 及更低版本的实验和 MLI 模型。

  • 实验、MLI 和 MOJO 存储于 Driverless AI tmp 目录中,并且在 Driverless AI 升级时不会自动升级。我们建议您在升级前采取以下措施。

    • 升级前构建 MLI 模型

    • 升级前构建 MOJO 管道。

    • 升级前停止 Driverless AI 并备份 Driverless AI tmp 目录。

如果在升级 Driverless AI 前未在务必模型上构建 MLI,则升级后将不能在该模型上查看 MLI。升级前,请务必在您想要在未来版本中继续进行解释的模型上运行 MLI 作业。如果当前版本的解释模型列表中含有此 MLI 作业,则在升级后将保留。

如果在升级 Driverless AI 前未在模型上构建 MOJO 管道,则升级后将不能在该模型上构建 MOJO 管道。升级前,请务必在所需的全部模型上构建 MOJO 管道,然后备份 Driverless AI tmp 目录。

在升级过程中,将从 /etc/dai/User.conf and /etc/dai/Group.conf 继承服务用户与用户组权限。升级期间,您无需手动指定 DAI_USER 或 DAI_GROUP 环境变量。

要求

我们建议在您的主机环境中安装 NVIDIA 驱动程序 >= 471.68 (仅 GPU),以便在所有架构上获得无缝体验,包括 Ampere 架构。Driverless AI 自带 GPU 的 CUDA 11.2.2,但是主机环境中必须有驱动程序。

前往 NVIDIA download driver,获取最新的 NVIDIA Tesla A/T/V/P/K 系列驱动程序。关于 CUDA 工具包和驱动程序最低版本要求及 CUDA 工具包和相应的驱动程序版本的参考,请参见 here .

升级步骤

  1. 停止之前版本的 Driverless AI。

  2. 运行新版本 Driverless AI 的自解压存档。

  3. 将您之前对 config.toml 文件所做的任何更改均转移至新解压的目录。

  4. 将 tmp 目录(其中包含所有 Driverless AI 工作状态)从之前安装的 Driverless AI 版本中复制至新解压的目录。

  5. 启动新解压的 Driverless AI 版本。