kdb+ 设置

Driverless AI 让您能从 Driverless AI 应用程序内搜索 kdb+ 数据源。本节介绍如何配置 Driverless AI 与 kdb+ 配合使用。

请注意:根据您所安装的 Docker 版本,在启动 Driverless AI Docker 映像时,使用 docker run --runtime=nvidia (>= Docker 19.03) 或 nvidia-docker (< Docker 19.03) 命令。使用 docker version 检查所使用的 Docker 版本。

配置属性说明

  • kdb_user: (可选)用户名

  • kdb_password: (可选)用户密码

  • kdb_hostname: KDB 服务器的 IP 地址或主机

  • kdb_port: kdb+ 服务器侦听的端口

  • kdb_app_jvm_args: (可选)用于 kdb+ 分布的 JVM 参数(例如,-Dlog4j.configuration)。用空格分隔每个参数。

  • kdb_app_classpath: (可选)kdb+ 类路径(如果 jar 文件存储于其他位置,则为其他路径)。

  • enabled_file_systems: 您要启用的文件系统。为使数据连接器正常运行,必须进行此项配置。

示例 1:启用无身份验证的 kdb+

此示例启用了无身份验证的 kdb+ 连接器。唯一需要的标记是主机名和端口。

 nvidia-docker run \
   --pid=host \
   --init \
   --rm \
   --shm-size=256m \
   --add-host name.node:172.16.2.186 \
   -e DRIVERLESS_AI_ENABLED_FILE_SYSTEMS="file,kdb" \
   -e DRIVERLESS_AI_KDB_HOSTNAME="<ip_or_host_of_kdb_server>" \
   -e DRIVERLESS_AI_KDB_PORT="<kdb_server_port>" \
   -p 12345:12345 \
   -v /tmp/dtmp/:/tmp \
   -v /tmp/dlog/:/log \
   -v /tmp/dlicense/:/license \
   -v /tmp/ddata/:/data \
   -u $(id -u):$(id -g) \
   h2oai/dai-centos7-x86_64:1.10.1-cuda11.2.2.xx

示例 2:启用有身份验证的 kdb+

此示例为用户提供了从 Driverless AI 中访问 kdb+ 服务器的凭据。

 nvidia-docker run \
   --pid=host \
   --init \
   --rm \
   --shm-size=256m \
   -e DRIVERLESS_AI_ENABLED_FILE_SYSTEMS="file,kdb" \
   -e DRIVERLESS_AI_KDB_HOSTNAME="<ip_or_host_of_kdb_server>" \
   -e DRIVERLESS_AI_KDB_PORT="<kdb_server_port>" \
   -e DRIVERLESS_AI_KDB_USER="<username>" \
   -e DRIVERLESS_AI_KDB_PASSWORD="<password>" \
   -p 12345:12345 \
   -v /tmp/dtmp/:/tmp \
   -v /tmp/dlog/:/log \
   -v /tmp/dlicense/:/license \
   -v /tmp/ddata/:/data \
   -u $(id -u):$(id -g) \
   h2oai/dai-centos7-x86_64:1.10.1-cuda11.2.2.xx

使用 kdb+ 添加数据集

启用 kdb+ 连接器后,您可以通过从 添加数据集(或拖放) 下拉菜单中选择 kdb+ 来添加数据集。

Add Dataset

指定以下信息以添加数据集。

  1. 输入文件路径以保存查询 。输入用于存储数据集的本地文件路径。例如,/home/<user>/myfile.csv 。请注意,仅支持 CSV 文件。

  2. 输入 KDB 查询 。输入您想要执行的 kdb+ 查询。请注意,此连接器将接受任何 `q 查询<https://code.kx.com/q/tutorials/startingq/language/>`__ 。例如, <mytable><mytable> lj <myothertable> 中选择

  3. 完成后,选择 单击以执行查询 按钮以添加数据集。

Add dataset