S3 설정

Driverless AI를 사용해 Driverless AI 애플리케이션 내에서 S3 데이터 소스를 탐색할 수 있습니다. 이 섹션에서는 Driverless AI가 S3와 함께 작동하도록 구성하는 내용을 설명합니다.

Note: Docker 설치 버전에 따라, Driverless AI Docker 이미지를 시작할 때는 docker run --runtime=nvidia (Docker 19.03 이후) 또는 nvidia-docker (Docker 19.03 이전) 명령을 사용하십시오. 사용 중인 Docker 버전을 확인하려면 docker version 을 사용하십시오.

구성 속성에 관한 설명

  • aws_access_key_id: S3 액세스 키 ID

  • aws_secret_access_key: S3 액세스 키

  • aws_role_arn: Amazon 리소스 이름

  • aws_default_region: aws_s3_endpoint_url 옵션이 설정되지 않은 경우 사용할 영역. aws_s3_endpoint_url을 설정한 경우 이것은 무시됩니다.

  • aws_s3_endpoint_url: S3에 액세스하기 위해 사용할 엔드포인트 URL.

  • aws_use_ec2_role_credentials: True로 설정하는 경우, S3 커넥터가 EC2 인스턴스에 접속한 역할과 관련된 자격 증명을 얻으려고 시도합니다.

  • s3_init_path: UI S3 브라우저에 표시할 시작 S3 경로.

  • enabled_file_systems: 활성화할 파일 시스템. 데이터 커넥터를 제대로 작동시키려면 이 시스템을 구성해야 합니다.

예 1: 인증 없는 S3 활성화

이 예에서는 S3 데이터 커넥터를 활성화하고 인증을 비활성화합니다. S3 액세스 키나 암호를 전달하지 않고, S3 이름 노드의 이름과 IP를 전달하여 Docker DNS를 구성합니다. 이를 통해 사용자는 이름 노드 주소(예: s3://name.node/datasets/iris.csv)를 사용하여 S3에 저장된 데이터를 직접 참조할 수 있습니다.

 nvidia-docker run \
            --shm-size=256m \
            --add-host name.node:172.16.2.186 \
            -e DRIVERLESS_AI_ENABLED_FILE_SYSTEMS="file,s3" \
            -p 12345:12345 \
            --init -it --rm \
            -v /tmp/dtmp/:/tmp \
            -v /tmp/dlog/:/log \
            -v /tmp/dlicense/:/license \
            -v /tmp/ddata/:/data \
            -u $(id -u):$(id -g) \
            h2oai/dai-centos7-x86_64:1.10.1-cuda11.2.2.xx

예 2: 인증을 통한 S3 활성화

이 예에서는 S3 액세스 키 ID와 액세스 키를 전달하여 인증을 통해 S3 데이터 커넥터를 활성화합니다. 또한, S3 이름 노드의 이름과 IP를 전달하여 Docker DNS를 구성합니다. 이를 통해 사용자는 이름 노드 주소(예: s3://name.node/datasets/iris.csv)를 사용하여 S3에 저장된 데이터를 직접 참조할 수 있습니다.

      nvidia-docker run \
                     --shm-size=256m \
                     --add-host name.node:172.16.2.186 \
                     -e DRIVERLESS_AI_ENABLED_FILE_SYSTEMS="file,s3" \
                     -e DRIVERLESS_AI_AWS_ACCESS_KEY_ID="<access_key_id>" \
                     -e DRIVERLESS_AI_AWS_SECRET_ACCESS_KEY="<access_key>" \
                     -p 12345:12345 \
                     --init -it --rm \
                     -v /tmp/dtmp/:/tmp \
                     -v /tmp/dlog/:/log \
                     -v /tmp/dlicense/:/license \
                     -v /tmp/ddata/:/data \
                     -u $(id -u):$(id -g) \
                     h2oai/dai-centos7-x86_64:1.10.1-cuda11.2.2.xx