레시피 설정¶
included_transformers
¶
Include Specific Transformers
실험에 사용할 transformer(s) 를 선택합니다. Check All/Uncheck All 버튼을 사용하면 빠르게 한 번에 모든 트랜스포머를 추가하거나 삭제할 수 있습니다. Note: 모든 트랜스포머의 선택을 취소하여 선택된 트랜스포머가 없는 경우 Driverless AI는 이를 무시하고 해당 실험의 기본 트랜스포머 목록을 사용합니다. 이 트랜스포머 목록은 각 실험마다 다릅니다.
등가 config.toml 매개변수는 included_transformers
입니다.
included_models
¶
Include Specific Models
실험에서 Driverless AI가 구축하는 모델 유형을 지정합니다. 이 목록에는 사용자 정의 레시피와 함께 추가되는 기본 지원 알고리즘 및 레시피가 포함됩니다.
Note: ImbalancedLightGBM 및 ImbalancedXGBoostGBM 모델은 imbalance_sampling_method 옵션과 밀접하게 연결되어 있습니다. 구체적인 내용은 다음과 같습니다.
ImbalancedLightGBM 및/또는 ImbalancedXGBoostGBM 모델이 활성화 상태이고 imbalance_sampling_method 가 활성화 상태인 경우( off 이외의 값으로 설정된 경우), Driverless AI는 대상 불균형 비율을 확인합니다. 대상 비율이 허용된 불균형 한계를 초과하는 것으로 나타나면 샘플링이 트리거됩니다.
ImbalancedLightGBM 및/또는 ImbalancedXGBoostGBM 모델이 비활성화 상태이고 imbalance_sampling_method 옵션이 활성화 상태인 경우, 특정한 샘플링 기법을 수행하지 않습니다.
ImbalancedLightGBM 및/또는 ImbalancedXGBoostGBM 모델이 활성화되어 있고 imbalance_sampling_method 가 비활성화된 경우, 샘플링을 사용하지 않으며 이 불균형 모델이 비활성화됩니다.
included_scorers
¶
Include Specific Scorers
실험을 실행할 때 Driverless AI에 포함시킬 scorer를 지정합니다.
included_pretransformers
¶
Include Specific Preprocessing Transformers
다른 트랜스포머가 활성화되기 전에 전처리에 사용할 트랜스포머 를 지정합니다. 전처리 트랜스포머는 원래 기능을 사용해 일반 트랜스포머 계층에서 사용하는 임의 기능을 출력할 수 있습니다.
Notes:
전처리 트랜스포머 및 기타 모든 트랜스포머 레이어는 Python 및 MOJO 스코어링 패키지(해당되는 경우)에 포함되어 있습니다.
어떤 custom transformer recipe 든지 또는 Native DAI 트랜스포머를 전처리 트랜스포머로 사용할 수 있습니다. 예를 들어, 전처리 트랜스포머는 다음 레이어의 Date 및 DateTime 변환이 수행되기 전에 전처리 단계로 상호 작용, 문자열 연결 또는 날짜 추출을 수행할 수 있습니다.
- 경고:
아직 만들어지지 않은 time_column에 대해서는 현재 time series 실험을 할 수 없습니다(실험 설정은 변환된 것이 아니라 원본 데이터에 대해서만 알고 있음). 단, 런타임 데이터 레시피를 사용하여 부동 날짜-시간을 문자열 날짜-시간으로 변환할 수 있으며(예시), 이는 Driverless AI의 Date 및 DateTime 트랜스포머와 time series의 자동 감지에 사용됩니다.
GUI/클라이언트 자동 선택 그룹, 기간 등을 사용하여 time series 실험을 수행하려면, 데이터 세트에 사용자 또는 일회성 data recipe 를 통해 실험 전에 준비된 시간 열과 그룹이 있어야 합니다.
동일한 config.toml 매개변수는 included_pretransformers
입니다.
num_pipeline_layers
¶
Number of Pipeline Layers
파이프라인 레이어의 수를 지정합니다. 이 값의 기본값은 1입니다. 동일한 config.toml 매개변수는 num_pipeline_layers
입니다.
Note: 여기에는 included_pretransformers 상세 설정에서 지정한 전처리 레이어가 포함되지 않습니다.
included_datas
¶
Include Specific Data Recipes During Experiment
실험 중에 특정 데이터 레시피를 포함시킬지 여부를 지정합니다. 별도의 데이터 준비 단계가 필요하지 않도록 하고, 실험 및 Python Scoring 패키지 내에서 데이터 준비를 구축합니다. 단, Mojo는 예측 전에 적용할 데이터를 준비해야 합니다.
동일한 config.toml 매개변수는 included_datas
입니다.
threshold_scorer
¶
Scorer to Optimize Threshold to Be Used in Other Confusion-Matrix Based Scorers (For Binary Classification)
Precision, Recall, FalsePositiveRate, FalseDiscoveryRate, FalseOmissionRate, TrueNegativeRate, FalseNegativeRate, NegativePredictiveValue 등의 관련 혼동 행렬 기반 scorer에 사용되는 바이너리 확률 임계값을 최적화하기 위해 사용할 scorer를 지정합니다.
Auto (기본값): 이 옵션을 사용하여 임계값 scorer를 실험에 사용된 scorer와 동기화합니다. 이것이 불가능한 경우 F1을 사용합니다.
F05 정밀도의 비중을 높이고, 재현율에 대한 비중을 줄입니다.
F1: 정밀도와 재현율에 동일한 비중을 적용합니다.
F2 정밀도의 비중을 줄이고 재현율에 대한 비중을 높입니다.
MCC: 모든 클래스가 동일하게 중요할 때 이 옵션을 사용합니다.
prob_add_genes
¶
Probability to Add Transformers
진(gene) 또는 특정 속성을 가진 트랜스포머의 인스턴스를 추가할 비정규화 확률(unnormalized probability)을 지정합니다. 진을 추가할 수 없는 경우 다른 뮤테이션(mutation)을 시도합니다. 이 값의 기본값은 0.5입니다.
prob_addbest_genes
¶
Probability to Add Best Shared Transformers
진 또는 모집단 내 다른 개인에게 유익한 것으로 나타난 특정 속성을 가진 트랜스포머의 인스턴스를 추가할 비정규화 확률을 지정합니다. 이 값의 기본값은 0.5입니다.
prob_prune_genes
¶
Probability to Prune Transformers
진 또는 특정 속성을 가진 트랜스포머의 인스턴스를 삭제할 비정규화 확률을 지정합니다. 이 값의 기본값은 0.5입니다.
prob_perturb_xgb
¶
Probability to Mutate Model Parameters
모델 하이퍼파라미터를 변경할 비정규화 확률을 지정합니다. 이 값의 기본값은 0.25입니다.
prob_prune_by_features
¶
Probability to Prune Weak Features
진/트랜스포머의 전체 인스턴스를 삭제하는 대신 변수 중요도가 낮은 기능을 삭제하는 비정규화 확률을 지정합니다. 이 값의 기본값은 0.25입니다.
skip_transformer_failures
¶
Whether to Skip Failures of Transformers
실패한 트랜스포머를 무시할지 여부를 지정합니다. 이는 기본적으로 활성화되어 있습니다.
skip_model_failures
¶
Whether to Skip Failures of Models
실패한 모델을 무시할지 여부를 지정합니다. 건너뛴 실패 로깅에 대해 지정된 레벨에 따라 실패가 기록됩니다. 이는 기본적으로 활성화되어 있습니다.
detailed_skip_failure_messages_level
¶
Level to Log for Skipped Failures
건너뛴 트랜스포머 또는 모델에 대한 로그 실패 메시지의 상세 정도에 대해 다음 레벨 중 하나를 지정합니다.
0 = 간단한 메시지 기록
1 = 코드 라인과 메시지 기록(기본값)
2 = 자세한 스택 추적 기록
notify_failures
¶
Whether to Notify About Failures of Transformers or Models or Other Recipe Failures
레시피 오류에 대한 알림을 GUI에 표시할지 지정합니다. 이는 기본적으로 활성화되어 있습니다.
동일한 config.toml 매개변수는 notify_failures
입니다.
acceptance_test_timeout
¶
Timeout in Minutes for Testing Acceptance of Each Recipe
레시피 수락 테스트가 중단될 때까지 대기할 시간(분)을 지정합니다. 수락 테스트가 활성화되고 시간이 초과되면 레시피가 거부됩니다. 이 값의 기본값은 20.0입니다.