Explainer (레시피) 상세 설정¶
다음은 새로운 해석을 설정할 때 사용할 수 있는 Explainer별 상세 설정의 목록입니다. 이러한 설정은 recipes 탭 아래 MLI page 에서 해석을 실행할 때 액세스할 수 있습니다. 일반적인 MLI 상세 설정에 대한 정보는 해석 상세 설정 를 참조하십시오.
Absolute Permutation Feature Importance Explainer Settings¶
mli_sample_size
¶
Sample size
절대 Permutation Feature Importance explainer의 샘플 크기를 지정합니다. 이 값의 기본값은 100000입니다.
missing_values
¶
List of values that should be interpreted as missing values
데이터 가져오기 중 누락 값으로 해석되어야 하는 값 목록을 지정합니다. 이는 숫자 및 문자열 열 모두에 적용됩니다. 〈nan’은 항상 숫자 열에 대한 누락 값으로 해석됩니다.
예시: ""\"['', '?', 'None', 'nan', 'N/A', 'unknown', 'inf']\""
autodoc_feature_importance_num_perm
¶
Number of Permutations for Feature Importance
특성 중요도 계산 시, 특성 당 생성할 순열의 수를 지정하십시오. 기본값은 1입니다.
autodoc_feature_importance_scorer
¶
Feature Importance Scorer
기능 중요도 계산 시, 사용할 scorer의 명칭을 지정하십시오. 실험에 scorer를 사용하려는 경우, 해당 설정을 지정하지 않은 채 그대로 둡니다.
MLI AutoDoc Explainer Settings¶
autodoc_report_name
¶
AutoDoc Name
AutoDoc의 이름을 지정하십시오.
autodoc_template
¶
AutoDoc Template Location
AutoDoc 템플릿 경로를 지정하십시오. 사용자 정의 AutoDoc 템플릿의 전체 경로를 제공합니다. 표준 AutoDoc을 생성하려면, 해당 필드를 비워 둡니다.
autodoc_output_type
¶
AutoDoc File Output Type
AutoDoc 파일 출력 유형을 지정하십시오. docx
(기본값) 및 md
중에서 선택합니다.
autodoc_subtemplate_type
¶
AutoDoc Sub-Template Type
사용할 하위 템플릿 유형을 지정하십시오. 다음 중에서 선택하십시오.
auto(기본값)
md
docx
autodoc_max_cm_size
¶
Confusion Matrix Max Number of Classes
혼동 행렬의 최대 클래스 수를 지정하십시오. 기본값은 10입니다.
autodoc_num_features
¶
Number of Top Features to Document
문서에 표시할 주요 특성 수를 지정하십시오. 이 설정을 사용하지 않으려면 -1 을 지정하십시오. 기본값은 50입니다.
autodoc_min_relative_importance
¶
Minimum Relative Feature Importance Threshold
특성을 표시하려면 최소 상대 특성 중요도를 지정하십시오. 이 값은 float 0 이상 및 1 이하이어야 합니다. 기본값은 0.003입니다.
autodoc_include_permutation_feature_importance
¶
Permutation Feature Importance
순열 기반 특성 중요도의 계산 여부를 지정하십시오. 이것은 기본적으로 비활성화되어 있습니다.
autodoc_feature_importance_num_perm
¶
Number of Permutations for Feature Importance
특성 중요도 계산 시, 특성 당 생성할 순열의 수를 지정하십시오. 기본값은 1입니다.
autodoc_feature_importance_scorer
¶
Feature Importance Scorer
기능 중요도 계산 시, 사용할 scorer의 명칭을 지정하십시오. 실험에 scorer를 사용하려는 경우, 해당 설정을 지정하지 않은 채 그대로 둡니다.
autodoc_pd_max_rows
¶
PDP and Shapley Summary Plot Max Rows
AutoDoc에서 partial dependence plot(PDP) 및 Shapley 값 요약 플롯에 대해 표시되는 행 수를 지정하십시오. 무작위 샘플링은 autodoc_pd_max_rows
한계값을 초과하는 데이터 세트에 사용됩니다. 기본값은 10000입니다.
autodoc_pd_max_runtime
¶
PDP Max Runtime in Seconds
보고서 생성 시, 부분 의존도 계산에 걸리는 최대 시간(초)을 지정하십시오. 시간 제한이 없는 경우, -1로 설정하십시오.
autodoc_out_of_range
¶
PDP Out of Range
partial dependence plot에 포함할 열 범위 밖의 표준 편차 수를 지정하십시오. 이것은 모델이 처음 보는 데이터에 어떻게 반응하는지를 보여줍니다. 기본값은 3입니다.
autodoc_num_rows
¶
ICE Number of Rows
개별 행이 지정되지 않은 경우 PDP 및 ICE 플롯에 포함할 행 수를 지정하십시오. 기본값은 0입니다.
autodoc_population_stability_index
¶
Population Stability Index
실험이 이진 분류 또는 회귀 분석 문제인 경우 모집단 안정성 지수의 포함 여부를 지정하십시오. 이것은 기본적으로 비활성화되어 있습니다.
autodoc_population_stability_index_n_quantiles
¶
Population Stability Index Number of Quantiles
모집단 안정성 지수에 사용할 분위수를 지정하십시오. 기본값은 10입니다.
autodoc_prediction_stats
¶
Prediction Statistics
실험이 이진 분류 또는 회귀 분석 문제인 경우 예측 통계 정보의 포함 여부를 지정하십시오. 이것은 기본적으로 비활성화되어 있습니다.
autodoc_prediction_stats_n_quantiles
¶
Prediction Statistics Number of Quantiles
예측 통계에 사용할 분위수를 지정하십시오. 기본값은 20입니다.
autodoc_response_rate
¶
Response Rates Plot
실험이 이진 분류 문제인 경우 응답 비율 정보의 포함 여부를 지정하십시오. 이것은 기본적으로 비활성화되어 있습니다.
autodoc_response_rate_n_quantiles
¶
Response Rates Plot Number of Quantiles
응답 비율 정보에 사용할 분위수를 지정하십시오. 기본값은 10입니다.
autodoc_gini_plot
¶
Show GINI Plot
GINI 플롯 표시 여부를 지정하십시오. 이것은 기본적으로 비활성화되어 있습니다.
autodoc_enable_shapley_values
¶
Enable Shapley Values
AutoDoc에 Shapley 값 결과의 표시 여부를 지정하십시오. 이것은 기본적으로 활성화되어 있습니다.
autodoc_global_klime_num_features
¶
Global k-LIME Number of Features
k-LIME 글로벌 GLM 계수 테이블에 표시할 특성 수를 지정하십시오. 이 값은 0 또는 -1보다 큰 정수이어야 합니다. 모든 특성을 표시하려면, 이 값을 -1로 설정하십시오.
autodoc_global_klime_num_tables
¶
Global k-LIME Number of Tables
AutoDoc에 표시할 k-LIME 글로벌 GLM 계수 테이블 수를 지정하십시오. 계수가 절댓값으로 정렬된 한 개의 테이블을 표시하려면, 이 값을 1로 설정하십시오. 이 값을 2로 설정하여 상위 양의 계수가 있는 테이블과 상위 음의 계수가 있는 두 개의 테이블을 표시합니다. 기본값은 1입니다.
autodoc_data_summary_col_num
¶
Number of Features in Data Summary Table
데이터 요약 테이블에 표시할 기능 수를 지정하십시오. 이 값은 정수여야 합니다. 모든 열을 표시하려면 1보다 작은 값을 지정하십시오. 기본적으로 -1로 설정됩니다.
autodoc_list_all_config_settings
¶
List All Config Settings
모든 config 설정의 표시 여부를 지정하십시오. 비활성화된 경우 변경된 설정만 나열됩니다. 활성화되면 모든 설정이 나열됩니다. 이것은 기본적으로 비활성화되어 있습니다.
autodoc_keras_summary_line_length
¶
Keras Model Architecture Summary Line Length
Keras 모델 아키텍처 요약의 라인 길이를 지정하십시오. 이 값은 0 또는 -1보다 큰 정수이어야 합니다. 기본 라인 길이를 사용하려면 이 값을 -1(기본값)로 설정하십시오.
autodoc_transformer_architecture_max_lines
¶
NLP/Image Transformer Architecture Max Lines
특성 섹션에서 고급 트랜스포머 아키텍처에 대해 표시되는 최대 라인 수를 지정하십시오. 전체 아키텍처는 부록에서 확인할 수 있습니다.
autodoc_full_architecture_in_appendix
¶
Appendix NLP/Image Transformer Architecture
부록에 전체 NLP/Image 트랜스포머 아키텍처의 표시 여부를 지정하십시오. 이것은 기본적으로 비활성화되어 있습니다.
autodoc_coef_table_appendix_results_table
¶
Full GLM Coefficients Table in the Appendix
부록에 전체 GLM 계수 테이블의 표시 여부를 지정하십시오. 이것은 기본적으로 비활성화되어 있습니다.
autodoc_coef_table_num_models
¶
GLM Coefficient Tables Number of Models
AutoDoc에 GLM 계수 테이블이 표시되는 모델의 수를 지정하십시오. 이 값은 -1 또는 1 이상의 정수이어야 합니다. 모든 모델에 대해 테이블을 표시하려면 이 값을 -1로 설정하십시오. 기본값은 1입니다.
autodoc_coef_table_num_folds
¶
GLM Coefficient Tables Number of Folds Per Model
AutoDoc에 GLM 계수 테이블이 표시되는 모델당 폴드 수를 지정하십시오. 이 값은 -1(기본값) 또는 1 이상의 정수이어야 합니다 (-1은 모델당 모든 폴드를 표시함).
autodoc_coef_table_num_coef
¶
GLM Coefficient Tables Number of Coefficients
AutoDoc의 GLM 계수 테이블에 표시할 계수의 수를 지정하십시오. 기본값은 50입니다. 모든 계수를 표시하려면 이 값을 -1로 설정하십시오.
autodoc_coef_table_num_classes
¶
GLM Coefficient Tables Number of Classes
AutoDoc의 GLM 계수 테이블에 표시할 클래스의 수를 지정하십시오. 모든 클래스를 표시하려면, 이 값을 -1로 설정하십시오. 기본값은 9입니다.
autodoc_num_histogram_plots
¶
Number of Histograms to Show
히스토그램을 표시할 상위 특성의 수를 지정하십시오. 기본값은 10입니다.
Disparate Impact Analysis Explainer 설정¶
Driverless AI의 Disparate Impact Analysis에 대한 정보는 Disparate Impact Analysis(DIA) 를 참조하십시오. 다음은 새로운 해석을 실행할 때 MLI 페이지의 레시피 탭에서 토글할 수 있는 매개변수의 목록입니다.
dia_cols
¶
List of Features for Which to Compute DIA
DIA를 계산할 특정 특성 목록을 지정하십시오.
cut_off
¶
Cut Off
DIA 수행 시 컷-오프를 지정하십시오.
maximize_metric
¶
Maximize Metric
DIA 계산 시 사용할 메트릭을 지정하십시오. 다음 중에서 선택하십시오.
F1
F05
F2
MCC
use_holdout_preds
¶
Use Internal Holdout Predictions
DIA 계산 시 내부 홀드아웃 예측의 사용 여부를 지정합니다. 이것은 기본적으로 활성화되어 있습니다.
sample_size
¶
Sample Size for Disparate Impact Analysis
Disparate Impact Analysis 샘플 크기를 지정합니다. 기본값은 100000으로 설정됩니다.
max_card
¶
Max Cardinality for Categorical Variables
범주형 번수에 대한 최대 카디널리티(cardinality)의 샘플 크기를 지정합니다. 기본값은 10으로 설정됩니다.
min_card
¶
Minimum Cardinality for Categorical Variables
범주형 번수에 대한 최소 카디널리티(cardinality)의 샘플 크기를 지정합니다. 기본값은 2로 설정됩니다.
num_card
¶
Max Cardinality for Numeric Variables to be Considered Categorical
범주형으로 간주되는 숫자 변수에 대한 최대 카디널리티(cardinality)의 샘플 크기를 지정합니다. 기본값은 25으로 설정됩니다.
fast_approx
¶
Speed Up Predictions With a Fast Approximation
빠른 근사로 예측 속도 증가 여부를 지정합니다. 이는 기본적으로 활성화되어 있습니다.
NLP Partial Dependence Plot Explainer Settings¶
max_tokens
¶
Number of text tokens
NLP 부분 의존도 플롯에 대한 텍스트 토큰의 수를 지정합니다. 기본값은 20입니다.
custom_tokens
¶
List of custom text tokens
NLP 부분 의존도를 계산할 사용자 정의 텍스트 토큰 목록을 지정합니다. 예를 들어 ["text_feature('word_1')"]
이며, 여기서 text_feature
는 모형 텍스트 기능의 이름입니다.
NLP 벡터라이저 + 선형 모델 텍스트 기능 중요성 설명자 설정¶
txt_cols
¶
Text feature for which to compute explanation
설명을 계산할 텍스트 기능을 지정합니다.
cut_off
¶
Cut off for deciphering binary class outcome
DAI 모델 예측을 바탕으로 이진 클래스 결과를 해독하기 위한 컷오프를 지정합니다. 컷오프보다 큰 DAI 예측은 대상 레이블이고 컷오프보다 작은 DAI 예측은 비대상 레이블입니다.
maximize_metric
¶
Cut off based on a metric to maximize
극대화할 메트릭을 기반으로 컷오프를 계산하여, DAI 모델 예측을 기반으로 이진 클래스 결과를 해독합니다. 컷오프보다 큰 DAI 예측은 대상 레이블이고 컷오프보다 작은 DAI 예측은 비대상 레이블입니다. 컷오프와 최대 메트릭을 지정하면 컷오프에 우선 순위가 부여된다는 점에 유의해야 합니다.
partial dependence plot Explainer 설정¶
Driverless AI의 부분 의존도 플롯에 대한 정보는 부분 의존도 플롯(PDP) 를 참조하십시오. 다음은 새로운 해석을 실행할 때 MLI 페이지의 레시피 탭에서 토글할 수 있는 매개변수의 목록입니다.
sample_size
¶
Sample Size for Partial Dependence Plot
행의 수가 이 제한 값을 초과하면, Driverless AI 부분 의존도 플롯에 대해 샘플링합니다.
max_features
¶
Partial Dependence Plot Number of Features
partial dependence plot에서 볼 수 있는 특성의 수를 지정하십시오. 기본값은 10으로 설정됩니다. 모든 특성을 보려면, 이 값을 -1로 설정하십시오.
features
¶
Partial Dependence Plot Feature List
partial dependence plot에 대한 특성 목록을 지정하십시오.
oor_grid_resolution
¶
PDP Number of Out of Range Bins
partial dependence plot에 대해 범위를 벗어난 bin의 수를 지정하십시오.기본값은 0으로 설정됩니다.
qtile_grid_resolution
¶
PDP Quantile Binning
bin의 생성에 사용되는 총 분위수 포인트를 지정하십시오. 기본값은 0으로 설정됩니다.
grid_resolution
¶
PDP Observations Per Bin
bin의 생성에 사용되는 동일한 간격의 포인트 수를 지정하십시오. 기본값은 20으로 설정됩니다.
center
¶
Center PDP Using ICE Centered at 0
0을 중심으로 하는 ICE를 사용하여 partial dependence plot를 중심에 둘 것인지 지정하십시오. 이것은 기본적으로 비활성화되어 있습니다.
sort_bins
¶
Ensure Bin Values Sorting
bin 값의 정렬 보장 여부를 지정하십시오. 이것은 기본적으로 활성화되어 있습니다.
histograms
¶
Enable Histograms
partial dependence plot에 히스토그램의 사용 여부를 지정하십시오. 이것은 기본적으로 비활성화되어 있습니다.
qtile-bins
¶
Per-Feature Quantile Binning
특성별 분위수 비닝을 지정하십시오. 예를 들어, 특성 F1 및 F2를 선택하면 이 매개변수를 '{"F1": 2,"F2": 5}'
로 지정할 수 있습니다.
Note: qtile_grid_resolution 매개변수로 동일한 분위수 비닝을 사용하도록 모든 특성을 설정한 후 해당 매개변수를 사용하여 PDP 특성의 서브세트에 대한 분위수 비닝을 조정할 수 있습니다.
1_frame
¶
Enable PDP Calculation Optimization
bin 당 프레임을 함께 결합하여 예측 수를 최소화하는 PDP 계산 최적화의 활성화 여부를 지정하십시오. 이것은 기본적으로 〈Auto’로 설정됩니다.
numcat_num_chart
¶
Unique Feature Values Count-Driven PDP Binning and Chart Selection
실험에 의해 특성이 수치형 및 범주형 모두로 사용된 경우, PDP 수치형, 범주형 비닝 및 UI 차트 선택 간에 동적 스위칭의 사용 여부를 지정합니다. 이것은 기본적으로 활성화되어 있습니다.
numcat_threshold
¶
Threshold for PD/ICE Binning and Chart Selection
Mli_pd_numcat_num_chart
가 활성화되고 고유한 특성 값의 수가 임계값보다 큰 경우, 수치형 비닝 및 차트가 사용됩니다. 그렇지 않으면 범주형 비닝 및 차트가 사용됩니다. 기본 임계값은 11입니다.
Sensitivity Analysis Explainer Settings¶
sample_size
¶
Sample Size for Sensitivity Analysis (SA)
행의 수가 이 제한 값을 초과하면 Sensitivity Analysis(SA)에 대해 샘플링합니다. 기본값은 500000입니다.
Shapley Summary Plot Explainer 설정¶
Driverless AI의 Shapley Summary 플롯에 대한 자세한 내용은 Shapley Summary Plot (Original Features) 를 참조하십시오. 다음은 새로운 해석을 실행할 때 MLI 페이지의 레시피 탭에서 토글할 수 있는 매개변수의 목록입니다.
max_features
¶
Maximum Number of Features to be Shown
플롯에 표시되는 최대 특성 수를 지정하십시오. 기본값은 50으로 설정됩니다.
sample_size
¶
Sample Size
플롯의 표본 크기를 지정하십시오. 기본값은 20000으로 설정됩니다.
x_resolution
¶
X-Axis Resolution
Shapley 값의 bin 수를 지정하십시오. 기본값은 500으로 설정됩니다.
drilldown_charts
¶
Enable Creation of Per-Feature Shapley / Feature Value Scatter Plots
특성별 Shapley 또는 특성 값 산점도 생성의 활성화 여부를 지정하십시오. 이것은 기본적으로 활성화되어 있습니다.
fast_approx
¶
Speed Up Predictions With a Fast Approximation
빠른 근사로 예측 속도 증가 여부를 지정합니다. 이는 기본적으로 활성화되어 있습니다.
원래 기능 설정을 위한 Shapley Values¶
sample_size
¶
Sample Size for Naive Shapley
행의 수가 이 제한값을 초과하면 Naive Shapley에 대해 샘플링을 수행합니다. 기본값은 100000으르 설정됩니다.
fast_approx
¶
Speed Up Predictions With a Fast Approximation
빠른 근사로 예측 속도 증가 여부를 지정합니다. 이는 기본적으로 활성화되어 있습니다.
Surrogate Decision Tree Explainer 설정¶
Driverless AI의 Surrogate Decision Tree Plot에 대한 자세한 내용은 Surrogate Decision Tree 를 참조하십시오. 다음은 새로운 해석을 실행할 때 MLI 페이지의 레시피 탭에서 토글할 수 있는 매개변수의 목록입니다.
dt_tree_depth
¶
Decision Tree Depth
decision tree의 깊이를 지정하십시오. 기본값은 3으로 설정됩니다.
nfolds
¶
Number of CV Folds
CV 폴드 수를 지정하십시오. 기본값은 0으로 설정됩니다.
qbin_cols
¶
Quantile Binning Columns
분위수 비닝 열을 지정하십시오.
qbin_count
¶
Quantile Bins Count
분위수 bin 수를 지정하십시오. 기본값은 0으로 설정됩니다.