插件设置¶
included_transformers
¶
Include Specific Transformers
选择您想在实验中使用的 transformer(s) .使用 全选/取消全选 按钮可快速添加或移除所有的转换器。请注意:如果取消选中所有转换器导致没有选择任何转换器,Driverless AI 会忽略此设置,并将为实验使用默认的转换器列表。转换器列表因实验而异。
等效的 config.toml 参数为 included_transformers
.
included_models
¶
Include Specific Models
指定您希望 Driverless AI 在实验中建立的模型类型,此列表包括原生支持的算法和通过自定义插件添加的模型。
请注意:ImbalancedLightGBM 和 ImbalancedXGBoostGBM 模型与 imbalance_sampling_method 选项联系紧密。具体地说:
如果 ImbalancedLightGBM 和/或 ImbalancedXGBoostGBM 模型以及且 imbalance_sampling_method 均被启用(设置为 off 以外的值),则 Driverless AI 会检查目标不平衡分数。如果目标分数被证明高于允许的不平衡阈值,则会触发抽样。
如果 ImbalancedLightGBM 和/或 ImbalancedXGBoostGBM 模型被禁用,而 imbalance_sampling_method 选项被启用,则不会执行任何特殊抽样方法。
如果 ImbalancedLightGBM 和/或 ImbalancedXGBoostGBM 模型被启用,而 imbalance_sampling_method 被禁用,将不会进行抽样,并且这些不平衡模型也会被禁用。
included_scorers
¶
Include Specific Scorers
指定在运行实验时希望 Driverless AI 包含的评分器。
included_pretransformers
¶
Include Specific Preprocessing Transformers
在其他转换器被激活之前,指定将哪个 transformers 用于预处理。预处理转换器可转换任何原始特征并输出常规层转换器所使用的任意特征。
请注意:
预处理转换器和所有其他层的转换器都是 Python 和(如果适用)MOJO 评分包的组成部分。
任何 custom transformer recipe 或原生 DAI 转换器都可以用作预处理转换器。例如,在执行下一层“日期”和“日期时间”转换之前,预处理转换器会执行交互、字符串连接或日期提取,作为预处理步骤。
- 警告:
目前无法对还未创建的 time_column 执行时间序列实验(实验设置只知道原始数据而非转换后的数据)。但是,可以使用运行时数据插件(例如)将浮动日期时间转换为字符串日期时间,以供由 Driverless AI“日期”和“日期时间”转换器以及时间序列的自动检测使用。
为了对 GUI/客户端自动选择分组、期限等执行时间序列实验,数据集必须让用户或通过一次性的 data recipe 在实验之前准备时间列和分组。
等效的 config.toml 参数为 included_pretransformers
.
num_pipeline_layers
¶
Number of Pipeline Layers
指定管道层的数量。在默认值为 1。等效的 config.toml 参数为 num_pipeline_layers
.
请注意:这不包括 included_pretransformers 专家设置指定的预处理层。
included_datas
¶
Include Specific Data Recipes During Experiment
指定在实验过程中是否包括特定的数据插件。避免执行单独的数据预处理步骤,在实验中和 Python 评分包内进行数据预处理。但是 Mojo 会要求在进行预测之前应用数据预处理。
等效的 config.toml 参数为 included_datas
.
threshold_scorer
¶
Scorer to Optimize Threshold to Be Used in Other Confusion-Matrix Based Scorers (For Binary Classification)
指定用于优化在基于混淆矩阵的相关评分器中使用的二元概率阈值的评分器(如精确率、召回率、FalsePositiveRate、FalseDiscoveryRate、FalseOmissionRate、TrueNegativeRate、FalseNegativeRate 和 NegativePredictiveValue)。从以下选项中选择:
自动 (默认):使用此选项会将阈值评分器与用于实验的评分器同步。如果不可用,则使用 F1。
F05 增大精确率的权重,减小召回率的权重。
F1:为精确率和召回率分配相等的权重。
F2:减小精确率的权重,增大召回率的权重。
MCC:当所有的类都同等重要时使用此选项。
prob_add_genes
¶
Probability to Add Transformers
指定非规范化概率,以添加带有特定属性的基因或转换器实例。如果无法添加基因,会尝试其他变异。默认值为 0.5。
prob_addbest_genes
¶
Probability to Add Best Shared Transformers
指定非规范化概率,以添加具有被证明为对群体内其他个体有利的特定属性的基因或转换器实例。默认值为 0.5。
prob_prune_genes
¶
Probability to Prune Transformers
指定非规范化概率,以删除带有特定属性的基因或转换器实例。默认值为 0.5。
prob_perturb_xgb
¶
Probability to Mutate Model Parameters
指定非规范化概率,以更改模型超参数。默认值为 0.25。
prob_prune_by_features
¶
Probability to Prune Weak Features
指定非规范化概率,以删除具有低变量重要性的特征而非删除基因/转换器的整个实例。默认值为 0.25。
skip_transformer_failures
¶
Whether to Skip Failures of Transformers
指定是否要避免使用失效的转换器。默认启用此功能。
skip_model_failures
¶
Whether to Skip Failures of Models
指定是否要避免使用失效的模型。根据指定的级别记录故障,以记录跳过的故障。默认启用此功能。
detailed_skip_failure_messages_level
¶
Level to Log for Skipped Failures
为跳过的转换器或模型的故障日志消息指定以下任一详细程度级别:
0 = 记录简单消息
1 = 记录代码行加消息(默认)
2 = 记录详细的堆栈跟踪信息
notify_failures
¶
Whether to Notify About Failures of Transformers or Models or Other Recipe Failures
指定 GUI 中是否显示有关插件失败的通知。默认会启用此设置。
等效的 config.toml 参数为 notify_failures
.
acceptance_test_timeout
¶
Timeout in Minutes for Testing Acceptance of Each Recipe
指定在中止插件的验收测试之前需要等待的分钟数。如果验收测试已启用并且超时,则拒绝插件。默认值为 20.0。