简单配置¶
以下是可以通过 Driverless AI GUI 中 config.toml 复制/粘贴设置运行的一些简单配置列表。
获取快速最终模型:没有遗传算法,没有集成¶
这些设置可以复制粘贴在“专家设置”中的 Toml 编辑器
中。可以检查实验预览,确保更改已生效。已完成实验的 Toml 编辑器也会在实验结束时将其列出。
Toml 编辑器
enable_genetic_algorithm = "off"
fixed_ensemble_level = 0
通过遗传算法使用原始特征¶
此示例未对数值特征进行转换,仅对分类特征进行了一个简单编码,即 没有交互、目标编码、日期、文本等 。它仅通过 GA 执行了模型选择和调优。
这些示例可以复制粘贴在“专家设置”中的 Toml 编辑器
中。实验预览经过修改,可对其进行检查,确认更改已生效。
此示例仅对数值列应用标识或 original transformation ,同时对整数列和分类列应用 Frequent Transformer ,即它不会执行特征工程或特征交互(若设置交互深度 >1,应考虑 mutation_mode = “full”)。它不会从原始集中删除任何特征,但如果建模算法不用某些特征,您可能仍然无法看到这些特征,例如在拟合模型时进行拆分)
Toml 编辑器
included_transformers = ["OriginalTransformer","FrequentTransformer"] max_feature_interaction_depth = 1 no_drop_features = true
此示例对数值特征应用标识转换器,同时对分类特征应用 OneHotEncoding 转换。
Toml 编辑器
included_transformers = ["OriginalTransformer","OneHotEncodingTransformer"] max_feature_interaction_depth = 1 no_drop_features = true
使用您选择的算法和参数构建模型¶
这些设置可以复制粘贴在实验的“专家实验”设置下的 通过 toml 字符串添加至 config.toml
中。启动实验之前,务必检查 Driverless 预览,确保更改已生效。可以使用“分数”选项卡检查已构建模型。
此示例使用 2 折交叉验证和用户提供的参数构建了一个 GBM 模型,没有遗传算法。
通过 toml 字符串添加至 config.toml
"" included_models = ['XGBOOSTGBM']\n params_xgboost = "{'max_depth': 2, 'max_leaves': 4, 'n_estimators': 50, 'learning_rate': 0.03}"\n fixed_num_folds = 2 \n feature_brain_level = 0 \n enable_genetic_algorithm = "off" \n ""此示例基于原始数值特征使用用户定义的参数构建了一个 TensorFlow 模型。此模型可以在目标数值列范围之外进行预测。使用 4 折交叉验证方案对此模型进行评估。已关闭 Mojo 创建、管道可视化和遗传算法。可以查看实验日志以验证 TensorFlow 模型所使用的参数。
通过 toml 字符串添加至 config.toml
"" included_models = ["TensorFlowModel"] \n included_transformers = ["OriginalTransformer"] \n fixed_ensemble_level = 1 \n fixed_num_folds = 4 \n params_tensorflow = "{'batch_size': 4096, 'epochs': 100, 'hidden': [1000, 1000]}" \n target_transformer = "identity_noclip" \n make_mojo_scoring_pipeline = "off" \n make_pipeline_visualization = "off" \n enable_genetic_algorithm = "off" \n ""此示例构建了 LightGBM 模型。在遗传算法期间,它执行了特征工程,并将通过切换非用户设置的 其他参数 执行模型调优。可以使用“分数”选项卡检查已构建模型。
通过 toml 字符串添加至 config.toml
"" included_models = ["LightGBMModel"] \n params_lightgbm = "{ 'n_estimators': 100, 'max_leaves': 64, 'random_state': 1234}" \n ""
禁用泄漏检查、移位检测、mojo 创建和集成¶
这些设置可以复制粘贴在“专家设置”中的
Toml 编辑器
中。可以检查实验预览,确保更改已生效。已完成实验的 Toml 编辑器也会在实验结束时将其列出。如果用户知道数据良好或者正在构建 TensorFlow 模型,可以关闭泄露或移位检测。如果用户非常了解数据且仅对单个模型的 DAI 特征工程感兴趣,无需 mojo 创建,也可以应用这些设置。注意,如果提供了外部验证集,可以将 num_folds 设置为零。
Toml 编辑器
check_distribution_shift = "off" check_leakage = "off" make_mojo_scoring_pipeline = "off" fixed_ensemble_level = 0 fixed_num_folds = 0