创建自定义绘图

若需创建自定义绘图,点击右上角的 添加图表 按钮,并选择其中一种可用的绘图类型。选定绘图后,为此绘图类型配置可用的设置,并点击 保存 。自定义绘图创建完成后,将立即显示在可视化页面中。

以下示例创建了用于信用卡训练数据集的自定义直方图:

Create Custom Plot

以下是可用图表类型的完整列表。

条形图

此绘图使用矩形条呈现分类数据,矩形条与其所表示的值成正比。用于表示条形的标记类型决定了条形图的类型。最常见的标记是条形标记,其范围从低值(通常为零)到高值。还可使用克利夫兰点图(在高值处用一个点来代替条形)和区域图(用实心区域标记覆盖条形)。条形始终根据分类变量的类别进行绘制。它们可表示计数(如果未指定 y 变量)或每个类别 y 变量的平均值(如果指定了 y 变量)。

创建条形图时,需指定以下选项:

  • x 变量名称:指定 x 变量的名称

  • y 变量名称:指定 y 变量的名称

  • 转置:指定是否切换 X 轴和 Y

  • 排序:指定是否根据 x 值将条形按字母顺序进行排序

  • 标记:指定标记类型。选择 创建克利夫兰点图

箱形图

此绘图用于显示分布的分位数。箱子的中心表示中位数,其边缘表示下四分位数和上四分位数,”须线”的两端表示值的范围。当出现异常值时,相邻须线将缩短至下一个低值或高值。对于仅有几个值的变量,可以将箱子进行压缩。

创建箱形图时,需指定以下选项:

  • 变量名称:指定您希望箱形图表示的变量

  • 转置:指定是否切换 X 轴和 Y

点图

此绘图用点表示单个数据的值。当一个小邻域内有多个值时,表示这些值的点将会堆叠。

创建点图时,需指定以下选项:

  • 变量名称:指定需计算点的变量名称

  • 标记:指定标记类型

分组箱形图

此绘图是一种特殊的箱形图,其中各个类别被组织成组和子组。

创建分组箱形图时,需指定以下选项:

  • 变量名称:指定您希望箱形图表示的变量

  • 组变量名称:指定组变量的名称

  • 转置:指定是否切换 X 轴和 Y

热图

请参阅 数据热图. 创建热图时,需指定以下选项:

  • 变量名称:指定要使用的一个或多个变量。如果未指定任何变量,则将使用数据集中的所有变量。

  • 排列:指定是否使用 奇异值分解 (SVD) 对变量进行重新排序

  • 转置:指定是否切换 X 轴和 Y

  • 矩阵类型:指定矩阵类型。从 矩形对称 中选择一种

直方图

此绘图使用不同高度的条形显示数据。每个条形按其宽度将数字分组到不同范围,较高的条形说明较多数据落入某个特定范围内。此绘图常用于显示连续变量的形状和分布。

创建直方图时,需指定以下选项:

  • 变量名称:指定变量名称

  • 转换:指定是否进行转换。从 对数平方根 中选择一种

  • 条形数量:指定要使用的条形数量

  • 标记:指定标记类型。使用 区域 创建密度多边图

线性回归

通过拟合线性函数 (\(ax + b\)),此绘图可根据 x 变量的值预测 y 变量的一组值,因此,对于 x 变量的任何值,此函数将生成最可能的 y 变量值。预测结果在值样本中的有效性由 y 值和其相应预测值之间的差异表示。

创建线性回归图时,需指定以下选项:

  • x 变量名称:指定 x 变量的名称

  • y 变量名称:指定 y 变量的名称

  • 标记:指定标记类型。从 正方形 中选择一种

局部加权回归 (LOESS)

通过拟合局部线性函数 (\(ax + b\))(此函数根据可用的 x 变量值确定最可能的 y 变量值),此绘图可根据 x 变量的值预测 y 变量的一组值。预测结果在数值样本中的有效性由 y 值和其相应预测值之间的差异表示。

创建局部加权回归 (LOESS) 图时,需指定以下选项:

  • x 变量名称:指定 x 变量的名称

  • y 变量名称:指定 y 变量的名称

  • 标记:指定标记类型。从 正方形 中选择一种

  • 带宽:指定在平滑窗口过程中表示用例比重的间距。默认值为 0.5。

平行座标图

此绘图用于比较多个变量。每个变量在图中均有自己的纵坐标,并且每个剖面图均将坐标轴上的值连接起来,以进行单次观测。如果数据中含有聚类,则这些剖面图可根据其聚类编号进行颜色编码。

创建平行座标图时,需指定以下选项:

  • 变量名称:指定要使用的一个或多个变量。如果未指定任何变量,则将使用数据集中的所有变量。

  • 排列:指定是否使用 奇异值分解 (SVD) 对变量进行重新排序

  • 转置:指定是否切换 X 轴和 Y

  • 聚类:指定是否包括 k-Means 聚类变量。为每个聚类 ID 分配其唯一的颜色

概率图

此绘图通过绘制两个彼此相反的累积分布函数来评估分布的偏斜度。

创建概率图时,需指定以下选项:

  • x 变量名称:指定 x 变量的名称

  • 分布:指定分布类型。从 正态分布均匀分布 中选择一种

  • 标记:指定标记类型。从 正方形 中选择一种

  • 转置:指定是否切换 X 轴和 Y

分位数图

本绘图通过绘制彼此相反的分位数来比较两种概率分布。

创建分位数图时,需指定以下选项:

  • x 变量名称:指定 x 变量的名称

  • y 变量名称:指定 y 变量的名称

  • 分布:指定分布类型。从 正态分布均匀分布 中选择一种

  • 标记:指定标记类型。从 正方形 中选择一种

  • 转置:指定是否切换 X 轴和 Y

散点图

此绘图显示一帧中两个变量(yx)的值,在此帧中,每行输入样本数据用一个点表示。这有助于分析两个变量的联合分布。

创建散点图时,需指定以下选项:

  • x 变量名称:指定 x 变量的名称

  • y 变量名称:指定 y 变量的名称

  • 标记:指定标记类型。从 正方形 中选择一种