返回数据提示页面

如何在Tableau中进行异常检测

策略 尖端

我认为我们都在那里......我们正在分享一个有意义的故事,我们在数据中找到了我们的最终用户在我们的可视化中以前的峰值或山谷挂断。这通常会使手头的对话和/或阻止我们的观众听到我们的其余信息和/或减少导致行动的机会。

我们面临的最大挑战之一,因为数据可视化从业者正在帮助我们的最终用户避免分心。当我们的最终用户分心时,它使传达数据中的故事和我们建议的行动更具挑战性。具有讽刺意味的是,用户分心的原因之一是因为可视化数据使得景点更容易。不幸的是,只因为某些东西可能会引起兴趣,它并不总是与谈话有关。

该职位与随附的公式分享了伴随的绘制的公式,在Tableau中进行异常检测。随着异常检测,您能够专注于重要的数据点,并为您的最终用户提供统计解释,以帮助避免分散对话。


相关视频教程:

Premier Tableau Elearning. 来自PlayFair数据电视


 

使用表计算在Tableau中进行统计异常检测

为了帮助说明在Tableau中进行异常检测的方法,我们将使用Sample-Superstore DataSet按月重新创建该销售趋势。注意,参考分布显示每个数据点是否在一个或两个标准偏差范围内,圆圈是基于它们是否是异常的。出于本练习的目的,异常被定义为与平均值的至少一个标准偏差。

Tableau异常检测销量按月决赛

要启动,请使用您的感兴趣的衡量标准创建一个线条图。

逐个销量按月线图进行异常检测

接下来,添加参考线以将分布放在-2到2个标准偏差和/或-1至1标准偏差之间。请注意,如果要显示多个分发,最好首先从最广泛的分布开始,以便您的重叠颜色工作。

要添加参考分布,我喜欢右键单击轴,选择“添加参考线”,单击“分发”选项卡,将值更改为“标准偏差”,并放入我的因素(在第一次案例中 - 2,2)。

Tableau添加标准偏差的参考分配

可选地,使用不同的参考分布,添加第二个范围,和/或将引用分布格式化为您的喜好。以下是在添加-2 / 2标准偏差的引用分发后,我的视图如何查看,为-1 / 1标准偏差添加引用分布,并清理格式。

Tableau销售月趋势线与参考分布

此时,我们有一个基本的控制图。要创建彩色的异常指标,我们将利用双轴和表格计算来为圆圈颜色。要启动双轴组合图表,请将衡量标准放在行货架上第二次,并将标记类型更改为圆。

Tableau销售按月两排

接下来,通过右键单击行货架上的药丸并选择“双轴”,将视图转换为双轴图表。此外,确保通过右键单击任一轴并选择“同步轴”,排列轴。此时,我也想通过右键单击它并取消选择“显示标题”来隐藏右轴。

Tableau销售月份双轴组合图表

现在,行货架上有两颗药片,每个药片都有自己的一组标记卡,可以彼此独立编辑。这意味着我们可以留下那条线,但通过它们是否被认为是异常的圆圈。

正如我之前提到的那样,我将异常定义为一个标准偏差之外的任何数据点。此定义的公式如下:

如果总和([销售])<(window_avg(sum([销售]))–window_stdev(sum([销售])))然后“Bad Anomaly”
elsefif sum([销售])>(window_avg(sum([sales]))+ window_stdev(sum([销售])))然后“Good Anomaly”
别的“Expected”
结尾

Tableau异常检测公式在计算的领域

这个配方看起来有点恐吓,但它正在做的只是在最粒度的细节水平(即个月)上看每个数据点,并将该数字与视图中的平均值进行比较,或者减去一个标准偏差。如果该值不大于与平均值的平均值或少于一个标准偏差的标准偏差,则其被归类为“预期”。

我正在使用销售作为我的措施,但如果你想使用不同的东西,只需用您选择的衡量标准就取代销售。此外,如果您更喜欢使用2,3 - 甚至1.5等 - 标准偏差,只需乘以“window_stdev(sum([销售])))”分别为2,3或1.5。

一旦您有异常检测的计算字段,将其放置在圆圈的颜色标记卡上。

Tableau异常检测与销售异常计算的字段

现在我可以(1)非常有效,准确地看到有意义的见解(2)知道我什么时候不应该对钉子(而且我应该)和(3)帮助我的最终用户避免在逢低时避免分散注意力。

例如,在使用示例 - Superstore数据集中构建的此视图中,我可以看到连续四个月的时间是正面异常。此外,我认为,与上个月相比,最后一滴看起来非常陡峭,它仍然大于一个标准偏差,而不是显示的四年均值。所以我们采取了潜在的负面分心,并将其定位为它的积极故事。

谢谢阅读,
– Ryan