admin管理员组

文章数量:1656974

文章结构

前言

一、数据连接

二、tableau数据可视化原理

三、基础图表的制作

总结

前言

最近想要系统的学习一个可视化工具,听说Tableau对于小白很友好,并且学生可以申请免费使用一年,这羊毛此时不薅,更待何时!今天学习了一些基础图表的制作,非常非常非常基础,有需要的小伙伴可以跟我一起学习哟!

一、数据连接

(数据到B站戴师兄评论区自行下载)

  • 连接类型:对于本地文件,.csv数据连接到文本,.xls/.xlsx连接到Excel;对于数据库,需要下载驱动程序。
  • 连接方式:先连接到shop,再拖拽cpc,选择连接字段:门店id=门店ID 日期=日期;继续拖拽orders与shop相连,选择连接字段:门店id=门店ID 日期=下单日期。
  • 数据量级:shop表有2385行,从2019年8月21日—2020年9月25日,有空值代表当天没开店;cpc表有1117行,从2019年10月28日—2020年9月25日;orders表中只有一家门店的数据,有4419行。

二、Tableau数据可视化原理

第一概念:区分“度量”和“维度”

对于可视化而言,数据有【度量】和【维度】两种类型。度量是数值型变量,可以进行计算,基于计算结果表示成面积大小、长短、颜色深浅等,是可以量化的视觉元素。维度是类别性变量,是有限的类别或可区分的数组。

Tableau的可视化操作其实就是对【度量】和【维度】进行拖拽操作,可拖拽的区域主要有:行列、标记卡、筛选器。

第二概念:维度会对度量值进行区分

可以将维度放在“颜色”“大小”“详细信息”等标签上,对度量进行区分。

第三概念:区分有轴图和无轴图

Tableau可实现的无轴图主要有词云、气泡图、树地图、饼图四种。都是将“度量”放到“大小”上,“维度”放到颜色、标签、详细信息上,在选择对应的类型。

第四概念:离散形成标签,连续对应数轴

划重点!!这四个概念将会在之后的做图中反复使用,暂时没理解没关系,实践是检验真理的唯一标准!!

三、基本图表的制作

1.柱状图、条形图

把“GMV”拖到“行”,“门店名称”拖到“列”,得到柱状图,可以点击自动排序:

如果想要得到一个条形图,不仅可以查看不同品牌的GMV ,还可以查看不同品牌下不同门店的GMV,或者不同品牌下不同门店在不同平台的GMV,并且可以对日期等进行筛选。我们就需要用到“分层结构”和“筛选器”了。

step1:将柱状图转置。

step2:创建分层结构(以“品牌-门店-平台”为例)。

        右键品牌名称--->分层结构--->输入“品牌-门店-平台”---->将“门店名称”“平台”拖拽到分层结构的目录下

step3:将创建好的分层结构替换掉原来的“门店名称”

step4:将“日期”拖拽到“筛选器”,编辑筛选器,选择日期范围。

 2.热力图

用颜色深浅反映数值大小

3.气泡图、词云

将“门店名称”拖到“标签”,将“GMV”拖到“大小”,将标记卡片中改成“圆”即得到气泡图,改成“文本”即得到词云。(GMV越大,气泡或者词越大)

4.饼图、树地图

将“门店名称”拖到“标签”,“GMV”拖到“大小”、“标签”,“门店名称”复制到“颜色”进行区分。在饼图中,我们常用百分比表示大小。右键GMV--->点击快速表计算--->合计百分比。最后在标记卡中切换到“饼图”或“方形”。

5.堆积图

将“门店名称”拖到“列”,GMV拖到“行”,“平台”放到“颜色”,将"GMV"复制到“标签”

为了更清晰的看出每个平台的GMV和相对百分比,进行如下操作:

右键标记卡中的GMV--->点击“快速表运算”--->合计百分比(但此时的百分比是针对总的GMV)--->点击“编辑表运算”---->点击“表(向下)”--->将计算后的GMV拖到“行”

6.折线图

反映GMV随时间的变化,注意将日期转化成“天”,可以在数据分析栏中添加“预测”和“趋势线”等

7.面积图

可以更值观的反映不同平台上GMV的趋势变化及GMV总和大小。只需在折线图的基础上,将“平台”拖到“颜色”。

8.散点图

反映“cpc”与“GMV”之间的关系。将"GMV"放到“行”,“cpc总费用”放到“列”,这时只有一个点,我们把“日期”放到“详细信息”进行区分,可以在数据分析栏中点“群集”进行聚类。

9.直方图

对“用户实付”做直方图。(直方图可以看作对连续数据离散化,再将其作为维度进行计数)

右键“用户实付”--->创建数据桶--->设置数据桶大小--->将数据桶放入“列”--->计数放入“行”

10.地图

step1:先将“配送坐标”的经纬度转化为地理角色;

step2:将经纬度分别放入行和列。此时发现只有一个点,那是因为我们没有用维度对他进行区分。我们用“用户id”对其进行区分,将"用户id"拖到“详细信息”;

step3:将“距离”拖到“颜色”,“用户实付”拖到“大小”,这样颜色越深代表越远,圆越大代表用户实付越大。但我们发现存在问题,有些中间的点颜色却很深,查看了数据详情后发现,每个用户并不是只下一次单,距离会发生累加。因此,我们需要自定义一些限制,尽量让每个点对应一个单独的订单。

step4:创建“主键”进行区分。创建计算字段--->命名为“主键”--->"订单id"+"用户id"+“日期”--->将主键放入“详细信息”。需要注意,要将这些数据都先转化为字符串。

 文末总结

对任何事物的学习都要从基础的开始,由量变引起质变!多多练习,熟能生巧!

本文标签: 基础图表入门Tableau