展示数据分布
工具/原料
R
方法/步骤
1、首先我们引入一个大数据集
2、对于一维连续型分布,最重要的几何对象是直方图geom娄多骋能_histogram。例如,展示diomands数据集中的depth变量
3、如果你想展示更多组间信息,那你可以使用下面的几种参数,按照cut变量的不同取值进行线条的上
4、按照cut变量的不同取值进行填充柱状图
5、geom_den衡痕贤伎sity一维密度曲线图:如果不设置其他参数,实际上就是直方图的平滑曲线版本,无法回溯数据本身,意义不大
6、如果用cut变量的不同取值进行上色,就会得到一个信息量更大的版本
7、如果想比较两个变量之间的关系,那就需要捂执涡扔使用其他函数,诸如geom_boxplot:箱型图,也称箱须图横轴取值是离散型变量时:
8、横轴取值是连续型变量时,用cut_width设置离散区间,用xlim设置横轴取值范围
9、横轴取值是离散型变量时