箱线图,蛋白组学, 生信绘图, 在线分析
箱线图
什么是箱线图?
箱线图(Box plot)是一种用来显示数据分布情况的统计图表。
它展示了一组数据的五个统计特征:下限、第一四分位数(Q1)、中位数、第三四分位数(Q3)和上限。外面的黑点显示离群值的存在和分布情况。
四分位数(quartile)是指在统计学中把所有数值由小到大排列并分成四等份,处于三个分割点位置的数值。四分位数也被称为四分位点,它是将全部数据分成相等的四部分,其中每部分包括 25%的数据,处在各分位点的数值就是四分位数。四分位数有三个,第一个四分位数是下四分位数,第二个四分位数就是中位数,第三个四分位数称为上四分位数,分别用 Q1、Q2、Q3表示
四分位距IQR:是Q3-Q1,也就是说上下四分位数的差值。
上下限:上下限并不是整个数据样本的最大值和最小值,而是上限 = 去除异常值的最大值(Q3+1.5IQR)和下限 = 去除异常值的最小值(Q1-1.5IQR) ,在上下限这里分别划出两条线段作为异常值的分界点。
那么在箱线图中,上下限之间就是数据样本的正常分布区间,超出上下限就定义为异常值。
绘图前的数据准备
包含2个维度的数据,在组学数据中通常每一列是个样本,每一行是个蛋白。
注意受到数据中极大值的影响,箱线图可能会被压的很扁,可以尝试做log转换。
demo数据可以在这里下载https://www.r2omics.cn/res/demodata/boxplot.txt
BioLadder生信云平台在线绘制箱线图
不想写代码?可以用BioLadder生信云平台在线绘制箱线图。
网址:https://www.bioladder.cn/v2/#/boxPlot
上传文件
点击”选择文件”按钮上传自己的文件
demo数据可以在绘图界面直接下载。默认条件下,系统已自动载入demo数据。
可以使用”编辑”选项在线修改您的数据文件。编辑完记得保存哦。
备注:
点击下载示例,可以下载demo数据;
在问号提示里,可快速的查看数据的要求格式。
支持xlsx,xlsx,txt,tsv格式
调整参数
特有参数
根据需求调整参数即可
对数处理:当箱子被压得很扁,或者有很多异常的时候,试着做对数变换。
抖动散点:是否在箱子上添加散点,看每个数值的分布,当数据量很大时,不建议标上绘制散点。
散点大小:散点的大小
是否添加假设检验标签:可以在组别之间添加一个显著性标签
检验方式:选择计算显著性的方法
标记样式:选择标注显著性的样式,可以选择数值或“*”号。 数值则直接显示p值的具体值,“*”号则表示p<0.05,“**”表示p<0.01,“***”表示p<0.001
通用参数
坐标轴选项卡:可以调整坐标轴名字,刻度大小等,更多选项中还可以调整字体的倾斜角度,样式等。
颜色选项卡:可以调整图案颜色和透明度,布局主题等。你可以选择默认的颜色方案,也可以使用我们预设的多种配色方案。在自定义颜色中,可以自由决定哪些样本使用何种颜色。
提交查看
上传完数据,并调好参数后,点击右上方”提交”按钮,结果会出现在左侧。如果没有上传自己的数据,会使用默认的demo数据绘图。
有些云工具,默认状态是动态图,动态图指的是,鼠标放上去可获得一些基本的交互信息。可以在提交按钮的右侧,切换为”静态图”,得到出版物级别的图片。
有些云工具,旁边还有个小机器人按钮。 这个是同级、上下级智能切换功能:在使用云工具时,某些工具存在着同级或上下级关系,可以跳转。例如,当你再画箱线的时候,可以一键跳转到小提琴图的模块,免去了数据重复上传的步骤。
下载
默认状态是动态图,下载按钮在图片的右上角,可以下载html格式的文件。
除动态图外,还可以下载静态图。在静态图条件下,基本参数选项中额外添加了图片的长度,宽度以及分辨率,可自由的调整图片的比例和下载格式,所见即所得。
当选中”静态图”时图片的参数调整在”基本参数”选项卡中。
引用
如果您使用了BioLadder生信云完成了数据分析,我们期望您在文章发表时,在方法学部分提及我们。例如,XXXX analysis was performed online in BioLadder (bioladder.cn)
并引用我们的文章,
Yupeng Zhang, Chunyuan Yang, et al. 2024. BioLadder: A bioinformatic platform primarily focused on proteomic data analysis. iMeta 3: e215. https://doi.org/10.1002/imt2.215
更多帮助
使用中遇到的问题,可微信扫描下方二维码,进交流群,咨询。