28  桑基图(可交互)

28.1 什么是桑基图?

桑基图(Sankey Diagram),即桑基能量分流图,也叫桑基能量平衡图。它是一种特定类型的流程图,图中延伸的分支的宽度对应数据流量的大小。

桑基图主要由边、流量和节点组成,其中边代表了流动的数据,流量代表了流动数据的具体数值,节点代表了不同分类。边的宽度与流量成比例地显示,边越宽,数值越大。

本文我们就来讨论一下桑基图是如何绘制的。

28.2 绘图前的数据准备

demo数据可以在https://www.bioladder.cn/shiny/zyp/bioladder2/demoData/sankeyNetwork/sankeyNetwork.zip下载。

28.2.1 边(连线)数据

包含4列,前两列定义连线,从哪个节点到哪个节点,可以有多个层面。第三列是数值,定义连线粗细,第四列是颜色,定义连线的颜色。

28.2.2 节点数据

包含2列,第一列是边数据文件中的节点,第二列是该节点所在层次的颜色。

如果没有该数据,则会默认只有一个颜色。

28.3 R语言怎么画桑基图

library(networkD3)
library(tidyverse)
# 读取连线文件和节点文件
MisLinks = read.delim("https://www.bioladder.cn/shiny/zyp/bioladder2/demoData/sankeyNetwork/link.csv",sep = ",")
MisNodes = read.delim("https://www.bioladder.cn/shiny/zyp/bioladder2/demoData/sankeyNetwork/node.csv",sep = ",")

# 处理数据
# 因为networkD3需要的连线数据,是节点文件里的名称的索引。所以,需要做一个名称到索引的转化
Node2index = list()
Node2index[MisNodes$name] = 0:length(MisNodes$name)
MisLinks = MisLinks %>%
  mutate(source2 = unlist(Node2index[source])) %>%
  mutate(target2 = unlist(Node2index[target]))

# 定义颜色
color2project = paste(c(unique(MisNodes$group_color),unique(MisLinks$group_color2)),collapse = '","')
my_color <- paste0('d3.scaleOrdinal().domain(["',color2project,'"]).range(["',color2project,'"])')

# 绘图
sankeyNetwork(Links = MisLinks, 
              Nodes = MisNodes,
              Source = "source2", 
              Target = "target2",
              Value ="value",
              NodeID = "name",
              NodeGroup = "group_color", 
              LinkGroup  = "group_color2", 
              colourScale = JS(my_color),
              fontSize = 10
)

28.4 BioLadder生信云平台在线绘制桑基图

不想写代码?可以用BioLadder生信云平台在线绘制桑基图。

网址:https://www.bioladder.cn/web/#/chart/59