7  蛋白理化性质

7.1 什么是蛋白质理化性质?

蛋白质理化性质即蛋白的物理化学性质,主要包括长度,分子量,等电点,疏水性。

长度和分子量:即蛋白肽段的氨基酸个数,和分子质量。

等电点:等电点是一个分子表面不带电荷时的pH值。

疏水性:疏水性指的是一个分子与水互相排斥的物理性质。

本文我们就来讨论一下怎样用BioLadder做蛋白理化性质计算。

7.1.1 绘图前的数据准备

demo数据可以在https://www.bioladder.cn/shiny/zyp/bioladder2/model/new/physicochemical/1.fasta下载。

只支持fasta格式的文件。

在 fasta 文件当中,每一个序列由两部分组成。

  1. 序列的特征性 ID,“>”大于号开头后跟描述信息。

  2. 具体的蛋白序列。

7.1.2 R语言怎么计算蛋白理化性质

library(tidyverse)
library(Biostrings)  # 用于读取fasta格式
library(Peptides)    # 用于计算蛋白理化性质

fa <- readAAStringSet("https://www.bioladder.cn/shiny/zyp/bioladder2/model/new/physicochemical/1.fasta")
# AAStringSet object of length 100:
#   width seq                                                               names               
# [1]   366 GNXGCKMARGEVSCLCLAILGXQALQRTTFL...SXHQNTIMVISEASVVFLYANSEQSEKDIKX ENST00000658203_1...
# [2]   456 AQGLNGVGVGGLEGREVKDSQAYLTTQSCXE...VFVTSIPCLQKIASDSTAYPKPIRINDNPTT ENST00000638985_1...
# [3]  2783 GSTLRRFWRGCPFLASALRLEAKLVLCLLSI...XFYYIYIYVSFNIVLYTLIXTIKFIXNIKKX ENST00000603037_1...
# [4]  1299 VPKYSTGLPSIGLPFDYFIWLPGQRDSWEPT...MGHKMFIYAPIEGHLGCFQVLANINKAVINI ENST00000641360_1...
# [5]   768 GXLRLQNGEGGGKLSLLGHLGLAGLAENYLF...CSGXFTXMEXHNRCLLSWVSFTXDVLXGNPY ENST00000652540_1...

data.frame(fa) %>%
  rownames_to_column("name") %>%
  mutate("长度" = Peptides::lengthpep(seq = fa)) %>%  # lengthpep() 计算长度
  mutate("分子量" = mw(seq = fa)) %>%                 # mw() 计算分子量
  mutate("疏水性" = hydrophobicity(seq = fa)) %>%     # hydrophobicity() 计算疏水性
  mutate("等电点" = pI(seq = fa)) %>%                 # pI() 计算等电点
  as_tibble()

# # A tibble: 100 x 6
# name               fa            长度 分子量   疏水性 等电点
# <chr>              chr>        <int>  <dbl>    <dbl>  <dbl>
# 1 ENST00000658203_1 GNXGCKMARGE~   366 3.83e4 -5.85e-2   8.09
# 2 ENST00000638985_1 AQGLNGVGVGG~   456 4.81e4 -1.80e-1   8.52
# 3 ENST00000603037_1 GSTLRRFWRGC~  2783 3.02e5  2.52e-4  10.0 
# 4 ENST00000641360_1 VPKYSTGLPSI~  1299 1.41e5  1.77e-1   8.63
# 5 ENST00000652540_1 GXLRLQNGEGG~   768 8.11e4  2.53e-2   8.16

7.1.3 BioLadder生信云平台在线计算蛋白理化性质

不想写代码?可以用BioLadder生信云平台在线计算蛋白理化性质。

网址:

蛋白理化性质计算-BioLadder生物信息在线分析可视化云平台​www.bioladder.cn/web/#/chart/74