莱茵衣藻叶绿体生物反应器的密码子优化(3)

2结果与讨论 2.1衣藻叶绿体基因组中ORF框的鉴定与统计 从GenBank数据库下载衣藻叶绿体基因组序列,序列总长度为203828bp。结合已知注释和开放通读框预测的


2结果与讨论

2.1衣藻叶绿体基因组中ORF框的鉴定与统计

从GenBank数据库下载衣藻叶绿体基因组序列,序列总长度为203828bp。结合已知注释和开放通读框预测的结果,我们最终在衣藻叶绿体基因组中鉴定出70个蛋白编码基因(表1),当然这些基因并没有进行长度筛选,有些蛋白不超过100个氨基酸。为了减少长度对密码子用法评估带来的样本误差,通常要挑选出了以ATG为起始密码子、以TAG、TAA或TGA为终止密码子并且编码区的序列长度不小于300bp的蛋白质编码基因进行抽样,这样后续分析才能准备评估密码子用法偏好性。经过筛选,最终得到了符合条件的59个蛋白编码基因当做本次研究的序列样本。