如何使用python将fasta文件中各种碱基计数

 时间:2024-09-22 14:23:07

对于一个fasta的纯序列文件,第一步统计的就应该是不同碱基的个数从而观察测序的质量,今天就用python来实现一下吧。

工具/原料

linux

python3.5.3

方法/步骤

1、首先我们将fasta文件读入python(首先选定编码形式,这里我习惯用UTF-8,中文兼容性好)。

如何使用python将fasta文件中各种碱基计数

2、这里说明一下,第一个r是表示后面的路径内容不用再转义了,最后的r表示写入。

如何使用python将fasta文件中各种碱基计数

3、然后通过循环遍历文件,注意文件是带空行的注意使用.strip(),还有文件本身鋈守踬痊是大小写都有的,小写表示的是重复序列,大写表示一般序列。所以用.upper()全部统一为大写。

如何使用python将fasta文件中各种碱基计数

4、采用"str:{0}".fo筠续师诈rmat()的形式结合字符串,再通过str_.count("xxx")的方式来输出特定字符的个数。

如何使用python将fasta文件中各种碱基计数

5、最后看一下效果,看来A:T和C:G的比值接近于1,所以该序列较为正常。

如何使用python将fasta文件中各种碱基计数

6、最后提一下,如果想知道其互补链的序列呢?使用自带函数str就可以啦,虽然很简单也很重要哦。

如何使用python将fasta文件中各种碱基计数

六级选词填空题如何拿高分? 团餐企业按照服务对象怎么分类 EXCEL中如何设置折线图中的折现更加平滑 SPSS怎么设置输出附注内容右对齐 Wps Office文字怎么选择段落单位
热门搜索
斗罗大陆漫画免费观看 男明星图片大全 荆芥图片 大马哈鱼图片 旋风少女漫画