23andmegsawegene各染色体位点统计
Posted 200572
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了23andmegsawegene各染色体位点统计相关的知识,希望对你有一定的参考价值。
---
shell还没入门,确切的说是还没学,用python3写了个小脚本统计23andme、gsa、wegene各染色体位点.
代码如下:
23andme:
chromesomeset = set() snp = {} for x in range(1,24): snp[str(x)] = 0 snp[‘X‘] = 0 snp[‘Y‘] = 0 snp[‘MT‘] = 0 print(snp) chromesome = ‘‘ inf = open(‘genome_jun_v3_Full_201608225359.txt‘)
for line in inf: if line.startswith(‘r‘): #snp_name = line.strip().split(‘\t‘)[0] chromesome = line.strip().split(‘\t‘)[1] chromesomeset.add(chromesome) snp[chromesome] += 1 #print(chromesome) #print(snp[%s % str(chromesome)]) sorted(snp.keys()) for chromesome in chromesomeset: print(chromesome, ‘\t‘, snp[chromesome])
gsa的同上,稍做一两处调整。
wegene的没有源数据,找的生信菜鸟团jimmy的shell
cut -f 2 jimmy_wegene.txt | unique -c |grep -v "^#"
# 结果分析
从图中可以看出,毕竟23andme是最早做的,位点最多,但是,现在来讲,大约也就上千个点可以被解读,所以意义不大。但是,国内公司的还是引入了中国人的特征位点的,更具有人群优势,适合国人的基因检测,现阶段,大概也就这样了,不知何时可以每个人做全外或全基因检测。
以上是关于23andmegsawegene各染色体位点统计的主要内容,如果未能解决你的问题,请参考以下文章