华为机试HJ63:DNA序列
Posted 翟天保Steven
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了华为机试HJ63:DNA序列相关的知识,希望对你有一定的参考价值。
作者:Steven
版权声明:著作权归作者所有,商业转载请联系作者获得授权,非商业转载请注明出处
题目描述:
一个DNA序列由A/C/G/T四个字母的排列组合组成。G和C的比例(定义为GC-Ratio)是序列中G和C两个字母的总的出现次数除以总的字母数目(也就是序列长度)。在基因工程中,这个比例非常重要。因为高的GC-Ratio可能是基因的起始点。
给定一个很长的DNA序列,以及限定的子串长度N,请帮助研究人员在给出的DNA序列中从左往右找出GC-Ratio最高且长度为N的第一个子串。
DNA序列为ACGT的子串有:ACG,CG,CGT等等,但是没有AGT,CT等等
输入描述:
输入一个string型基因序列,和int型子串的长度
输出描述:
找出GC比例最高的子串,如果有多个则输出第一个的子串
示例:
输入:
ACGT 2
输出:
CG
说明:
ACGT长度为2的子串有AC,CG,GT3个,其中AC和GT2个的GC-Ratio都为0.5,CG为1,故输出CG
解题思路:
本题为字符串操作题。输入string基因序列和子串长度后,挨个子串分析GC的比例,定位出最大GC-Ratio的子串输出即可。
测试代码:
#include <iostream>
#include <string>
#include <vector>
using namespace std;
int main()
{
string str;
int length;
while(cin>>str>>length)
{
vector<string> ls;
int size=str.size();
float max=0.f;
string result;
for(int i=0;i<size-length+1;++i)
{
string t=str.substr(i,length);
float sum=0.f;
for(int j=0;j<t.size();++j)
{
if(t[j]=='G'||t[j]=='C')
sum++;
}
float R=float(sum/t.size());
if(R>max)
{
max=R;
result=t;
}
}
cout<<result<<endl;
}
return 0;
}
以上是关于华为机试HJ63:DNA序列的主要内容,如果未能解决你的问题,请参考以下文章