华为OJ089-DNA序列

Posted Wang-Junchao

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了华为OJ089-DNA序列相关的知识,希望对你有一定的参考价值。

【华为OJ】【算法总篇章】


【华为OJ】【089-DNA序列】

【工程下载】


题目描述

一个DNA序列由A/C/G/T四个字母的排列组合组成。G和C的比例(定义为GC-Ratio)是序列中G和C两个字母的总的出现次
数除以总的字母数目(也就是序列长度)。在基因工程中,这个比例非常重要。因为高的GC-Ratio可能是基因的起始点。

给定一个很长的DNA序列,以及要求的最小子序列长度,研究人员经常会需要在其中找出GC-Ratio最高的子序列。

输入描述

输入一个string型基因序列,和int型子串的长度

输出描述

找出GC比例最高的字串

输入例子

AACTGTGCACGACCTGA
5

输出例子

GCACG

算法实现

import java.util.Scanner;

/**
 * Author: 王俊超
 * Date: 2016-01-06 15:18
 * All Rights Reserved !!!
 */
public class Main {
    public static void main(String[] args) {
        Scanner scanner = new Scanner(System.in);
//        Scanner scanner = new Scanner(Main.class.getClassLoader().getResourceAsStream("data.txt"));
        while (scanner.hasNext()) {
            String input = scanner.nextLine();
            int n = scanner.nextInt();
            System.out.println(maxRatio(input, n));
        }

        scanner.close();
    }

    /**
     * 初始化两个数组,一个序列数值数组K[N],一个序列和数组SUM[N],先遍历一边序列,
     * 为C或者G则K[i]为1,否则则置为0,然后计算连续M个K[I]之和存入SUM就行。
     *
     * @param s
     * @param m
     * @return
     */
    private static String maxRatio(String s, int m) {
        int[] k = new int[s.length()];
        int[] sum = new int[s.length()];
        for (int i = 0; i < s.length(); i++) {
            char c = s.charAt(i);
            if (c == 'C' || c == 'G') {
                k[i]++;
            }
        }

        for (int i = 0; i < k.length - m; i++) {
            for (int j = 0; j < m; j++) {
                sum[i] += k[i + j];
            }
        }

        int max = 0;
        int idx = 0;
        for (int i = 0; i < k.length - 1; i++) {
            if (sum[i] > max) {
                max = sum[i];
                idx = i;
            }
        }

        return s.substring(idx, idx + m);
    }
}

以上是关于华为OJ089-DNA序列的主要内容,如果未能解决你的问题,请参考以下文章

华为OJ平台——DNA序列

华为OJ072-火车进站

华为OJ—火车进站(栈,字典排序)

华为OJ100-配制文件恢复

华为OJ076-蛇形矩阵

华为OJ065-字符逆序