BioCode根据seq与位点信息截取窗口

Posted 于淼

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了BioCode根据seq与位点信息截取窗口相关的知识,希望对你有一定的参考价值。

代码说明

 

sequence24371.txt

 

以上为所有氨基酸的编号,序列,与位点标记。根据标记为“1”的位点,截取窗口:如下(实验结果):

图示为一个窗口为12的蛋白质片段 2N+1=25;

实现代码:

 

#include<stdio.h>
#include<stdlib.h>
#include<string.h>
#include<algorithm>
#include<iostream>
#define N 12
using namespace std;
void jieduan(int n,char s3[],char s1[],int l)
{
    int i;
    if(n<N)
    {
        for(i=n-N;i<0;i++)
        {
            s3[i+N-n]=\'*\';
        }
        for(i=0;i<=n+N;i++)
        {
            s3[i+N-n]=s1[i];
        }
        s3[i+N-n]=\'\\n\';
    }
    else if(n>=l-N)
    {
        for(i=n-N;i<l;i++)
        {
            s3[i+N-n]=s1[i];
        }
        for(i=l;i<=n+N;i++)
        {
            s3[i+N-n]=\'*\';
        }
        s3[i+N-n]=\'\\n\';
    }
    else
    {
        for(i=n-N;i<=n+N;i++)
        {
            s3[i+N-n]=s1[i];
        }
        s3[i+N-n]=\'\\n\';
    }
}
int main()
{
    int i,j,k,l,m,n;
    char s[10000],s1[10000],s2[10000],s3[100];
    FILE *p1=fopen("sequence24371.txt","r");
    if(p1==NULL) printf("File not open!\\n");
    FILE *p2=fopen("positive12.txt","w");
    FILE *p3=fopen("negative12.txt","w");
    while(fgets(s,50000,p1))
    {
        fgets(s1,50000,p1);
        fgets(s2,50000,p1);
        l=strlen(s2)-1;
        for(i=0;i<l;i++)
        {
            if(s1[i]==\'K\')
            {
                jieduan(i,s3,s1,l);
                
                if(s2[i]==\'0\')
                {
                    fputs(s3,p3);
                }
                else
                {
                    fputs(s3,p2);
                }
            }
        }
    }
    //system("pause");
    return 0;
}

 

注:

①更改#define N 12 可以任意改变要截取的窗口大小

positive12.txt为生成的正样本窗口,原本标记为“1”

negative12.txt为生成的正样本窗口,原本标记为“0”

 

以上是关于BioCode根据seq与位点信息截取窗口的主要内容,如果未能解决你的问题,请参考以下文章

Chip-seq原理篇

ATAC-seq实战 0 Tn5转座

易基因:全基因组ChIP-seq分析揭示细菌转录因子PhoB的基因内结合位点|mBio

chip-seq技术

chip-seq生信笔记

BioCode删除未算出PSSM与SS的蛋白质序列