怎么用python实现两个文件逐行计算两个区间的并集?

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了怎么用python实现两个文件逐行计算两个区间的并集?相关的知识,希望对你有一定的参考价值。

test1.txt
Chromosome01 250 384
Chromosome01 508 644
Chromosome01 6846 7066

test2.txt
Chromosome01 210 251
Chromosome01 608 744
Chromosome01 6246 7866
Chromosome01 7483 7617

写一段python代码运行后输出的结果文件内容为:
Chromosome01 210 384
Chromosome01 508 744
Chromosome01 6246 7866
Chromosome01 7483 7617

急需求助python程序员~谢谢啦

参考技术A 有时候,为来了需求,需要统计两个 list 之间的交集,并集,差集。查询了一些资料,现在源总结在下面:
1. 获取两个list 的zd交集

#方法一:

a=[2,3,4,5]

b=[2,5,8]

tmp = [val for val in a if val in b]

print tmp

#[2, 5]

#方法二

print list(set(a).intersection(set(b)))

2. 获取两个list 的并集

print list(set(a).union(set(b)))

3. 获取两个 list 的差集

print list(set(b).difference(set(a))) # b中有而a中没有的

SDOI2005 区间

题目描述

现给定n个闭区间[ai, bi],1<=i<=n。这些区间的并可以表示为一些不相交的闭区间的并。你的任务就是在这些表示方式中找出包含最少区间的方案。你的输出应该按照区间的升序排列。这里如果说两个区间[a, b]和[c, d]是按照升序排列的,那么我们有a<=b<c<=d。

请写一个程序:

读入这些区间;

计算满足给定条件的不相交闭区间;

把这些区间按照升序输出。

输入输出格式

输入格式:

 

第一行包含一个整数n,3<=n<=50000,为区间的数目。以下n行为对区间的描述,第i行为对第i个区间的描述,为两个整数1<=ai<bi<=1000000,表示一个区间[ai, bi]。

 

输出格式:

 

输出计算出来的不相交的区间。每一行都是对一个区间的描述,包括两个用空格分开的整数,为区间的上下界。你应该把区间按照升序排序。

 

输入输出样例

输入样例#1: 复制
5
5 6
1 4
10 10
6 9
8 10
输出样例#1: 复制
1 4
5 10


思路:一开始看到题目,还以为是用线段树(毕竟省选题),但仔细想了想,用线段树的话好像很麻烦,要维护不少信息呢,况且数据范围:1<=ai<bi<=1000000,显然nlogn的算法
无法承受。那么用什么做法呢?
我们可以发现:n比较小只有5万,那么我们可以考虑枚举区间。其实,这题有一个类似于贪心的算法,先按照左端点从小到大排序,然后我们把区间看成是线段,如果两条线段有交集,那么
我们可以视为把这两条线段合成为一条,显然,新线段的右端点即为两条线段中右端点较靠右的那一个。如果线段没有交集,那么我们直接输出上一条线段的答案。
这题这么水实在不像是省选原题啊233。
#include<iostream>
#include<cstdio>
#include<cstring>
#include<algorithm>
#include<cmath>
#include<queue>
using namespace std;
const int maxn=5e4+5;
int read()
{
    int ret=0,f=1;
    char c=getchar();
    while(c<0||c>9)
    {if(c==-) f=-1;c=getchar();}
    while(c>=0&&c<=9)
    {ret=ret*10+c-0;c=getchar();}
    return ret*f;
}
int n;
struct line{
    int l,r;
}e[maxn];
bool cmp(line A,line B)
{
    return A.l<B.l;
}
int main()
{
    n=read();
    for(int i=1;i<=n;i++)
    {
        e[i].l=read(),e[i].r=read();
    }
    sort(e+1,e+1+n,cmp);
    int ll=e[1].l,rr=e[1].r;
    for(int i=2;i<=n;i++)
    {
        if(e[i].l<=rr) rr=max(rr,e[i].r);
        else
        {
            printf("%d %d\n",ll,rr);
            ll=e[i].l,rr=e[i].r;
        }
    }
    printf("%d %d\n",ll,rr);
    return 0;
}

 

 

以上是关于怎么用python实现两个文件逐行计算两个区间的并集?的主要内容,如果未能解决你的问题,请参考以下文章

Linux shell 计算两个文件的并集交集差集

Linux shell 计算两个文件的并集交集差集

[SDOI2005]区间

SDOI2005 区间

用顺序表实现求两个集合的并集

asp.net两个数组的并集