如何从另一个文件中的一个文件中查找单词?

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了如何从另一个文件中的一个文件中查找单词?相关的知识,希望对你有一定的参考价值。

在一个文本文件中,我有150个单词。我有另一个文本文件,大约有100,000行。

如何检查属于第一个文件的每个单词是否在第二个文件中?

我想过使用grep,但我找不到如何用它来阅读原文中的每个单词。

有没有办法用awk做到这一点?或另一种解决方案

我试过这个shell脚本,但它几乎匹配每一行:

#!/usr/bin/env sh
cat words.txt | while read line; do  
    if grep -F "$FILENAME" text.txt
    then
        echo "Se encontró $line"
    fi
done

我发现的另一种方式是:

fgrep -w -o -f "words.txt" "text.txt"
答案

你可以使用fgrep -f

fgrep -f "first-file" "second-file"

或者匹配完整的单词:

fgrep -w -f "first-file" "second-file"

更新:根据评论:

awk 'FNR==NR{a[$1];next} ($1 in a){delete a[$1]; print $1}' file1 file2
另一答案

使用像这样的grep:

grep -f firstfile secondfile

第二种选择

感谢Ed Morton指出文件“reserved”中的单词被视为模式。如果这是一个问题 - 它可能是也可能不是 - OP可以使用不使用模式的这样的东西:

档案“保留”

cat
dog
fox

并提交“文本”

The cat jumped over the lazy
fox but didn't land on the
moon at all.
However it did land on the dog!!!

awk脚本是这样的:

awk 'BEGIN{i=0}FNR==NR{res[i++]=$1;next}{for(j=0;j<i;j++)if(index($0,res[j]))print $0}' reserved text

输出:

The cat jumped over the lazy
fox but didn't land on the
However it did land on the dog!!!

第三种选择

或者,它可以很简单地完成,但在bash中更慢:

while read r; do grep $r secondfile; done < firstfile 

以上是关于如何从另一个文件中的一个文件中查找单词?的主要内容,如果未能解决你的问题,请参考以下文章

编写一个程序, 将 a.txt 文件中的单词与 b.txt 文件中的 单词交替合并到 c.txt 文件中, a.txt 文件中的单词用回车符 分隔, b.txt 文件中用回车或空格进行分隔。(代码片段

从另一个活动的活动中的片段传递数据

python如何查找两个文本文件之间的所有单词匹配

查找和替换文件中的单词/行

尝试在单独的文本文件中查找单词

从另一个片段调用一个片段中的方法