删除txt中不要的字符
Posted j657521265
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了删除txt中不要的字符相关的知识,希望对你有一定的参考价值。
在对生成数据集的时候,我们需要有语料,一般是写在txt中的,我们如何去掉不要的字符,比如说●
具体思路是,1.txt是字典,2.txt是语料,3.txt是去掉不要字符之后的文本。2.txt逐个字符进行遍历跟1.txt比对,有就写在3.txt中没有就跳过
创建一个app.java文件
在linux中编译:javac app.java
运行:java app
import java.io.File; import java.io.FileNotFoundException; import java.io.FileReader; import java.io.FileWriter; import java.io.IOException; import java.io.Reader; import java.io.Writer; public class app { public static void main(String[] args) throws IOException{ File file = new File("2.txt"); Reader fr = new FileReader(file); Writer fw = new FileWriter("3.txt", false); int len = fr.read(); while (-1 != len){ //System.out.println("=="+len); //if(len!=10 && find(len)==1)//全部写成一行 if(find(len)==1)//取消换行 fw.write(len); len = fr.read(); } fw.flush(); fw.close(); fr.close(); } public static int find(int x) throws IOException{ File file = new File("1.txt"); Reader fr = new FileReader(file); int len = fr.read(); while (-1 != len){ if(len==x){ fr.close(); return 1; } len = fr.read(); } fr.close(); return 0; } }
以上是关于删除txt中不要的字符的主要内容,如果未能解决你的问题,请参考以下文章
linux下,如何删除文件内容里面指定的字符。 比如说file.txt 里面有中文和英文,我只删除中文的内容,只留