java以流的形式读取html文件,再输出为excel文件
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了java以流的形式读取html文件,再输出为excel文件相关的知识,希望对你有一定的参考价值。
html中只有
"ghtz": "gzsy,huiyishi,yongche,shezhi",
"shjt":"daiban,daiyue,guanzhu,yiban,yiyue,banjie,falv,ITshenpi,shezhi",
"shjm":"gzsy,huiyishi,yongche,chuchai,qingjia,yongyin,shezhi"
这些数据,需要去遍历与匹配各个公司,然后再也execl输出,execl中输出的样式为
某某某公司,某某某模块,以及id
另外你还要将解析出来的值保存到excel中,可以使用poi这个工具,封装了操作excel表的基本操作方法。祝你成功~追问
能帮忙写一个吗?我这边确实不太熟悉这方面
追答额,这个暂时没有时间弄,你可以高分悬赏来征集帮助。
追问你如果愿意帮我弄的。我出500的悬赏分,。。。。
追答不要发愁啊,你要静心研究下应该没问题,代码这里贴上就超字数限制了。额~,给我邮箱发你;
我用poi尝试导出的结果,不到100行代码,没问题。
我私信回复你了,麻烦给我发下,谢谢
详解:java中的IO流
IO流
I:代表Input,O:代表Output。用于对文件的输入输出,Java 程序通过流来完成输入/输出,所有的输入/输出以流的形式处理。因此要了解 I/O 系统,首先要理解输入/输出流的概念。
输入就是将数据从各种输入设备(包括文件、键盘等)中读取到内存中,输出则正好相反,是将数据写入到各种输出设备(比如文件、显示器、磁盘等)。例如键盘就是一个标准的输入设备,而显示器就是一个标准的输出设备,但是文件既可以作为输入设备,又可以作为输出设备。
1.数据流是 Java 进行 I/O 操作的对象,它按照不同的标准可以分为不同的类别。
2.按照流的方向主要分为输入流和输出流两大类。
3.数据流按照数据单位的不同分为字节流和字符流。
4.按照功能可以划分为节点流和处理流。
输入流
InputStream字节流 作为输入流的一个父类,本身是一个抽象类不能实例化对象,所以重要的事情就交给自己的子类去完成。
常用的方法有:
上述最后 3 个方法一般会结合在一起使用,首先使用 markSupported() 判断,如果可以重复读取,则使用 mark(int readLimit) 方法进行标记,标记完成之后可以使用 read() 方法读取标记范围内的字节数,最后使用 reset() 方法使输入流重新定位到标记的位置,继而完成重复读取操作。
Java 中的字符是 Unicode 编码,即双字节的,而 InputerStream 是用来处理单字节的,在处理字符文本时不是很方便。这时可以使用 Java 的文本输入流 Reader 类,该类是字符输入流的抽象类,即所有字符输入流的实现都是它的子类,该类的方法与 InputerSteam 类的方法类似。
Reader字符流
主要用于对txt文档,字符串的读操作,可以直接处理双字节,比单字节读取更快一些。当然字节流可以转换成字符流。
方法:
输出流
OutputStream字节流
在 Java 中所有输出流类都是 OutputStream 抽象类(字节输出流)和 Writer 抽象类(字符输出流)的子类。其中 OutputStream 类是字节输出流的抽象类,是所有字节输出流的父类。
常用方法:
Writer字符流
写入字符流的抽象类。子类必须实现的方法仅有 write(char[], int, int)、flush() 和 close()。但是,多数子类将重写此处定义的一些方法,以提供更高的效率和/或其他功能。
常用方法:
字节流与字符流之间的转换
从字符流的InputStreamReader类中可以发现,继承于Reader类,且构造方法里的参数可以是InputStream流对象,当然InputStreamReader本身也是字符输入流,不过此时还需要BufferReader(将文本写入字符输出流,缓冲各个字符,从而提供单个字符、数组和字符串的高效写入。 )缓存字符流包装一下,所以最终Reader read = new BufferReader(new InputStreamReader(new FileInputStream(new File(""))))
整个套接起来。
package com.openlab.coll;
import java.io.BufferedReader;
import java.io.BufferedWriter;
import java.io.File;
import java.io.FileInputStream;
import java.io.FileOutputStream;
import java.io.IOException;
import java.io.InputStreamReader;
import java.io.OutputStreamWriter;
public class InputSteamReaderTest {
public static void main(String[] args) throws IOException {
//读取的目标
String path="D:\\\\2.txt";
//写入目标路径
File target = new File("mydir1/mydir2/a.txt");
// FileInputStream fis = new FileInputStream(path);
//
// InputStreamReader isr = new InputStreamReader(fis);
//
// BufferedReader br = new BufferedReader(isr);
BufferedReader br =
new BufferedReader(
new InputStreamReader(
new FileInputStream(path)));
BufferedWriter bw =
new BufferedWriter(
new OutputStreamWriter(
new FileOutputStream(target)));
String result = "";
StringBuffer sb = new StringBuffer();
while((result = br.readLine())!=null){
// 写的操作
bw.write(result);
bw.newLine();
sb.append(result+"\\n");
}
System.out.println(sb.toString());
bw.flush();
br.close();
bw.close();
}
}
序列化和反序列化
接口 :Serializable 仅供于序列化的标识 该接口中没有方法也没有字段
序列化和反序列化:
我们所定义的对象是否能够在流中传输或处理
DataInputStream 基本数据类型的封装类
Byte Boolean Double Char Integer Short Float Long
将引用数据类型进行序列化 -----通过流来读取和写入引用数据类型
ObjectInputStream 父类是InputStream 实现DataInput接口
ObjectOutputStream 父类OutputSream 实现DataOutput接口
前提条件:
引用数据类型必须要实现Serializable 接口
序列化和反序列化 处理的是对象 也就是二进制数据流在进行存储
将对象以序列化的形式存储在 txt -----文本 -----字符
而序列化的对象是字节 将原本的字节对象以字符串的形式展示在txt文本中自然就会出现乱码问题 使用sublimeText 打开txt文本后里面是十六进制数据
package com.openlab.io;
import java.io.File;
import java.io.FileInputStream;
import java.io.FileNotFoundException;
import java.io.FileOutputStream;
import java.io.IOException;
import java.io.ObjectInputStream;
import java.io.ObjectOutputStream;
class ObjectInputStreamTest {
public static void main(String[] args) throws FileNotFoundException, IOException, ClassNotFoundException {
File file = new File("mydir1/mydir2/a.txt");
Person p = new Person("张三疯",99);
// 需要一个InputStream 对象
// 将对象序列化
ObjectOutputStream oos =
new ObjectOutputStream(new FileOutputStream(file));
// 做写的操作
// 把对象写入到文档中后再进行去取
oos.writeObject(p);
//将对象反序列化
ObjectInputStream ois =
new ObjectInputStream(new FileInputStream(file) );
Person p1 = (Person) ois.readObject();
System.out.println(p1.getName());
System.out.println(p1.getAge());
oos.flush();
ois.close();
oos.close();
}
}
以上是关于java以流的形式读取html文件,再输出为excel文件的主要内容,如果未能解决你的问题,请参考以下文章