java 根据url 获取title 现在会一个url获取url的html代码 存为txt,

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了java 根据url 获取title 现在会一个url获取url的html代码 存为txt,相关的知识,希望对你有一定的参考价值。

现在想要实现读取一个txt里面的很多url地址,然后希望通过正则表达式获得每个url的title (不要其他的) 输出为一个txt (这个txt中有很多title)。
比如说 一个txt里 有 www.sina.com www.qq.com
java读取后 输出 新浪首页 腾讯首页 到一个txt

java 的 properties就没问题 连接为key值 输出后的结果 为title值 这样不就行了 参考技术A title 是什么格式的?写出来看看

java根据开始时间结束时间计算中间间隔日期


import java.text.ParseException;
import java.text.SimpleDateFormat;
import java.util.ArrayList;
import java.util.Calendar;
import java.util.Date;
import java.util.List;

public class Test {

/**
* @title 根据开始时间,结束时间获取期间所有日期yyyy-MM-dd
* 例:开始时间:2019-05-01 结束时间:2019-05-05
* @param [stime, etime]
* @return java.util.List<java.lang.String>
*/
public static List<String> findDates(String stime, String etime)
throws ParseException {
SimpleDateFormat sdf = new SimpleDateFormat("yyyy-MM-dd");
SimpleDateFormat sdf1 = new SimpleDateFormat("yyyy-MM-dd");
Date dBegin = sdf.parse(stime);
Date dEnd = sdf.parse(etime);

List<String> allDate = new ArrayList();
allDate.add(sdf1.format(dBegin));
Calendar calBegin = Calendar.getInstance();
// 使用给定的 Date 设置此 Calendar 的时间
calBegin.setTime(dBegin);
Calendar calEnd = Calendar.getInstance();
// 使用给定的 Date 设置此 Calendar 的时间
calEnd.setTime(dEnd);
// 测试此日期是否在指定日期之后
while (dEnd.after(calBegin.getTime())) {
// 根据日历的规则,为给定的日历字段添加或减去指定的时间量
calBegin.add(Calendar.DAY_OF_MONTH, 1);
allDate.add(sdf1.format(calBegin.getTime()));
}
return allDate;
}

public static void main(String[] args) {
//测试数据
String stime = "2019-05-01";
String etime = "2019-05-05";
//集合中包含2019-05-01/2019-05-05,不需要可去除
List<String> list = new ArrayList<>();
try {
list = findDates(stime, etime);
} catch (ParseException e) {
e.printStackTrace();
}
for(String time : list) {
System.out.println(time);
}
System.out.println("间隔天数:" + list.size());
}
}
---------------------

以上是关于java 根据url 获取title 现在会一个url获取url的html代码 存为txt,的主要内容,如果未能解决你的问题,请参考以下文章

java根据url抓取html页面内容,怎么解析chunked 方式

Java 7:获取资源路径(作为 Path 类型的对象)

java根据开始时间结束时间计算中间间隔日期

获取请求url中的参数

java url访问层次

根据终端分配不同的url地址