如何获取网页的header格式

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了如何获取网页的header格式相关的知识,希望对你有一定的参考价值。

一、如何获取网页Header信息?

推荐工具:获取网页Header信息:[url]http://tool.itlearner.com/header.asp[/url]
在里面输入网址即可查询到网页的Header信息。

二、获取网页Header有什么用?

如何从Herder结果中获取对seo帮助的信息呢?我们以西安451医院的网站来举例说明,查询网站尼玛电影网[url]http://www.nimady.com/[/url] ,得到如下信息:
HTTP/1.1 200 OK
Date: Tue, 06 Mar 2012 07:03:22 GMT
Server: Apache/2.2.16 (Win32) php/5.2.14
Last-Modified: Wed, 29 Feb 2012 01:12:24 GMT
ETag: "600000007eb30-ffce-4ba10094615bb"
Accept-Ranges: bytes
Content-Length: 65486
Vary: Accept-Encoding
Connection: close
Content-Type: text/html
服务器返回了200 OK,说明网页成功获取。并且得知了服务器是Apache/2.2.16,php是
5.2.14的版本。因此,它的作用是获取服务器信息,当然有些服务器管理员也可以通过某
些设定来隐藏或故意设置成假的信息,所以这里获取到的服务器信息有5%的概率是假的。

再随意查一个图片http://www.*****.com/images/logotop.jpg,得到

HTTP/1.1 200 OK
Cache-Control: max-age=86400
Content-Length: 3042
Content-Type: image/jpeg
Last-Modified: Sun, 28 Aug 2005 15:10:06 GMT
Accept-Ranges: bytes
ETag: "323fd892e2abc51:2d3"
Server: Microsoft-IIS/6.0
Date: Thu, 06 Nov 2008 15:05:00 GMT
Connection: close
说明下:这张图片最长在86400秒后过期,大小为3042字节,类型是image/jpeg,最后修改时间Sun, 28 Aug 2005 15:10:06 GMT,服务器是Microsoft-IIS/6.0。

在这些信息里,我认为最有用的是第一行的信息,就是获取服务器返回的状态。
也许您已经知道,在网站(页面)转移时,需要使用对搜索引擎友好的301来实现跳转,而
不能使用302。因此,在这里可以检测跳转是301还是302。
网上现有的这类工具,好像只能查域名,不能查某URL,而这个工具是可以的,随意一个
url都可以查询,推荐给大家,希望对大家有帮助。
参考技术A 含两个子文件夹 obj
和 list。
template\
doc
src
include
output\obj
\list 整理库代码
由于 Libraries 下的 CMSIS 文件夹中很多代码是和编译器及芯片相关的,导致
文件夹多且深度大,不利于工程维护,实际上一个项目往往是用固定的编译器和芯
片,因此有必要对库进行整理。
在 src 下建立 libstm32 目录
1. 把 Libraries\STM32F10x_StdPeriph_Driver\下的内容拷贝到 libstm32 目录

2. 在 libstm32 目录下建立 cmsis 文件夹,把
Libraries\CMSIS\CM3\CoreSupport\下的 core_cm3.c,core_cm3.h;
Libraries\CMSIS\CM3\DeviceSupport\ST\STM32F10x\下的 stm32f10x.h,
system_stm32f10x.c,system_stm32f10x.h 拷贝到 cmsis 文件夹中。
3. 根据你所选的芯片类型,将
Libraries\CMSIS\CM3\DeviceSupport\ST\STM32F10x\startup\arm\下对应的启动
文件拷贝到 cmsis 文件夹中。这里我拷贝的是 startup_stm32f10x_hd.s(大容量型
stm32 芯片的启动文件)。
下面对该库文件做个简单介绍:
Libraries\STM32F10x_StdPeriph_Driver\下的内容很好理解就是 stm32 的各个
外设模块驱动代码。
参考技术B

 这是http://mail.163.com的header,你是要这个东西吗?

php获取网页301,302后的真实地址,支持多重跳转

function getrealurl($url){
    $realurl = $url;
    try {
        $headers = get_headers($realurl, true);
        if(isset($headers[‘Location‘])){
            if(is_array($headers[‘Location‘])){
                $location = ‘‘;
                for($i=count($headers[‘Location‘]); $i>0; $i--){
                    $location = $headers[‘Location‘][$i-1] . $location;
                    if (preg_match("/^(http|https):///i", $location)) {
                        break;
                    }
                }
                $realurl = $location;
            }else{
                if (!preg_match("/^(http|https):///i", $headers[‘Location‘])) {
                    $realurl .= $headers[‘Location‘];
                }
            }
        }
    } catch (Exception $e) {
    }
    return $realurl;
}

 推荐:微信怎么批量删除聊天记录,彻底删除聊天记录只需这三种方法

匿名社交app有哪些,10个最火社交软件排行榜

自己建网站需要多少钱,搭建网站的基础流程分享

微信怎么恢复删除的好友,微信误删好友找回方法

以上是关于如何获取网页的header格式的主要内容,如果未能解决你的问题,请参考以下文章

Python爬虫如何获取网页Network中某个文件的response?

急!加分!如何获取网页视频中的URL地址?如优酷、腾讯这些在线的URL格式。

Angularjs中$http.post返回的网页怎么获取某个元素的内容

winForm中如何实现网络请求WebAPI获取数据

Retrofit 获取、设置cookie

C#webbrowser如何获取网页的html文件