如何获取网页的header格式

Posted 2023-04-21

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了如何获取网页的header格式相关的知识，希望对你有一定的参考价值。

一、如何获取网页Header信息？

推荐工具：获取网页Header信息：[url]http://tool.itlearner.com/header.asp[/url]
在里面输入网址即可查询到网页的Header信息。

二、获取网页Header有什么用？

如何从Herder结果中获取对seo帮助的信息呢？我们以西安451医院的网站来举例说明，查询网站尼玛电影网[url]http://www.nimady.com/[/url] ，得到如下信息：
HTTP/1.1 200 OK
Date: Tue, 06 Mar 2012 07:03:22 GMT
Server: Apache/2.2.16 (Win32) php/5.2.14
Last-Modified: Wed, 29 Feb 2012 01:12:24 GMT
ETag: "600000007eb30-ffce-4ba10094615bb"
Accept-Ranges: bytes
Content-Length: 65486
Vary: Accept-Encoding
Connection: close
Content-Type: text/html
服务器返回了200 OK，说明网页成功获取。并且得知了服务器是Apache/2.2.16，php是
5.2.14的版本。因此，它的作用是获取服务器信息，当然有些服务器管理员也可以通过某
些设定来隐藏或故意设置成假的信息，所以这里获取到的服务器信息有5%的概率是假的。

再随意查一个图片http://www.*****.com/images/logotop.jpg，得到

HTTP/1.1 200 OK
Cache-Control: max-age=86400
Content-Length: 3042
Content-Type: image/jpeg
Last-Modified: Sun, 28 Aug 2005 15:10:06 GMT
Accept-Ranges: bytes
ETag: "323fd892e2abc51:2d3"
Server: Microsoft-IIS/6.0
Date: Thu, 06 Nov 2008 15:05:00 GMT
Connection: close
说明下：这张图片最长在86400秒后过期，大小为3042字节，类型是image/jpeg，最后修改时间Sun, 28 Aug 2005 15:10:06 GMT，服务器是Microsoft-IIS/6.0。

在这些信息里，我认为最有用的是第一行的信息，就是获取服务器返回的状态。
也许您已经知道，在网站(页面)转移时，需要使用对搜索引擎友好的301来实现跳转，而
不能使用302。因此，在这里可以检测跳转是301还是302。
网上现有的这类工具，好像只能查域名，不能查某URL，而这个工具是可以的，随意一个
url都可以查询，推荐给大家，希望对大家有帮助。参考技术A 含两个子文件夹 obj
和 list。
template\
doc
src
include
output\obj
\list 整理库代码
由于 Libraries 下的 CMSIS 文件夹中很多代码是和编译器及芯片相关的，导致
文件夹多且深度大，不利于工程维护，实际上一个项目往往是用固定的编译器和芯
片，因此有必要对库进行整理。
在 src 下建立 libstm32 目录
1. 把 Libraries\STM32F10x_StdPeriph_Driver\下的内容拷贝到 libstm32 目录
下
2. 在 libstm32 目录下建立 cmsis 文件夹，把
Libraries\CMSIS\CM3\CoreSupport\下的 core_cm3.c，core_cm3.h；
Libraries\CMSIS\CM3\DeviceSupport\ST\STM32F10x\下的 stm32f10x.h，
system_stm32f10x.c，system_stm32f10x.h 拷贝到 cmsis 文件夹中。
3. 根据你所选的芯片类型，将
Libraries\CMSIS\CM3\DeviceSupport\ST\STM32F10x\startup\arm\下对应的启动
文件拷贝到 cmsis 文件夹中。这里我拷贝的是 startup_stm32f10x_hd.s（大容量型
stm32 芯片的启动文件）。
下面对该库文件做个简单介绍：
Libraries\STM32F10x_StdPeriph_Driver\下的内容很好理解就是 stm32 的各个
外设模块驱动代码。参考技术B

　这是http://mail.163.com的header，你是要这个东西吗？

php获取网页301,302后的真实地址,支持多重跳转

function getrealurl($url){
    $realurl = $url;
    try {
        $headers = get_headers($realurl, true);
        if(isset($headers[‘Location‘])){
            if(is_array($headers[‘Location‘])){
                $location = ‘‘;
                for($i=count($headers[‘Location‘]); $i>0; $i--){
                    $location = $headers[‘Location‘][$i-1] . $location;
                    if (preg_match("/^(http|https):///i", $location)) {
                        break;
                    }
                }
                $realurl = $location;
            }else{
                if (!preg_match("/^(http|https):///i", $headers[‘Location‘])) {
                    $realurl .= $headers[‘Location‘];
                }
            }
        }
    } catch (Exception $e) {
    }
    return $realurl;
}

推荐：微信怎么批量删除聊天记录，彻底删除聊天记录只需这三种方法

匿名社交app有哪些，10个最火社交软件排行榜

自己建网站需要多少钱，搭建网站的基础流程分享

微信怎么恢复删除的好友，微信误删好友找回方法

以上是关于如何获取网页的header格式的主要内容，如果未能解决你的问题，请参考以下文章

Python爬虫如何获取网页Network中某个文件的response？

急！加分！如何获取网页视频中的URL地址？如优酷、腾讯这些在线的URL格式。

Angularjs中$http.post返回的网页怎么获取某个元素的内容

winForm中如何实现网络请求WebAPI获取数据

Retrofit 获取、设置cookie

C#webbrowser如何获取网页的html文件