Libcurl库——HTTP协议实现
Posted leeechee
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Libcurl库——HTTP协议实现相关的知识,希望对你有一定的参考价值。
目录
Libcurl库简介
-
libcurl是跨平台网络协议库,支持应用层
http,https,ftp,gopher,tellnet,dict,file,dap协议 -
libcurl同样支持HTTPS证书授权,HTTP POST, HTTP PUT, FTP 上传,
HTTP基本表单上传,代理,cookies,和用户认证
库下载地址:https://github.com/curl/curl/releases/tag/curl-7_71_1
Libcurl的使用
在基于LibCurl的程序里,主要采用callback function (回调函数)的形式完成传输任务,用户在启动传输前设置好各类参数和回调函数,当满足条件时libcurl将调用用户的回调函数实现特定功能。下面是利用libcurl完成传输任务的流程:
调用curl_global_init()初始化libcurl,在调用curl_global_cleanup 函数后仍然可再用
初始化crul库,只能调用一次,不调用自动调用,相当于socket()
参数:CURL_GLOBAL_ALL或CURL_GLOBAL_DEFAULT 初始化所有可能的调用
如果这个函数在curl_easy_init函数调用时还没调用,它讲由libcurl库自动调用,所以多线程下最好主动调用该函数以防止在线程中curl_easy_init时多次调用
虽然libcurl是线程安全的,但curl_global_init是不能保证线程安全的,所以不要在每个线程中都调用curl_global_init,应该将该函数的调用放在主线程中 应该使用:curl_global_init(CURL_GLOBAL_ALL);
void curl_global_cleanup(void);
结束libcurl使用的时候,用来对curl_global_init做的工作清理。类似于close的函数。
虽然libcurl是线程安全的,但curl_global_cleanup是不能保证线程安全的,所以不要在每个线程中都调用curl_global_init,应该将该函数的调用放在主线程中
CURL *curl_easy_init( );
curl_easy_init用来初始化一个CURL的指针(有些像返回FILE类型的指针一样)(句柄). 相应的在调用结束时要用curl_easy_cleanup函数清理.
一般curl_easy_init意味着一个会话的开始. 它会返回一个easy_handle(CURL*对象), 一般都用在easy系列的函数中.
调用 curl_easy_init()函数得到 easy interface型指针,存放的请求方式。拿到一个句柄
void curl_easy_cleanup(CURL *handle);
释放内存,完成一次请求就结束了
这个调用用来结束一个会话.与curl_easy_init配合着用.
参数:
CURL类型的指针.
调用curl_easy_setopt设置传输选项,去操作上面的句柄
根据curl_easy_setopt设置的传输选项,实现回调函数以完成用户特定任务。设置curl,操作,干什么
参数1:CURL指针
参数2:CURLOPT_URL 设置访问curl网站
CURLOPT_WRITEFUNCTION 返回http头输出到哪里
参数3:取决于参数2
CURLcode curl_easy_setopt(CURL *handle, CURLoption option, parameter);
这个函数最重要了.几乎所有的curl 程序都要频繁的使用它.它告诉curl库.程序将有如何的行为. 比如要查看一个网页的html代码等.(这个函数有些像ioctl函数)参数:
1:CURL类型的指针
2:各种CURLoption类型的选项.(都在curl.h库里有定义,man 也可以查看到)
3:parameter 参数 既可以是个函数的指针,也可以是某个对象的指针,也可以是个long型的变量.它用什么这取决于第二个参数.
CURLoption 这个参数的取值很多.具体的可以查看man手册.
调用curl_easy_perform()函数完成传输任务,发起请求
在初始化CURL类型的指针 以及curl_easy_setopt完成后调用. 就像字面的意思所说perform就像是个舞台.让我们设置的
option 运作起来.参数:
CURL类型的指针
在整过过程中设置curl_easy_setopt()参数是最关键的,几乎所有的libcurl程序都要使用它
curl_easy_setopt()里的部分函数
-
CURLOPT_URL
设置访问URL
-
CURLOPT_WRITEFUNCTION,CURLOPT_WRITEDATA
回调函数原型为:size_t function( void *ptr, size_t size, size_t nmemb, void *stream);
函数将在libcurl接收到数据后被调用,因此函数多做数据保存的功能,如处理下载文件。CURLOPT_WRITEDATA 用于表明CURLOPT_WRITEFUNCTION函数中的stream指针的来源。
如果你没有通过CURLOPT_WRITEFUNCTION属性给easy handle设置回调函数,libcurl会提供一个默认的回调函数,它只是简单的将接收到的数据打印到标准输出。你也可以通过 CURLOPT_WRITEDATA属性给默认回调函数传递一个已经打开的文件指针,用于将数据输出到文件里。
-
CURLOPT_HEADERFUNCTION,CURLOPT_HEADERDATA
回调函数原型为 size_t function( void *ptr, size_t size,size_t nmemb, void *stream);
libcurl一旦接收到http 头部数据后将调用该函数。CURLOPT_WRITEDATA 传递指针给libcurl,该指针表明CURLOPT_HEADERFUNCTION 函数的stream指针的来源。
-
CURLOPT_READFUNCTION CURLOPT_READDATA
libCurl需要读取数据传递给远程主机时将调用CURLOPT_READFUNCTION指定的函数,函数原型是:size_t function(void *ptr, size_t size, size_t nmemb,void *stream)
. CURLOPT_READDATA 表明CURLOPT_READFUNCTION函数原型中的stream指针来源。
-
CURLOPT_NOPROGRESS,CURLOPT_PROGRESSFUNCTION,CURLOPT_PROGRESSDATA
跟数据传输进度相关的参数。CURLOPT_PROGRESSFUNCTION 指定的函数正常情况下每秒被libcurl调用一次,为了使CURLOPT_PROGRESSFUNCTION被调用,CURLOPT_NOPROGRESS必须被设置为false,CURLOPT_PROGRESSDATA指定的参数将作为CURLOPT_PROGRESSFUNCTION指定函数的第一个参数
-
CURLOPT_TIMEOUT,CURLOPT_CONNECTIONTIMEOUT:
CURLOPT_TIMEOUT 由于设置传输时间,CURLOPT_CONNECTIONTIMEOUT 设置连接等待时间
-
CURLOPT_FOLLOWLOCATION
设置重定位URL
测试回调函数
回调函数原型为size_t function( void ptr, size_t size,size_t nmemb, void stream)
#include <stdio.h>
#include <curl/curl.h>
#include<string.h>
#define true 1
#define false 0
typedef unsigned int bool;
size_t testreadData( void *ptr, size_t size, size_t nmemb)
char Buf[1024] = '\\0';
strncpy(Buf,ptr,1024);
printf("============================get data============================");
printf("%s\\n",Buf);
bool getUrl(char *filename)
CURL *curl;
CURLcode res;
FILE *fp;
if ((fp = fopen(filename, "w")) == NULL) // 返回结果用文件存储
return false;
struct curl_slist *headers = NULL;
headers = curl_slist_append(headers, "Accept: Agent-007");
curl = curl_easy_init(); // 初始化
if (curl)
//curl_easy_setopt(curl, CURLOPT_PROXY, "10.99.60.201:8080");// 代理
curl_easy_setopt(curl, CURLOPT_HTTPHEADER, headers);// 改协议头
curl_easy_setopt(curl, CURLOPT_URL,"http://www.baidu.com");
curl_easy_setopt(curl, CURLOPT_WRITEFUNCTION, testreadData);
// curl_easy_setopt(curl, CURLOPT_WRITEDATA, fp); //将返回的http头输出到fp指向的文件
// curl_easy_setopt(curl, CURLOPT_HEADERDATA, fp); //将返回的html主体数据输出到fp指向的文件
res = curl_easy_perform(curl); // 执行
if (res != 0)
curl_slist_free_all(headers);
curl_easy_cleanup(curl);
fclose(fp);
return true;
bool postUrl(char *filename)
CURL *curl;
CURLcode res;
FILE *fp;
if ((fp = fopen(filename, "w")) == NULL)
return false;
curl = curl_easy_init();
if (curl)
curl_easy_setopt(curl, CURLOPT_COOKIEFILE, "/tmp/cookie.txt"); // 指定cookie文件
curl_easy_setopt(curl, CURLOPT_POSTFIELDS, "&logintype=uid&u=xieyan&psw=xxx86"); // 指定post内容
//curl_easy_setopt(curl, CURLOPT_PROXY, "10.99.60.201:8080");
curl_easy_setopt(curl, CURLOPT_URL, " http://mail.sina.com.cn/cgi-bin/login.cgi "); // 指定url
curl_easy_setopt(curl, CURLOPT_WRITEDATA, fp);
res = curl_easy_perform(curl);
curl_easy_cleanup(curl);
fclose(fp);
return true;
int main(void)
getUrl("/tmp/get.html");
postUrl("/tmp/post.html");
该代码作用是访问百度主页并将读取到的数据存在数组中,可以自己更改大小
安装
下载好包之后,打开Linux,随便建一个文件夹,放进共享文件夹,然后cp /mnt/hgfs/xxx .
把文件拷贝过来,用tar xvf xxx
解压
怎么去看呢,进入解压后的文件,vi README
一步步看
那么怎去配置库呢:跟着走
./configure
./configure --prefix=$PWD/_install
这个是安装再当前路径,生成一个_install文件夹,默认用gcc
然后make
./configure --prefix=$PWD/_install --host=arm-linux
这个是给arm平台安装,使用的是arm-libxxx-gcc
上一步不是必须的!!
下一步:
make install
这时就生成了_install,神奇!
这时cd进去,进入bin,但是我们不用
我们用头文件inlcude ,所以我们编译使用的时候就需要链库了,具体怎么链库,可以查看:库介绍文档.
库的名字就在cd lib
里面
使用时:前面加个 #include <curl/curl.h>
编程
#include <stdio.h>
#include <curl/curl.h>
#define true 1
#define false 0
typedef unsigned int bool;
//都是为了解决c语言不知处true bool等
bool getUrl(char *filename)
CURL *curl;
CURLcode res;
FILE *fp;
if ((fp = fopen(filename, "w")) == NULL) // 返回结果用文件存储
return false;
struct curl_slist *headers = NULL;
headers = curl_slist_append(headers, "Accept: Agent-007");
curl = curl_easy_init(); // 初始化
if (curl)
//curl_easy_setopt(curl, CURLOPT_PROXY, "10.99.60.201:8080");// 代理
curl_easy_setopt(curl, CURLOPT_HTTPHEADER, headers);// 改协议头
curl_easy_setopt(curl, CURLOPT_URL,"http://www.baidu.com");
curl_easy_setopt(curl, CURLOPT_WRITEDATA, fp); //将返回的http头输出到fp指向的文件
curl_easy_setopt(curl, CURLOPT_HEADERDATA, fp); //将返回的html主体数据输出到fp指向的文件
res = curl_easy_perform(curl); // 执行
if (res != 0)
curl_slist_free_all(headers);
curl_easy_cleanup(curl);//释放相关句柄
fclose(fp);
return true;
bool postUrl(char *filename)
CURL *curl;
CURLcode res;
FILE *fp;
if ((fp = fopen(filename, "w")) == NULL)
return false;
curl = curl_easy_init();//初始化句柄
if (curl)
curl_easy_setopt(curl, CURLOPT_COOKIEFILE, "/tmp/cookie.txt"); // 指定cookie文件
curl_easy_setopt(curl, CURLOPT_POSTFIELDS, "&logintype=uid&u=xieyan&psw=xxx86"); // 指定post内容,需要指定相关字段
//curl_easy_setopt(curl, CURLOPT_PROXY, "10.99.60.201:8080");
curl_easy_setopt(curl, CURLOPT_URL, " http://mail.sina.com.cn/cgi-bin/login.cgi "); // 指定url
curl_easy_setopt(curl, CURLOPT_WRITEDATA, fp);
res = curl_easy_perform(curl);
curl_easy_cleanup(curl);
fclose(fp);
return true;
int main(void)
getUrl("/tmp/get.html");
postUrl("/tmp/post.html");//俩个文件都在根目录哦
注意:
bool在C语言是不支持的,解决方法在代码前面
注意的小TIPS
链头文件用.I,链库用.L
我们编译,返现头文件并不认识,原因就是Linux库并没有引入,需要链头文件,链头文件是-I 不是-L哦 还需要-lcurl,但是发现还是不对!
gcc demo1.c -I ./curl-7.71.1/_install/include/ -L ./curl-7.71.1/_install/lib/ -lcurl
c文件 指定头文件位置 指定库位置 动态库
因为在链库的时候,Linux会默认去/dev下面找,所以肯定找不到我们需要的库,那么怎么办呢?
所以在链库的时候还需要-L后面加上我们需要链的库的路径,然后再-lcurl
但是还有问题! 所以不得不我们需要配置一下环境变量—》
制作临时环境变量:export LD_LIBRARY_PATH=./curl-7.71.1/_install/lib/
(动态库位置)
可以用export |grep LIB
查看
以上是关于Libcurl库——HTTP协议实现的主要内容,如果未能解决你的问题,请参考以下文章
c用libcurl库实现https下get/post网络通信
Linux下使用libcurl实现FTP单个文件上传下载功能