cURL是一个利用URL语法在命令行下工作的文件传输工具,cURL支持的通信协议有FTP、FTPS、HTTP、HTTPS、等,并且还支持SSL认证、HTTP POST、HTTP PUT、FTP上传。最让人高兴的是,PHP也支持 CURL 库,利用cURL库编写的脚本,可以通过一个网址的链接抓取一个指定的页面内容,并分析得到你想要的数据了。
cURL使用步骤
1,初始化
curl_init()
2、设置属性
curl_setopt().
有一长串CURL 参数可供设置,它们能指定URL请求的各个细节。具体参数,请查看文未的附录
3,执行并获取结果
curl_exec()
4,释放句柄
curl_close()
PHP CURL实现GET请求
发送GET请求的关键是拼装格式正确的URL。请求地址和GET数据由一个“?”分割,然后GET变量的名称和值用“=”分隔,各个GET名称和值由“&”连接。PHP为我们提供了一个函数专门用来拼装GET请求和数据部分——http_build_query,该函数接受一个关联数组,返回由该关联数据描述的GET请求字符串。
示例代码:
$data = array( "username" => "coder", "password" => "12345" ); $url = 'http://www.freexyz.cn'; //初始化 $ch = curl_init(); //设置选项,包括URL $url = $url.'?'.http_bulid_query($data); curl_setopt($ch, CURLOPT_URL, $url); curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1); curl_setopt($ch, CURLOPT_HEADER, 0); //执行并获取HTML文档内容 $output = curl_exec($ch); //释放curl句柄 curl_close($ch); //打印获得的数据 print_r($output);
PHP CURL实现POST请求
可以使用CURL提供的选项CURLOPT_POSTFIELDS,设置该选项为POST字符串数据就可以把请求放在正文中。同样我们实现了一个发送POST请求的函数
示例代码
$url = "http://www.freexyz.cn/s.php"; $post_data = array ("username" => "bob","key" => "12345"); $ch = curl_init(); curl_setopt($ch, CURLOPT_URL, $url); curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1); // post数据 curl_setopt($ch, CURLOPT_POST, 1); // post的变量 curl_setopt($ch, CURLOPT_POSTFIELDS, $post_data); $output = curl_exec($ch); curl_close($ch); //打印获得的数据 print_r($output);
PHP cURL封装函数代码
//参数1:访问的URL,参数2:post数据(不填则为GET),参数3:提交的$cookies,参数4:是否返回$cookies function curl_request($url,$post='',$cookie='', $returnCookie=0){ $curl = curl_init(); curl_setopt($curl, CURLOPT_URL, $url); curl_setopt($curl, CURLOPT_USERAGENT, 'Mozilla/5.0 (compatible; MSIE 10.0; Windows NT 6.1; Trident/6.0)'); curl_setopt($curl, CURLOPT_FOLLOWLOCATION, 1); curl_setopt($curl, CURLOPT_AUTOREFERER, 1); curl_setopt($curl, CURLOPT_REFERER, "http://XXX"); if($post) { curl_setopt($curl, CURLOPT_POST, 1); curl_setopt($curl, CURLOPT_POSTFIELDS, http_build_query($post)); } if($cookie) { curl_setopt($curl, CURLOPT_COOKIE, $cookie); } curl_setopt($curl, CURLOPT_HEADER, $returnCookie); curl_setopt($curl, CURLOPT_TIMEOUT, 10); curl_setopt($curl, CURLOPT_RETURNTRANSFER, 1); $data = curl_exec($curl); if (curl_errno($curl)) { return curl_error($curl); } curl_close($curl); if($returnCookie){ list($header, $body) = explode("rnrn", $data, 2); preg_match_all("/Set-Cookie:([^;]*);/", $header, $matches); $info['cookie'] = substr($matches[1][0], 1); $info['content'] = $body; return $info; }else{ return $data; } }
补充说明:
如果使用cURL获取的数据为 json格式的,可以使用 json_decode()函数转化成数组
$array = json_decode($data,true);
注意:json_decode()函数中第个参数不填写的化,会把 json 转成对象的形式,如果填写则转为数组。
关于json_decode()函数的用法,可以参考本站的相关文章。
附录:关于 curl_setopt() 中的参数介绍
CURLOPT_NOBODY: //如果你不想在输出中包含body部分,设置这个选项为一个非零值。 CURLOPT_FAILONERROR: //如果你想让PHP在发生错误(HTTP代码返回大于等于300)时,不显示,设置这个选项为一人非零值。默认行为是返回一个正常页,忽略代码。 CURLOPT_INFILESIZE: //当你上传一个文件到远程站点,这个选项告诉PHP你上传文件的大小。 CURLOPT_VERBOSE: //如果你想CURL报告每一件意外的事情,设置这个选项为一个非零值。 CURLOPT_HEADER: //如果你想把一个头包含在输出中,设置这个选项为一个非零值。 CURLOPT_NOPROGRESS: //如果你不会PHP为CURL传输显示一个进程条,设置这个选项为一个非零值。 //注意:PHP自动设置这个选项为非零值,你应该仅仅为了调试的目的来改变这个选项。 CURLOPT_UPLOAD: //如果你想让PHP为上传做准备,设置这个选项为一个非零值。 CURLOPT_POST: //如果你想PHP去做一个正规的HTTP POST,设置这个选项为一个非零值。这个POST是普通的 application/x-www-from-urlencoded 类型,多数被HTML表单使用 CURLOPT_FTPLISTONLY: //设置这个选项为非零值,PHP将列出FTP的目录名列表。 CURLOPT_FTPAPPEND: //设置这个选项为一个非零值,PHP将应用远程文件代替覆盖它。 CURLOPT_NETRC: //设置这个选项为一个非零值,PHP将在你的 ~./netrc 文件中查找你要建立连接的远程站点的用户名及密码。 CURLOPT_FOLLOWLOCATION: //设置这个选项为一个非零值(象 'Location: ')的头,服务器会把它当做HTTP头的一部分发送(注意这是递归的,PHP将发送形如 'Location: '的头)。 CURLOPT_RESUME_FROM: //传递一个包含字节偏移地址的长整形参数,(你想转移到的开始表单)。 CURLOPT_SSLVERSION: //传递一个包含SSL版本的长参数。默认PHP将被它自己努力的确定,在更多的安全中你必须手工设置。 CURLOPT_TIMECONDITION: //传递一个长参数,指定怎么处理CURLOPT_TIMEVALUE参数。你可以设置这个参数为TIMECOND_IFMODSINCE 或 TIMECOND_ISUNMODSINCE。这仅用于HTTP。 CURLOPT_TIMEVALUE: //传递一个从1970-1-1开始到现在的秒数。这个时间将被CURLOPT_TIMEVALUE选项作为指定值使用,或被默认TIMECOND_IFMODSINCE使用。 CURLOPT_PUT: //设置这个选项为一个非零值去用HTTP上传一个文件。要上传这个文件必须设置CURLOPT_INFILE和CURLOPT_INFILESIZE选项. CURLOPT_MUTE: //设置这个选项为一个非零值,PHP对于CURL函数将完全沉默。 CURLOPT_TIMEOUT: //设置一个长整形数,作为最大延续多少秒。 CURLOPT_LOW_SPEED_LIMIT: //设置一个长整形数,控制传送多少字节。 CURLOPT_LOW_SPEED_TIME: //设置一个长整形数,控制多少秒传送CURLOPT_LOW_SPEED_LIMIT规定的字节数。 //下列选项的值将被作为字符串: CURLOPT_URL: //这是你想用PHP取回的URL地址。你也可以在用curl_init()函数初始化时设置这个选项。 CURLOPT_USERPWD: //传递一个形如[username]:[password]风格的字符串,作用PHP去连接。 CURLOPT_PROXYUSERPWD: //传递一个形如[username]:[password] 格式的字符串去连接HTTP代理。 CURLOPT_RANGE: //传递一个你想指定的范围。它应该是'X-Y'格式,X或Y是被除外的。HTTP传送同样支持几个间隔,用逗句来分隔(X-Y,N-M)。 CURLOPT_POSTFIELDS: //传递一个作为HTTP “POST”操作的所有数据的字符串。 CURLOPT_REFERER: //在HTTP请求中包含一个'referer'头的字符串。 CURLOPT_USERAGENT: //在HTTP请求中包含一个'user-agent'头的字符串。 CURLOPT_FTPPORT: //传递一个包含被ftp 'POST'指令使用的IP地址。这个POST指令告诉远程服务器去连接我们指定的IP地址。 这个字符串可以是一个IP地址,一个主机名,一个网络界面名(在UNIX下),或是‘-'(使用系统默认IP地址)。 CURLOPT_COOKIE: //传递一个包含HTTP cookie的头连接。 CURLOPT_SSLCERT: //传递一个包含PEM格式证书的字符串。 CURLOPT_SSLCERTPASSWD: //传递一个包含使用CURLOPT_SSLCERT证书必需的密码。 CURLOPT_COOKIEFILE: //传递一个包含cookie数据的文件的名字的字符串。这个cookie文件可以是Netscape格式,或是堆存在文件中的HTTP风格的头。 CURLOPT_CUSTOMREQUEST: //当进行HTTP请求时,传递一个字符被GET或HEAD使用。为进行DELETE或其它操作是有益的 //注意: 在确认你的服务器支持命令先不要去这样做。