需求描述:
检测给定url是否是404页面。
方式一:
使用file_get_contents
函数,可以读取web中的网页或者文件。如果遇到404页面,则会返回false,否则返回相应的网页内容。
使用该函数有两点需要注意:
1、file_get_contents
在读取不存在的页面时,会报一个warning,所以最好对这里的警告进行屏蔽操作。
2、file_get_contents
默认会读取页面的所有内容,然后再返回。为了提交读取速度,我们可以限制只读取10个字节就返回。
$res = @file_get_contents("http://www.bAIdu.com",null,null,0,10); if($res){ echo $res; }else{ echo "404"; }
方式二:
我们要判断该页面是否是404页面,这个可以通过网页返回的状态码来判断。
使用该方法在页面404的时候并不会报警告。因为我们只需要状态码,所以我们不需要读取网页的内容,可以通过设置CURLOPT_NOBODY
参数,不读取网页内容,来缩短程序运行的时间。
$ch = curl_init("http://www.baidu.com"); curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1); curl_setopt($ch, CURLOPT_FOLLOWLOCATION, 1); curl_setopt($ch, CURLOPT_NOBODY, 1); $res = curl_exec($ch); $code = curl_getinfo($ch,CURLINFO_HTTP_CODE); if($code == 404){ echo "404"; }else{ echo $code; }