纵有疾风起
人生不言弃

php正则获取网页内容匹配不出内容

正解:

第一步:

设好对方网页编码

header(“Content-type:text/html;charset=GB2312”);

第二步:

获取网页内容

$url = “https://www.tupianzj.com/meinv/20200713/213744.html”;
$curl = new Curl();
$html = $curl->get($url);

第三步:

需要先去除所有的换行符、制表符、回车等等,对于便于阅读的html源文件由于上述符号的存在会造成无法匹配。

$html=preg_replace(“/[\t\n\r]+/”,””,$html);//去空格
$page_preg = ‘/<div\sclass=”pages”>(.*)<\/ul>/i’;//获取分页链接
if(preg_match_all($page_preg,$html,$page)){
pr($page);
}else{
echo “0”;
}

 

未经允许不得转载:起风网 » php正则获取网页内容匹配不出内容
分享到: 生成海报

评论 抢沙发

评论前必须登录!

立即登录