php正则获取网页内容匹配不出内容

正解：

第一步：

设好对方网页编码

header("Content-type:text/html;charset=GB2312");

第二步：

获取网页内容

$url = "https://www.tupianzj.com/meinv/20200713/213744.html";
$curl = new Curl();
$html = $curl->get($url);

第三步：

需要先去除所有的换行符、制表符、回车等等，对于便于阅读的html源文件由于上述符号的存在会造成无法匹配。

$html=preg_replace("/[\t\n\r]+/","",$html);//去空格
$page_preg = '/<div\sclass="pages">(.*)<\/ul>/i';//获取分页链接
if(preg_match_all($page_preg,$html,$page)){
pr($page);
}else{
echo "0";
}

本博客所有文章如无特别注明均为原创。
复制或转载请以超链接形式注明转自起风了，原文地址《php正则获取网页内容匹配不出内容》