这篇文章将为大家详细讲解有关使用PHP怎么实现抓取小说网站内容功能,文章内容质量较高,因此小编分享给大家做个参考,希望大家阅读完这篇文章后对相关知识有一定的了解。
目前创新互联已为超过千家的企业提供了网站建设、域名、虚拟主机、绵阳服务器托管、企业网站设计、浮山网站维护等服务,公司将坚持客户导向、应用为本的策略,正道将秉承"和谐、参与、激情"的文化,与客户和合作伙伴齐心协力一起成长,共同发展。具体如下:
ini_set('user_agent','Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 5.1; .NET CLR 2.0.50727; .NET CLR 3.0.04506.30; GreenBrowser)'); ini_set('max_execution_time', '0'); $base = 'https://www.qu.la/book/19434/'; $start = '7504808.html'; $content_grep = '/ (.*)<br\/>/'; //$content_grep = '/<div id="content">(.*)<br\/>/sS'; $next_grep = '/<a id="pager_next" href=\"(\d+\.html)\" target="_top" class="next">下一章<\/a>/'; $next = $start; $file_name = '听书了.txt'; while($next) { echo 'getting ' . $next . PHP_EOL; $result = file_get_contents($base . $next); preg_match_all($content_grep, $result, $match); $isTitle = true; $content = ""; foreach($match[1] as $line) { $line = str_replace("<br/>", '', $line); $line = str_replace(" ", '', $line); if($isTitle) { $content = $line . PHP_EOL . PHP_EOL; $isTitle = false; } else { $content .= ' ' . $line . PHP_EOL . PHP_EOL; } } $file = fopen($file_name, 'a'); echo 'write length: ' . strlen($content) . PHP_EOL; fwrite($file, $content); fclose($file); echo '.'; preg_match($next_grep, $result, $match); $next = $match[1]; }
php的框架:1、Laravel,Laravel是一款免费并且开源的PHP应用框架。2、Phalcon,Phalcon是运行速度最快的一个PHP框架。3、Symfony,Symfony是一款为Web项目准备的PHP框架。4、Yii,Yii是一款快速、安全和专业的PHP框架。5、CodeIgniter,CodeIgniter是一款非常敏捷的开源PHP框架。6、CakePHP,CakePHP是一款老牌的PHP框架。7.Kohana,Kohana是一款敏捷但是功能强大的PHP框架。
关于使用PHP怎么实现抓取小说网站内容功能就分享到这里了,希望以上内容可以对大家有一定的帮助,可以学到更多知识。如果觉得文章不错,可以把它分享出去让更多的人看到。
分享标题:使用PHP怎么实现抓取小说网站内容功能-创新互联
当前网址:/article12/ddchdc.html
成都网站建设公司_创新互联,为您提供自适应网站、搜索引擎优化、标签优化、品牌网站建设、网站设计、App开发
声明:本网站发布的内容(图片、视频和文字)以用户投稿、用户转载内容为主,如果涉及侵权请尽快告知,我们将会在第一时间删除。文章观点不代表本网站立场,如需处理请联系客服。电话:028-86922220;邮箱:631063699@qq.com。内容未经允许不得转载,或转载时需注明来源: 创新互联