php数据可以爬取吗 php能做爬虫吗

php如何爬取天猫和淘宝商品数据

直接用Curl就行，具体爬取的数据可以穿参查看结果，方法不区分淘宝和天猫链接，但是前提是必须是PC端链接，另外正则写的不规范，所以可以自己重写正则来匹配数据。

贡山网站建设公司创新互联,贡山网站设计制作，有大型网站制作公司丰富经验。已为贡山1000多家提供企业网站建设服务。企业网站搭建\成都外贸网站制作要多少钱，请找那个售后服务好的贡山做网站的公司定做！

php怎么抓取其它网站数据

可以用以下4个方法来抓取网站的数据：

1. 用 file_get_contents 以 get 方式获取内容：

$url = '';

$html = file_get_contents($url);

echo $html;

2. 用fopen打开url，以get方式获取内容

$url = '';

$fp = fopen($url, 'r');

stream_get_meta_data($fp);

$result = '';

while(!feof($fp))

{

$result .= fgets($fp, 1024);

}

echo "url body: $result";

fclose($fp);

3. 用file_get_contents函数,以post方式获取url

$data = array(

'foo'='bar',

'baz'='boom',

'site'='',

'name'='nowa magic');

$data = http_build_query($data);

//$postdata = http_build_query($data);

$options = array(

'http' = array(

'method' = 'POST',

'header' = 'Content-type:application/x-www-form-urlencoded',

'content' = $data

//'timeout' = 60 * 60 // 超时时间（单位:s）

)

);

$url = "";

$context = stream_context_create($options);

$result = file_get_contents($url, false, $context);

echo $result;

4、使用curl库，使用curl库之前，可能需要查看一下php.ini是否已经打开了curl扩展

$url = '';

$ch = curl_init();

$timeout = 5;

curl_setopt ($ch, CURLOPT_URL, $url);

curl_setopt ($ch, CURLOPT_RETURNTRANSFER, 1);

curl_setopt ($ch, CURLOPT_CONNECTTIMEOUT, $timeout);

$file_contents = curl_exec($ch);

curl_close($ch);

echo $file_contents;

php实现网络爬虫

只要包含网络和字符串处理功能的编程语言理论上都可以写爬虫，所以PHP当然完全没问题。如何用PHP写爬虫的前提是你要先调研清楚爬什么内容。这需要你针对要爬取目标做好充分的测试和准备工作，否则会浪费很多时间。

比如一个简单的“传统型”网站，那真的只需要用file_get_contents函数加正则就能搞定。觉的正则匹配数据太麻烦可以上xpath。如果站点有了频率和IP限制，这时就要额外准备好代理IP池了。当发现抓取内容是JS渲染的，可能要考虑引入headlessbrowser这种技术的PHP扩展了。对爬取效率有了要求后，多线程，抓取和解析分离，分布式也是要考虑的了。。。

回到问题本身如何写的问题，我个人觉得爬虫是个定制化比较高的业务需求，需要根据具体的场景来规划。如果是要写一个能解决所有爬虫场景的，那就不用自己写了，成熟的开源软件拿来直接用就行了。非要写的话可以直接参考这些成熟的软件，自己可以少踩很多坑。

php的curl怎么爬取网页内容

创建一个新cURL资源

设置URL和相应的选项

抓取URL并把它传递给浏览器

关闭cURL资源，并且释放系统资源

代码案例：

文章标题：php数据可以爬取吗 php能做爬虫吗
文章起源：http://cdiso.cn/article/ddghgpd.html

php数据可以爬取吗 php能做爬虫吗

php如何爬取天猫和淘宝商品数据

php怎么抓取其它网站数据

php实现网络爬虫

php的curl怎么爬取网页内容

其他资讯