PHP curl模拟浏览器采集阿里巴巴的实现代码

ttx9n · 发表于 2011-4-20 23:12:11

都说阿里巴巴有不能采集和防采集的神话，今天就用张老师讲的Curl采集写了一个模拟浏览器的代码。没有不可能只有不去做，哈哈
复制代码代码如下:
<?php
set_time_limit(0);
function _rand() {
$length=26;
$chars = "0123456789abcdefghijklmnopqrstuvwxyz";
$max = strlen($chars) - 1;
mt_srand((double)microtime() * 1000000);
$string = '';
for($i = 0; $i < $length; $i++) {
$string .= $chars[mt_rand(0, $max)];
}
return $string;
}
$HTTP_SESSION=_rand();
$HTTP_SESSION;
$HTTP_Server="search.china.alibaba.com";
$HTTP_URL="/company/k-%CB%AE%CB%AE%CB%AE_n-y.html";
$ch = curl_init();
curl_setopt ($ch,CURLOPT_URL,"http://".$HTTP_Server.$HTTP_URL);
curl_setopt($ch,CURLOPT_RETURNTRANSFER,true);
curl_setopt($ch,CURLOPT_USERAGENT,"Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; .NET CLR 1.1.4322; .NET CLR 2.0.50727)");
$res = curl_exec($ch);
curl_close ($ch);
print_r($res);
?>

小伙伴 · 发表于 2022-8-9 00:31:31

感谢楼主分享

3mfwk4yf · 发表于 2022-8-21 17:48:35

搞个免费的用用

v3sfsi · 发表于 2022-9-16 01:52:20

为全额万千瓦

adm1n · 发表于 2022-9-17 09:57:51

抽根烟，下来看看再说

fiyeid · 发表于 2022-11-15 13:00:59

论坛有你更精彩！

白狐软件 · 发表于 2023-5-28 11:43:52

建军节建军节建军节建军节

uj9lpc · 发表于 2023-8-15 20:48:01

而非为吾问无为谓娃娃

e5plu · 发表于 2023-8-16 19:11:44

数据库了多久撒快乐的健身卡啦

溪谷玉贤 · 发表于 2023-10-31 22:03:58

强烈支持楼主ing……

账号		自动登录	找回密码
密码			立即注册

[PHP编程] PHP curl模拟浏览器采集阿里巴巴的实现代码

相关帖子