更多>>关于我们
西安鲲之鹏网络信息技术有限公司从2010年开始专注于Web(网站)数据抓取领域。致力于为广大中国客户提供准确、快捷的数据采集相关服务。我们采用分布式系统架构,日采集网页数千万。我们拥有海量稳定高匿HTTP代理IP地址池,可以有效获取互联网任何公开可见信息。
您只需告诉我们您想抓取的网站是什么,您感兴趣的字段有哪些,你需要的数据是哪种格式,我们将为您做所有的工作,最后把数据(或程序)交付给你。
数据的格式可以是CSV、JSON、XML、ACCESS、SQLITE、MSSQL、MYSQL等等。
更多>>技术文章
-
西安鲲之鹏
发布时间:2015-11-17 11:20:42
新服务器Apache一直报403错误(配置文件和另一台服务器一样,那台工作的很好),很诡异。后来发现原来我安装的是Apache2.4版本,和Apache2.2版本在Access control配置上不同。Upgrading to 2.4 from 2.2 >>> http://t.cn/zOyDOvI
-
西安鲲之鹏
发布时间:2015-11-14 17:23:01
Web服务器是如何判断带有Body的HTTP请求结束的? 1)接收到数据长度和Content-Length值一致时;2)使用组块(chunked)时,接收到size为0的chunked时; 那Web客户端是如何判断Web服务器发送HTTP应答结束的呢? 除了上述两个方法,还可以根据3)服务端关闭了TCP连接。 http://t.cn/RUYnquQ
-
西安鲲之鹏
发布时间:2015-11-14 16:57:27
-
西安鲲之鹏
发布时间:2015-11-12 15:16:53
curl用代理:curl -x username:password@proxy-host:port “http://t.cn/RAlE36B ”。 wget用代理:wget -e "http_proxy=http://username:password@proxy-host:port" “http://t.cn/RAlE36B ”。更多用法 >>> http://t.cn/RUWE7Dq -
西安鲲之鹏
发布时间:2015-11-09 19:24:56
-
西安鲲之鹏
发布时间:2015-11-01 18:17:05
-
西安鲲之鹏
发布时间:2015-10-25 18:32:46
鲲鹏动态稳定高匿HTTP代理演示截图(下面是我们所做的一个测试的截图,在Python中使用鲲鹏动态HTTP代理访问http://t.cn/Rhklnf9。可以看到客户端发出的每次请求,出口IP都是不同的,并在不同国家中随机的进行切换。) >>> http://t.cn/RUPwdFr 有了鲲鹏动态IP代理,妈妈再也不担心网站封我IP啦!
-
西安鲲之鹏
发布时间:2015-10-21 15:00:14
鲲鹏动态稳定高匿HTTP代理介绍:超大IP池(IP总量超过10万个,并且会不断增加新IP),IP遍及世界众多国家。无需安装任何客户端,只用设置一个代理,后端IP自动随机切换,100%兼容任何浏览器或支持代理的软件。非网上免费的野代理, 服务器有专人维护,稳定性有保障! >>> http://t.cn/RUPwdFr
-
西安鲲之鹏
发布时间:2015-10-16 12:02:25
猫途鹰(tripadvisor.cn/)美国地区的酒店、景点、餐厅数据(82万条) >>> http://t.cn/Ryrt9w4 -
西安鲲之鹏
发布时间:2015-10-14 11:07:33
-
西安鲲之鹏
发布时间:2015-09-06 16:33:17