更多>>关于我们
西安鲲之鹏网络信息技术有限公司从2010年开始专注于Web(网站)数据抓取领域。致力于为广大中国客户提供准确、快捷的数据采集相关服务。我们采用分布式系统架构,日采集网页数千万。我们拥有海量稳定高匿HTTP代理IP地址池,可以有效获取互联网任何公开可见信息。
您只需告诉我们您想抓取的网站是什么,您感兴趣的字段有哪些,你需要的数据是哪种格式,我们将为您做所有的工作,最后把数据(或程序)交付给你。
数据的格式可以是CSV、JSON、XML、ACCESS、SQLITE、MSSQL、MYSQL等等。
更多>>技术文章
- 在多网络接口(IP)环境下Squid,Tinyproxy和DeleGate如何 [2018-04-25]
- 百度指数最新采集方案(201804)演示 [2018-04-16]
- 腾讯宜出行数据无人值守抓取 [2018-03-06]
- Linux下word批量转text [2017-10-26]
- 如何采集淘宝(口碑)外卖的数据 [2017-09-26]
- 利用Fiddler2的Custom Rules自动抓取App的TOKEN并记录到 [2017-08-10]
- 解决"中国裁判文书网"App加密过程 [2017-07-03]
- 如何使用SPSS查看大CSV文件(超过100万行)? [2017-02-08]
- 如何抓取微信小程序的数据? [2017-01-16]
- squid external_acl_type介绍及后台程序编写示例 [2016-10-17]
- 用Python脚本打造Squid权限认证后端程序以及Squid [2016-10-12]
- 欣欣同业助手App加密算法分析与解决 [2016-09-24]
- 如何从详情页获取淘宝/天猫商品的分类? [2016-09-10]
- "Selenium + Chrome Diver"使用带用户名密码认证的 [2016-08-03]
- 案例分析:如何快速分析淘宝/天猫店的销售情况 [2016-07-22]
- 在PC端测试移动端网站 [2016-07-18]
- 如何根据商品条码查询商品名称和价格信息? [2016-07-15]
- django_web_proxy(鲲鹏开源HTTP代理系统)介绍 [2016-06-18]
- CentOS Squid3 "WARNING! Your cache is running out of filede [2016-06-17]
- Android安装Fiddler证书抓取App的HTTPS流量 [2016-05-09]
- 如何绕过百度地图API的调用次数限制? [2016-04-21]
- 如何抓取基于Flex技术的网站 [2016-04-18]
- [携程网]全国所有城市酒店数据(含经纬度及各房 [2016-03-24]
- 国内知名本地生活信息平台所有商户历史评论数 [2016-02-22]
- 国内知名本地生活信息平台3648万商户数据2017年 [2016-01-22]
- 2016携程网酒店价格采集方案演示 [2016-01-15]
- Squid配置技巧二则 - 限制多媒体下载 & 限制I [2016-01-08]
- 爬虫应慎用“轮换UA”策略 [2015-12-31]
- 2015年阿里巴巴1688.com实名供应商数据(含联系方 [2015-12-27]
- 淘宝天猫成交记录评论采集方案 [2015-12-23]
- 如何动态添加MAC地址可定义的虚拟网卡? [2015-12-17]
- DNSPod API + Cron实现动态域名解析(DDNS) [2015-12-11]
- Haproxy健康检测机制测试 [2015-12-09]
- 2015年12月份新版百度指数最新采集方案 [2015-12-07]
- nginx可以做二级代理转发吗? [2015-12-04]
- 让代理服务器支持HTTPS很难吗? [2015-12-03]
- 如何正确计算某个“日期时间”对应的时间戳? [2015-11-19]
- Python中连接HTTPS网站如何强制使用TLSv1协议 [2015-11-17]
- 美团网(meituan.com)美食、休闲娱乐、生活服务、旅 [2015-11-09]
- 饿了么(ele.me)2015年11月最新全国餐馆(35.7万),菜单 [2015-11-01]