更多>>关于我们
西安鲲之鹏网络信息技术有限公司从2010年开始专注于Web(网站)数据抓取领域。致力于为广大中国客户提供准确、快捷的数据采集相关服务。我们采用分布式系统架构,日采集网页数千万。我们拥有海量稳定高匿HTTP代理IP地址池,可以有效获取互联网任何公开可见信息。
您只需告诉我们您想抓取的网站是什么,您感兴趣的字段有哪些,你需要的数据是哪种格式,我们将为您做所有的工作,最后把数据(或程序)交付给你。
数据的格式可以是CSV、JSON、XML、ACCESS、SQLITE、MSSQL、MYSQL等等。
更多>>技术文章
-
西安鲲之鹏
发布时间:2016-07-13 11:11:51
【CURL如何指定出口IP】
curl --interface 104.243.141.116 http://t.cn/R5km3Id
{
"origin": "104.243.141.116"
}
-
西安鲲之鹏
发布时间:2016-07-11 09:25:44
-
西安鲲之鹏
发布时间:2016-06-17 23:33:56
CentOS Squid3 "WARNING! Your cache is running out of filedescriptors"问题解决 >>> http://t.cn/R5ojV2g -
西安鲲之鹏
发布时间:2016-06-07 11:23:29
How to modify an element of an array in MongoDB(如何修改MongoDB文档数组的一员)? >>> http://t.cn/R5cjRnE http://t.cn/R5cjRnm
-
西安鲲之鹏
发布时间:2016-06-07 08:17:47
Total number of characters that a Excel cell can contain: 32,767 characters >>> http://t.cn/R5cpqS3 -
西安鲲之鹏
发布时间:2016-05-24 16:03:36
HTTPie - CLI HTTP client, user-friendly curl replacement with intuitive UI, JSON support, syntax highlighting, wget-like downloads, extensions, etc. >>> http://t.cn/RLYw3IK