更多>>关于我们
西安鲲之鹏网络信息技术有限公司从2010年开始专注于Web(网站)数据抓取领域。致力于为广大中国客户提供准确、快捷的数据采集相关服务。我们采用分布式系统架构,日采集网页数千万。我们拥有海量稳定高匿HTTP代理IP地址池,可以有效获取互联网任何公开可见信息。
您只需告诉我们您想抓取的网站是什么,您感兴趣的字段有哪些,你需要的数据是哪种格式,我们将为您做所有的工作,最后把数据(或程序)交付给你。
数据的格式可以是CSV、JSON、XML、ACCESS、SQLITE、MSSQL、MYSQL等等。
更多>>技术文章
-
西安鲲之鹏
发布时间:2016-06-17 23:33:56
CentOS Squid3 "WARNING! Your cache is running out of filedescriptors"问题解决 >>> http://t.cn/R5ojV2g -
西安鲲之鹏
发布时间:2016-06-07 11:23:29
How to modify an element of an array in MongoDB(如何修改MongoDB文档数组的一员)? >>> http://t.cn/R5cjRnE http://t.cn/R5cjRnm
-
西安鲲之鹏
发布时间:2016-06-07 08:17:47
Total number of characters that a Excel cell can contain: 32,767 characters >>> http://t.cn/R5cpqS3 -
西安鲲之鹏
发布时间:2016-05-24 16:03:36
HTTPie - CLI HTTP client, user-friendly curl replacement with intuitive UI, JSON support, syntax highlighting, wget-like downloads, extensions, etc. >>> http://t.cn/RLYw3IK
-
西安鲲之鹏
发布时间:2016-05-24 15:46:38
Python Prompt Toolkit - prompt_toolkit is a library for building powerful interactive command lines and terminal applications in Python. >>> http://t.cn/R5Zoln2
-
西安鲲之鹏
发布时间:2016-05-24 15:21:55
Pygments - A generic syntax highlighter suitable for use in code hosting, forums, wikis or other applications that need to prettify source code. >>> http://t.cn/amUp8L -
西安鲲之鹏
发布时间:2016-05-11 12:22:33
如果用Python的json模块解析“懒JSON”?先看一个“懒JSON”的例子: {name:"真善道牌蜂铬苦瓜软胶囊",company:"国食健字G20110688",Id:"11174"},需要先将其转为标准的JSON然后才能正确解析。对,就是借助强大的正则表达式 >>> http://t.cn/RqB4YsY -
西安鲲之鹏
发布时间:2016-05-09 11:20:27
-
西安鲲之鹏
发布时间:2016-05-04 15:03:47
Conversion of strings like \\uXXXX in python: >>> print u'\\u0e4f\\u032f\\u0361\\u0e4f'.decode('unicode-escape') >>> http://t.cn/RqQ8mp1 -
西安鲲之鹏
发布时间:2016-04-27 09:01:20
百度糯米(nuomi.com)美食、休闲娱乐、生活服务、酒店、本地生活、丽人全国商户数据117万条(2016年3月更新) >>> http://t.cn/RqWKb1b -
西安鲲之鹏
发布时间:2016-04-27 09:01:02
美团网(meituan.com)美食、休闲娱乐、生活服务、旅游、摄影写真、丽人、亲子全国商户数据171万(2016年3月更新) >>> http://t.cn/RqWKbhp