更多>>关于我们
西安鲲之鹏网络信息技术有限公司从2010年开始专注于Web(网站)数据抓取领域。致力于为广大中国客户提供准确、快捷的数据采集相关服务。我们采用分布式系统架构,日采集网页数千万。我们拥有海量稳定高匿HTTP代理IP地址池,可以有效获取互联网任何公开可见信息。
您只需告诉我们您想抓取的网站是什么,您感兴趣的字段有哪些,你需要的数据是哪种格式,我们将为您做所有的工作,最后把数据(或程序)交付给你。
数据的格式可以是CSV、JSON、XML、ACCESS、SQLITE、MSSQL、MYSQL等等。
更多>>技术文章
-
西安鲲之鹏
发布时间:2016-05-24 15:46:38
Python Prompt Toolkit - prompt_toolkit is a library for building powerful interactive command lines and terminal applications in Python. >>> http://t.cn/R5Zoln2
-
西安鲲之鹏
发布时间:2016-05-24 15:21:55
Pygments - A generic syntax highlighter suitable for use in code hosting, forums, wikis or other applications that need to prettify source code. >>> http://t.cn/amUp8L -
西安鲲之鹏
发布时间:2016-05-11 12:22:33
如果用Python的json模块解析“懒JSON”?先看一个“懒JSON”的例子: {name:"真善道牌蜂铬苦瓜软胶囊",company:"国食健字G20110688",Id:"11174"},需要先将其转为标准的JSON然后才能正确解析。对,就是借助强大的正则表达式 >>> http://t.cn/RqB4YsY -
西安鲲之鹏
发布时间:2016-05-09 11:20:27
-
西安鲲之鹏
发布时间:2016-05-04 15:03:47
Conversion of strings like \\uXXXX in python: >>> print u'\\u0e4f\\u032f\\u0361\\u0e4f'.decode('unicode-escape') >>> http://t.cn/RqQ8mp1 -
西安鲲之鹏
发布时间:2016-04-27 09:01:20
百度糯米(nuomi.com)美食、休闲娱乐、生活服务、酒店、本地生活、丽人全国商户数据117万条(2016年3月更新) >>> http://t.cn/RqWKb1b -
西安鲲之鹏
发布时间:2016-04-27 09:01:02
美团网(meituan.com)美食、休闲娱乐、生活服务、旅游、摄影写真、丽人、亲子全国商户数据171万(2016年3月更新) >>> http://t.cn/RqWKbhp -
西安鲲之鹏
发布时间:2016-04-21 10:55:04
绕过百度地图API的调用次数限制({"status":302,"message":"天配额超限,限制访问"})的方法 >>> http://t.cn/RqCz0iu -
西安鲲之鹏
发布时间:2016-04-19 08:44:11
-
西安鲲之鹏
发布时间:2016-04-18 15:46:47
Visual Studio Code + Python插件 很赞,代码文件路径不要含有中文,否则编译启动不了,提示找不到文件之类怪异错误。 >>> http://t.cn/Rqo0VSp
-
西安鲲之鹏
发布时间:2016-04-18 10:47:34
-
西安鲲之鹏
发布时间:2016-04-18 09:05:32
Navicat for MySQL的数据库连接参数在哪儿存储着? Windows版在注册表HKEY_CURRENT_USER/Software/PremiumSoft/Navicat位置。 >>> http://t.cn/RqoA9BB -
西安鲲之鹏
发布时间:2016-04-08 12:50:31
How to change one(more) MongoDB field(s) from int into string? >>> http://t.cn/zTqDltw