更多>>关于我们
西安鲲之鹏网络信息技术有限公司从2010年开始专注于Web(网站)数据抓取领域。致力于为广大中国客户提供准确、快捷的数据采集相关服务。我们采用分布式系统架构,日采集网页数千万。我们拥有海量稳定高匿HTTP代理IP地址池,可以有效获取互联网任何公开可见信息。
您只需告诉我们您想抓取的网站是什么,您感兴趣的字段有哪些,你需要的数据是哪种格式,我们将为您做所有的工作,最后把数据(或程序)交付给你。
数据的格式可以是CSV、JSON、XML、ACCESS、SQLITE、MSSQL、MYSQL等等。
更多>>技术文章
腾讯微生活是一个全新专注生活电子商务与O2O(Online To Offline)的解决方案,意在使更多线下与线上用户享受移动互联网的便捷,获得生活实惠和特权。它主要依靠腾讯强大的账号体系、PC与手机产品的入口,特别是手机产品微信、腾讯微博、手机QQ、QQ浏览器等,通过把微生活产品植入到各种产品平台中,为用户第一时间提供给力优惠,同时打通用户与企业之间的关系通道,帮助企业建立泛用户体系。 - 摘自百度百科:http://baike.baidu.com/view/9335334.htm
更新说明:
本次更新(2013年1月份)共采集数据约125万条,涵盖了全国所有省市的数据。
所有字段:
'name', 'navigation', 'category', 'province', 'city', 'address', 'phone', 'tags', 'products_recommended', 'hours', 'atmosphere', 'characteristics', 'parking', 'stars', 'taste_rating', 'environment_rating', 'service_rating', 'remarks_count', 'longitude', 'latitude', 'landmark', 'traffic', 'picture', 'url'
输出格式:
CSV(UTF-8编码)
查看在线示例数据:
http://db.site-digger.com/csv/6d65697368695f71715f636f6d5f666972737432303030/
示例数据截图: