更多>>关于我们
西安鲲之鹏网络信息技术有限公司从2010年开始专注于Web(网站)数据抓取领域。致力于为广大中国客户提供准确、快捷的数据采集相关服务。我们采用分布式系统架构,日采集网页数千万。我们拥有海量稳定高匿HTTP代理IP地址池,可以有效获取互联网任何公开可见信息。
您只需告诉我们您想抓取的网站是什么,您感兴趣的字段有哪些,你需要的数据是哪种格式,我们将为您做所有的工作,最后把数据(或程序)交付给你。
数据的格式可以是CSV、JSON、XML、ACCESS、SQLITE、MSSQL、MYSQL等等。
更多>>技术文章
如何正确计算某个“日期时间”对应的时间戳?
发布时间:2015-11-19
例如我们要计算北京时间2015年10月30日0时0分0秒对应的时间戳。
先来回顾下时间戳的定义:Unix时间戳(Unix timestamp)定义为从格林威治时间1970年01月01日00时00分00秒起至现在的总秒数。
看似很简单,那么下面的这种计算是否正确呢?
>>> int((datetime(2015, 10, 30, 0, 0, 0) - datetime(1970, 1, 1, 0, 0, 0)).total_seconds()) 1446163200
是不是感觉没什么问题,那我们来验证一下:
>>> datetime.fromtimestamp(1446163200) datetime.datetime(2015, 10, 30, 8, 0)
是不是发现有问题了?!
那问题出在哪儿呢?
再来看一遍定义“Unix时间戳(Unix timestamp)定义为从格林威治时间1970年01月01日00时00分00秒起至现在的总秒数。”
注意:“1970年01月01日00时00分00秒”指的是格林威治时间,那么对应的北京时间应该是“1970年01月01日08时00分00秒”。
所以正确的方法是:拿“当前时区的时间”减去“当前时区在格林威治时间1970年01月01日00时00分00秒时的时间”。
>>> int((datetime(2015, 10, 30, 0, 0, 0) - datetime(1970, 1, 1, 8, 0, 0)).total_seconds()) 1446134400 >>> datetime.fromtimestamp(1446134400) datetime.datetime(2015, 10, 30, 0, 0)
现在正确了。
这个看似很简单的问题,实际上很容易被坑。
特别说明:本文旨在技术交流,请勿将涉及的技术用于非法用途,否则一切后果自负。如果您觉得我们侵犯了您的合法权益,请联系我们予以处理。
☹ Disqus被Qiang了,之前所有的评论内容都看不到了。如果您有爬虫相关技术方面的问题,欢迎发到我们的问答平台:http://spider.site-digger.com/