更多>>关于我们

西安鲲之鹏网络信息技术有限公司从2010年开始专注于Web(网站)数据抓取领域。致力于为广大中国客户提供准确、快捷的数据采集相关服务。我们采用分布式系统架构,日采集网页数千万。我们拥有海量稳定高匿HTTP代理IP地址池,可以有效获取互联网任何公开可见信息。

您只需告诉我们您想抓取的网站是什么,您感兴趣的字段有哪些,你需要的数据是哪种格式,我们将为您做所有的工作,最后把数据(或程序)交付给你。

数据的格式可以是CSV、JSON、XML、ACCESS、SQLITE、MSSQL、MYSQL等等。

更多>>官方微博

西安鲲之鹏
陕西 西安

加关注

  • 【经验分享】记录使用"静态分析+动态插桩"还原“永辉超市某版本APP的HTTP签名算法”过程

    背景:永辉超市某版本APP的HTTP请求使用了签名参数保护机制,下面是分析该签名算法的过程:

    1. Jadx反编译APK,通过Java代码可以定位到加密函数位于cn.yonghui.hyd.lib.utils.http.httpmiddware.HttpSecurity类的signParamsNative()方法。如附图1所示。

    2. signParamsNative()是一个native方法,实现过程在libYHJni.so中。根据经验,直接还原算法可能有难度。通过Frida对HttpSecurity.signParams()动态插桩,插装代码如下:
    Java.perform(function() {
        var HttpSecurity = Java.use('cn.yonghui.hyd.lib.utils.http.httpmiddware.HttpSecurity');
        HttpSecurity.signParams.implementation = function(arg1){
            var md5 = this.signParams(arg1);
            console.log("#####  In HttpSecurity.signParams():  #####");
            console.log('Input param:');
            console.log(arg1)
            console.log('Sign result:');
            console.log(md5);
            console.log("#
    ##########################################");
            return md5;
        }
    }
    成功拦截到某次函数调用,输出如下:
    #
    ####  In HttpSecurity.signParams():  #####
    Input param:
    channelofficialdeviceidc7f00557-f9e8-4c59-8207-1da0909e9130distinctId66c626d274e42556isfirstopen0lat39.008006lng103.572384platformAndroidtimestamp1585469368166v5.28.0.10
    Sign result:
    baec2be68929009758ed7de29c331fdf
    #
    ##########################################

    3. 如上输出。“channelofficialdeviceidc7f00557-f9e8-4c59-8207-1da0909e9130distinctId66c626d274e42556isfirstopen0lat39.008006lng103.572384platformAndroidtimestamp1585469368166v5.28.0.10”参数串,经过某个算法之后得到一个的结果是一个32位的串"baec2be68929009758ed7de29c331fdf"。试了一下直接md5,结果不对。猜测可能是加salt了。

    4. 用IDA静态分析libYHJni.so,很容易找到Java_cn_yonghui_hyd_lib_utils_http_httpmiddware_HttpSecurity_signParamsNative()的实现,按F5将汇编代码转换为C语言语法。如附图2所示。从代码可以看出,计算输入串MD5值之前,先在前面加上了"YONGHUI601933",也就是md5("YONGHUI601933" + 输入串)。

    5. 知道算法了,我们来验证一下:
    >>>import hashlib
    >>>param = 'channelofficialdeviceidc7f00557-f9e8-4c59-8207-1da0909e9130distinctId66c626d274e42556isfirstopen0lat39.008006lng103.572384platformAndroidtimestamp1585469368166v5.28.0.10'
    >>>hashlib.md5('YONGHUI601933' + param).hexdigest()
    'baec2be68929009758ed7de29c331fdf'
    结果吻合。
    发布时间:2020-03-29 16:29:58
  • 【经验分享】
    背景:
    ESXi搭建的Ubuntu16.04虚拟机,添加了5块虚拟网卡,不同的网口桥接的不同的Bas。

    问题是:
    每次启动后某些网卡的名称(eth号)是随机变化的。
    如图1和图2所示,同一块网卡"00:0c:29:b0:17:21",在第一张图中被命名为eth4,但重启后在第二张图中却被命名为eth3。
    而拨号系统内不同的ADSL账号绑定着固定的网卡名称,如果eth号老是跳,就会拨到错误的Bas里,导致拨号失败。

    解决方法:
    给特定的MAC地址设置固定的网卡名称。

    编辑/etc/udev/rules.d/70-persistent-net.rules文件:

    加入:
    SUBSYSTEM=="net", ACTION=="add", DRIVERS=="?*", ATTR{address}=="00:0c:29:b0:17:2b", ATTR{type}=="1", KERNEL=="eth*", NAME="eth0"
    SUBSYSTEM=="net", ACTION=="add", DRIVERS=="?*", ATTR{address}=="00:0c:29:b0:17:35", ATTR{type}=="1", KERNEL=="eth*", NAME="eth1"
    SUBSYSTEM=="net", ACTION=="add", DRIVERS=="?*", ATTR{address}=="00:0c:29:b0:17:3f", ATTR{type}=="1", KERNEL=="eth*", NAME="eth2"
    SUBSYSTEM=="net", ACTION=="add", DRIVERS=="?*", ATTR{address}=="00:0c:29:b0:17:17", ATTR{type}=="1", KERNEL=="eth*", NAME="eth3"
    SUBSYSTEM=="net", ACTION=="add", DRIVERS=="?*", ATTR{address}=="00:0c:29:b0:17:21", ATTR{type}=="1", KERNEL=="eth*", NAME="eth4"

    注意:Ubuntu 16.04默认不存在该配置文件,需要先创建。

    参考:https://serverfault.com/questions/610967/network-adapter-to-eth-number-mapping-for-vmware/611040
    发布时间:2020-03-27 23:09:52
  • 【经验分享】Nox(夜神模拟器)+ Android 4.4.2版本今天出现了一个很奇怪的问题,xposed-installer-2.6版本突然无法安装了(3月18日之前没有问题),提示信息如附图1所示(Xposed目前不兼容Android SDK版本19或者您的处理器架构)。更奇怪的是,我在其它6台机器上测试都是如此,绝不是个例。

    1. 首先想到的是,它偷偷更新了。于是尝试卸载重装Nox,但是问题依旧。看了下Nox安装目录下的文件和日志,也没见有更新的迹象。
    2. 会不会是在启动的时候通过网络动态加载了什么策略呢?于是尝试断掉网络,重建Nox 虚拟机,xposed-installer-2.6安装成功,在多台机器上做同样尝试,问题均解决。看来就是夜神模拟器做了手脚了。

    "断网"不是长久之计,于是决定深入分析下,用wireshark抓包,主要看DNS请求,发现Nox在启动的时候访问了如下的域名:

    api.bignox.com
    bi.yeshen.com
    app.yeshen.com
    launcher.yeshen.com
    res06.bignox.com
    res11.bignox.com
    res.yeshen.com.qingcdn.com
    res.yeshen.com
    pubstatus.sinaapp.com
    noxagile.bceapp.com
    dl.xposed.info

    PS:看来小动作可真不少啊。

    尝试使用dnsmasq劫持这些域名,返回127.0.0.1,果然有效。
    附dnsmasq address.conf文件内容(如下),直接使用泛域名干掉所有的子域名,防止过滤的不够彻底:
    address=/bignox.com/127.0.0.1
    address=/yeshen.com/127.0.0.1
    address=/qingcdn.com/127.0.0.1
    address=/duapp.com/127.0.0.1
    address=/sinaapp.com/127.0.0.1
    address=/bceapp.com/127.0.0.1
    address=/xposed.info/127.0.0.1
    address=/duba.net/127.0.0.1
    address=/bsgslb.cn/127.0.0.1
    address=/applinzi.com/127.0.0.1
    address=/bceapp.com/127.0.0.1
    PS:为什么不直接修改hosts文件呢?一方面是机器比较多,一一设置比较麻烦,直接通过dhcp分配自定义的dns更方便。另一方面一些防护软件可能会保护hosts,设置了不一定有效。

    今天时间都耗在这上面,问题总算解决了。
    不好做什么评论,毕竟人家产品是免费让你用的,而且做的真心不错,再说别人坏话就不地道了。
    发布时间:2020-03-18 18:48:46
  • 【经验分享】有客户反映使用我们的代理访问某个URL(www.zbfdc.com.cn:81)始终返回403错误,访问其它网站正常。我自己测了一下,的确如此(如附图1所示)。由于是动态IP代理,可以排除IP被封了的问题。

    后来注意到,这个网站用了一个非常规的Web端口81,意识到了问题所在。

    Squi默认定义了如下端口为安全端口,如果目标端口(例如本例中的81)不在其中将会被拒绝,返回403错误。
    acl SSL_ports port 443
    acl Safe_ports port 80          # http
    acl Safe_ports port 21          #
    ftp
    acl Safe_ports port 443         # https
    acl Safe_ports port 70          #
    gopher
    acl Safe_ports port 210         # wais
    acl Safe_ports port 1025-65535  #
    unregistered ports
    acl Safe_ports port 280         # http-mgmt
    acl Safe_ports port 488         #
    gss-http
    acl Safe_ports port 591         # filemaker
    acl Safe_ports port 777         #
    multiling http

    解决方法很简单,把81端口加入到安全端口列表中即可,如附图2所示。
    重启Squid,测试,问题解决,如附图3所示。
    发布时间:2020-03-17 11:45:54
  • 【视频演示】受客户委托,对"采集某APP内综合商场商户楼层数据"进行可行性评估。实测可行,演示如视频所示。示例数据链接:http://db.site-digger.com/csv/6469616e70696e675f6d616c6c5f73686f70735f73616d706c655f3230323030333130/  西安鲲之鹏的微博视频 ​​​​

    发布时间:2020-03-12 14:05:49
  • 【吐槽】某地电信ADSL资源,拨号成功后前两个请求被强制跳转到push.hb.cnc.cn(如附图所示),第三个请求之后正常。这是宽带运营商搞的鬼,用于弹窗提示信息(广告或者提醒续费)。类似的情况之前在苏州电信遇到过。 ​​​​
    发布时间:2020-03-01 20:12:26
  • 【经验分享】Chrome Portable各版本下载链接:https://sourceforge.mirrorservice.org/p/po/portableapps/Google%20Chrome%20Portable/?C=M;O=D,这是Chrome便携版(支持Remote Debuging,功能和安装版没有区别),最近在某爬虫项目中集成了该版本,客户不需要额外安装浏览器,用起来很省心。 ​​​​
    发布时间:2020-02-24 16:23:49
  • 【视频演示】受客户委托对淘宝APP-淘鲜达店铺商品数据抓取的可行性进行评估。实测可行(销量也可以采集到),如录屏所示。  西安鲲之鹏的微博视频 ​​​​

    发布时间:2020-02-21 17:44:07
  • 【经验分享】Win8下安装VMware出现"error1316 指定账户已存在"问题的解决

    似乎是之前的安装有注册表残留(在控制面板已安装程序列表里看不到),尝试安装了多次,持续出现"error1316 指定账户已存在"问题,网上有VMware注册表清理工具试了也不管用。

    后来使用Windows Installer CleanUp Utility(Windows Installer 清理实用工具包,简称MSICUU)解决了问题。MSICUU会显示你以前没卸干净的软件列表(如附图1所示), 然后选择你想完全卸掉的项目 ,卸载了就可以了。

    附MSICUU的下载链接>>> O【Windows Installer CleanUp Utility下载】2...
    发布时间:2020-02-19 17:14:47
  • 【视频】携程酒店价格采集对比工具定制版演示
    该最新定制版(2020年)使用Google Chrome Dev Protocol(非Selenium + webdirver模式)实现,不会暴露navigator.webdriver等各种特征,不容易被识别。
    对比17年的版本:采用的是(Selenium + phantomjs)能够被反爬虫机制识别,返回有虚假价格情况,失败率也高。  西安鲲之鹏的微博视频

    发布时间:2020-02-18 15:24:40
当前位置: 首页 > 技术文章 >
KVM在Ubuntu下的安装配置
发布时间:2018-12-29

先说一下为什么选择KVM。笔者曾使用VMware虚拟机多年,它的GUI管理工具做的很出色,容易维护,但是期间遇到了一些问题,始终无法得到根治,后来换用KVM问题得到了解决。结合我的实际体验说一下KVM的优势:

 

  • KVM不需要桌面图形环境支持,能够在Linux Server版本下运行。
  • KVM的各种操作(创建、修改、起停、状态查看、删除、克隆等等)都在命令行下进行,不需要依赖GUI,因此很方便集成到自己的应用中去(比如,你可以实现一个自动化的VPS售卖平台)。
  • 网络更稳定。笔者使用VMware遇到最令人头疼的问题就是:经常遇到虚拟机重启后会莫名奇妙丢失网络(NAT模式),往往需要多次重启(或者关机操作)后才能恢复正常。在多种平台(Win7、Windows server 2012、Win10)、不同VMware版本下都遇到过这个问题。KVM是基于Linux内核的虚拟机(Kernel-based Virtual Machine,因此简称KVM),网络稳定性应该更好(目前使用过程还没有遇到类似的网络不稳定的问题)。

 

KVM在Ubuntu下的安装:

# 安装kvm相关软件包
sudo apt-get install qemu qemu-kvm libvirt-bin virtinst bridge-utils cpu-checker
# 验证安装是否成功
kvm-ok

创建桥接网卡:

注意:默认kvm虚拟机是NAT模式上网。如果想要使用桥接模式,需要我们先配置好桥接网口(先确保已安装好了bridge-utils)。配置示例如下:

sudo vi /etc/network/interfaces
# 编辑内容如下
# 这里我们创建了两个网桥,br0桥接eth0,br1桥接eth1。br0配置了网关,主机通过该口访问外网。

auto eth0
iface eth0 inet manual

auto eth1
iface eth1 inet manual

auto br0
iface br0 inet static
        address 192.168.1.88
        netmask 255.255.255.0
        gateway 192.168.1.1
        network 192.168.1.0
        dns-nameservers 114.114.114.114
        bridge_ports eth0
        bridge_stp off
        bridge_fd 0
        bridge_maxwait 0

auto br1
iface br1 inet static
        address 10.10.1.1
        bridge_ports eth1
        bridge_stp off
        bridge_fd 0
        bridge_maxwait 0

 创建虚拟机:

# 创建虚拟机,安装ubuntu18.04 server版。
# 先下载好系统安装iso文件(e.g. 本例用的ubuntu-18.04.1.0-live-server-amd64.iso)
sudo virt-install \
--virt-type=kvm \
--name ubuntu1804server \
--ram 4096 \
--vcpus=4 \
--os-type=linux \
--os-variant=generic \
--hvm \
--cdrom=/home/qi/kvm/ubuntu-18.04.1.0-live-server-amd64.iso \
--network=bridge=br0,model=virtio \
--graphics vnc,listen=127.0.0.1,port=5900\
--disk path=/home/qi/kvm/ubuntu1804server.qcow2,size=20,bus=virtio,format=qcow2

--name参数用来指定要创建的虚拟机的名称(本例为ubuntu1804server),后面我们要操作该虚拟机的时候都需要提供该信息。如果想采用NAT模式上网,修改为--network network=default 即可。

执行上述创建虚拟机命令之后会提示让安装系统。用VNC客户端连上去,然后像给物理机安装系统一样正常安装即可,如下图所示。

 

虚拟机的常用操作:

# 列出当前主机上所有KVM虚拟机
sudo virsh list --all
# 查看虚拟机的信息
sudo virsh dominfo ubuntu1804server
PS: 这里只能列出部分信息,虚拟机的详细配置参数可见于该虚拟机的XML配置文件
# 关闭虚拟机
sudo virsh shutdown ubuntu1804server
# 强制关闭虚拟机
sudo virsh destroy ubuntu1804server
# 启动虚拟机
sudo virsh start ubuntu1804server
# 设置虚拟机开机自启动
sudo virsh autostart ubuntu1804server
# 取消开机自启动
sudo virsh autostart --disable ubuntu1804server
# 编辑虚拟机配置(修改内存大小、CPU核心数、光驱ISO文件、虚拟网卡配置、VNC配置、虚拟硬盘文件路径等等)
sudo virsh edit ubuntu1804server
PS:本质是调用vi修改虚拟机XML配置文件,修改后重启虚拟机才能生效。
例如,修改光驱ISO文件:
<disk type="file" device="cdrom">     
...     
<source file="/home/qi/kvm/virtio-win-0.1.141.iso"></source>    
...
</disk>
# 查看虚拟机的VNC端口
sudo virsh vncdisplay ubuntu1804server
返回信息说明: 0 表示VNC为 5900 端口,:1为5901,以此类推 。
# 克隆虚拟机(将ubuntu1804server克隆为ubuntu1804server-new)
sudo virt-clone -o  ubuntu1804server -n   ubuntu1804server-new  -f /var/lib/libvirt/images/ubuntu1804server-new.img
# 如何迁移虚拟机?
将虚拟机XML配置文件和虚拟硬盘文件传至新服务器上,并修正XML文件中虚拟硬盘文件的路径,然后执行下面命令导入该虚拟机:
sudo virsh define XML文件名
# 删除虚拟机
sudo virsh undefine ubuntu1804server
# 查看当前网络配置
sudo virsh net-list --all
# 查看default网络配置详情
virsh net-dumpxml default
# 输出示例如下

 

NAT端口映射:

如果虚拟机采用default网络模式(即NAT)上网,想要从外网直接访问虚拟机上的服务,需要在主机(母机)上使用iptables做NAT端口映射,如下示例为将母机的2208端口映射到虚拟机192.168.122.101的SSH端口(22):

# 可以将这些规则加到/etc/rc.local中,每次开机就能自动载入,为了能够在KVM启动之后才载入这些规则,需要第一条之前加上 sleep 30,以等待足够长的时间,确保KVM默认的防火墙规则已加载完毕(否则KVM默认的REJECT规则优先级会更高)
# sleep 30 
sudo /sbin/iptables -t nat -A PREROUTING -p tcp --dport 2208 -j DNAT --to 192.168.122.101:22
#下面这条很重要,缺少了无法联通,因为KVM默认添加的规则没有允许NEW状态的转发。
sudo /sbin/iptables -I FORWARD -m state -d 192.168.122.0/24 --state NEW,RELATED,ESTABLISHED -j ACCEPT

 

参考资料:

KVM 虚拟化技术

https://www.cnblogs.com/clsn/p/8366251.html

KVM系列教程:

https://www.cnblogs.com/chenjiahe/p/5909584.html

https://www.cnblogs.com/polly-ling/articles/7154334.html

How to install KVM on Ubuntu 16.04 LTS Headless Server

https://www.cyberciti.biz/faq/installing-kvm-on-ubuntu-16-04-lts-server/

Ubuntu14.04+KVM配置虚拟机桥接(bridge)

https://blog.csdn.net/FIELDOFFIER/article/details/48497833

https://www.jianshu.com/p/199b1d39590b

Ubuntu server 16.04 as a Hypervisor using KVM and Kimchi for VM Management

http://www.ubuntuboss.com/ubuntu-server-16-04-as-a-hypervisor-using-kvm-and-kimchi-for-vm-management/

KVM/libvirt: Forward Ports to guests with Iptables

https://aboullaite.me/kvm-qemo-forward-ports-with-iptables/

KVM使用NAT联网并为VM配置iptables端口转发,kvmiptables

https://www.cnblogs.com/dwj192/p/8862199.html

KVM虚拟机的克隆

https://www.cnblogs.com/5201351/p/4461000.html

Creating Windows virtual machines using virtIO drivers

https://docs.fedoraproject.org/en-US/quick-docs/creating-windows-virtual-machines-using-virtio-drivers/index.html

Centos 6.7 KVM下安装windows 7系统

https://www.cnblogs.com/weifeng1463/p/6807997.html

Guest Support Status

https://www.linux-kvm.org/page/Guest_Support_Status

KVM设置启动顺序

https://stackoverflow.com/questions/19011159/how-to-set-boot-order-on-kvm-libvirt-virsh

动态挂载光驱

https://serverfault.com/questions/373372/how-to-connect-a-cdrom-device-to-a-kvm-qemu-domain-using-command-line-tools

Forwarding ports to guests in libvirt / KVM

https://serverfault.com/questions/170079/forwarding-ports-to-guests-in-libvirt-kvm

Setting Remote Desktop access password in KVM

https://stackoverflow.com/questions/4785494/setting-remote-desktop-access-password-in-kvm

https://www.cyberciti.biz/faq/linux-kvm-vnc-for-guest-machine/

libvirt Networking Handbook

https://jamielinux.com/docs/libvirt-networking-handbook/index.html

DISPLAYING THE IP ADDRESS AND PORT NUMBER FOR THE VNC DISPLAY

https://access.redhat.com/documentation/en-us/red_hat_enterprise_linux/7/html/virtualization_deployment_and_administration_guide/sect-editing_a_guest_virtual_machines_configuration_file-displaying_the_ip_address_and_port_number_for_the_vnc_display

特别说明:本文旨在技术交流,请勿将涉及的技术用于非法用途,否则一切后果自负。如果您觉得我们侵犯了您的合法权益,请联系我们予以处理。
☹ Disqus被Qiang了,之前所有的评论内容都看不到了。如果您有爬虫相关技术方面的问题,欢迎发到我们的问答平台:http://spider.site-digger.com/
QQ在线客服
欢迎咨询,点击这里给我发送消息。
欢迎咨询,点击这里给我发送消息。

加微信咨询