如何用vba实现网站数据采集(网抓)?





要实现网站数据的采集,首先要了解HTTP协议。

当我们在浏览器中输入网址,按下回车时,客户端会发送一个请求到服务器,服务器根据请求的内容返回数据到客户端,浏览器显示返回的结果。

当用编程的方法获取网站数据时,实际上就是模拟了以上的过程,客户端发送请求→服务器响应发回结果。

然后通过各种方式处理获得的结果,提取想要的数据。

本文介绍用WinHttpRequest对象进行网站数据采集的方法。

以下代码是最基础的获取网站数据的vba代码:

由于不同的网站有不同的编码字符集,如果不是UTF-8或者Unicode编码字符集,用ResponseText返回的字符在VBA中会乱码。为此,可以使用如下的代码实现通用的获取网站数据:

 

打赏
       

发表评论