C#中提供了很多网抓、爬虫需要的类。
这里我们选用 System.Net.Http 来实现网抓、爬虫。
代码如下:
阅读全文>>>using Sys[……]
关注和分享Excel以及Office系列软件的方方面面,致力于提高中国的办公软件的使用水平
在Excel中,函数是它的核心功能之一。
打开Excel,单击“公式”选项卡,在“函数库”组中给出了常用的函数的分类,函数可以分成财务函数、逻辑函数、文本函数、日期和时间函数、查找与[……]
阅读全文>>>在excel vba中内置了QueryTable对象可以存储从外部数据源导入的数据。
QueryTable对象不仅可以导入网页中的表格数据,还可以连接利用ADO技术访问的外部数据源的数据。
本文介[……]
阅读全文>>>中华人民共和国行政区划代码会每年都有变更,为了获取到最新的中华人民共和国行政区划代码可以通过网络采集的形式不断地获取最新的中华人民共和国行政区划代码。
比如中华人民共和国民政部官方网站会不定期的更新中华[……]
阅读全文>>>在进行QQ相关内容的网络数据采集时,经常看到需要附带bkn参数的时候。
如
1 |
https://qun.qq.com/cgi-bin/qunwelcome/myinfo?callback=?&bkn=114713469 |
经过分析QQ的网页JS,找到了bkn参数的获取算法如下:[……]
阅读全文>>>要实现网站数据的采集,首先要了解HTTP协议。
当我们在浏览器中输入网址,按下回车时,客户端会发送一个请求到服务器,服务器根据请求的内容返回数据到客户端,浏览器显示返回的结果。
当用编程的方法获取[……]
阅读全文>>>正常情况下,我们采用以下代码抓取网页,若是网页能访问,抓取都没问题。若是网站出现故障,那么往往会出现Excel卡死现象。
1 2 3 4 5 6 7 8 9 |
Public Function getHtmlStr(strUrl) '获取源码 'www.exceloffice.net同步抓取 Dim XmlHttp Set XmlHttp = CreateObject("Microsoft.XMLHTTP") XmlHttp.Open "GET", strUrl, False XmlHttp.send getHtmlStr = StrConv(XmlHttp.ResponseBody, vbUnicode) Set XmlHttp = Nothing End Function |
而Microso[……]
阅读全文>>>