如何用python抓取某个网站的源代码并且显示在文本文档中？ - python

如何用python抓取某个网址的源代码并且打开显示在文本文档中？

2020年2月5日作者：水星Excel

3,639 次浏览暂无评论

用python做爬虫是最方便的。

用python做爬虫首选requests。

本文简单的介绍了如何使用requests抓取某个网址的源代码并且将源代码存入文本文档中，打开查看。

代码如下：

import requests
url=”http://www.stats.gov.cn/tjsj/tjbz/tjyqhdmhcxhfdm/2018/index.html”
r=requests.get(url)
#设置编码的格式
r.encoding=’gbk’
#读取网页源代码
result=r.text
import os
#定位文本文件所在的目录
Path=r’d:’
os.chdir(Path)
#打开文本文件
file1=open(‘test1.txt’,’w’)
#写入内容
file1.write(result)
#关闭文本文件，这个是关键，close要加括号
file1.close()
#打开文件夹查看结果
os.system(‘notepad.exe ‘ + Path+’test1.txt’)

如果要把html源代码解析并显示成树状形式，可以再加BeautifulSoup解析。

代码如下：

import requests
from bs4 import BeautifulSoup
url=”http://www.stats.gov.cn/tjsj/tjbz/tjyqhdmhcxhfdm/2018/index.html”
r=requests.get(url)
#设置编码的格式
r.encoding=’gbk’
#读取网页源代码
result=r.text
soup = BeautifulSoup(result, ‘html.parser’)
result=soup.prettify()
import os
#定位文本文件所在的目录
Path=r’d:’
os.chdir(Path)
#打开文本文件
file1=open(‘test1.txt’,’w’)
#写入内容
file1.write(result)
#关闭文本文件，这个是关键，close要加括号
file1.close()
#打开文件夹查看结果
os.system(‘notepad.exe ‘ + Path+’test1.txt’)

其它相关文章推荐：

声明: 本站文章均属原创，未经作者同意必须保留此段声明，且在文章页面明显位置给出原文链接，否则视为侵权。如果想要每天都收到本站的技术文章推送，可以微信搜索公众号：水星Excel或者Excel_Office关注。其它事宜请加QQ：1722187970 或微信号：xycgenius 联系。

如何用python抓取某个网址的源代码并且打开显示在文本文档中？

其它相关文章推荐：

发表评论取消回复

感谢你的支持，我将持续地写出更好的文章。

热门文章

微信公众号

如何用python抓取某个网址的源代码并且打开显示在文本文档中？

其它相关文章推荐：

发表评论 取消回复

感谢你的支持，我将持续地写出更好的文章。

本站精华

热门文章

微信公众号

发表评论取消回复