解壓電腦系統(tǒng)的軟件下載
準(zhǔn)備工作:1、提前準(zhǔn)備好pr2022軟件安裝包(*沒有的看文末*)2、系統(tǒng)必須是Windows 10 64bit3、保證電腦中有任意一款解壓軟件安裝步驟1.找到下載好的安裝包,并將其解壓到當(dāng)前位置2....
2025.07.03COPYRIGHT ? 2023
粵ICP備2021108052號
郵箱:611661226@qq.com
留言給我如今網(wǎng)絡(luò)上很多小說網(wǎng)站都有免費(fèi)的小說閱讀,但是它不提供下載全本的服務(wù),目的也是為了獲得更多的流量,資源君就不服了,今天剛好看到一個(gè)小說網(wǎng)站,就想弄本小說來看看,于是拿起電腦,噼里啪啦寫了一個(gè)下載小說的Python代碼,下面我來帶大家讀一讀代碼(具體的代碼講解我已經(jīng)寫在注釋里了)!
1.首先第一步,導(dǎo)入兩個(gè)我們需要的包
# 用于獲取網(wǎng)頁的htmlfrom urllib import request# 用于解析htmlfrom bs4 import BeautifulSoup
2. 我們來分析一下,我們要抓取的小說頁面
(廣告還挺顯眼的)
我們看下這個(gè)界面然后再來看看html源碼
我們會(huì)發(fā)現(xiàn),我框住的地方正是我們所需要的地方,但是注意上面的最新章節(jié)和我們的正式的小說目錄也就是下面的地方,他們都處于
然后再來看看小說閱讀的界面:
這個(gè)界面就很簡單了,我們來看看HTML源碼:
很容易看到
標(biāo)簽中的也就是正文
OK,經(jīng)過我們初步分析,我們可以開始寫代碼了!
3.首先我們寫出獲取網(wǎng)頁html源碼的一個(gè)方法:
# 得到網(wǎng)頁的htmldef getHtml(url):url = urlres = request.urlopen(url)res = res.read().decode()# print(res)return res
這個(gè)方法傳入一個(gè)url,會(huì)返回一個(gè)html源碼
4.然后我們再來寫一下,獲取整本小說所有章節(jié)的鏈接的方法:
# 解析小說章節(jié)頁面,獲取所有章節(jié)的子鏈接def jsoupUrl(html):# 獲取soup對象url_xiaoshuo = BeautifulSoup(html)# 因?yàn)槲覀円萌lass為box1中的divclass_dict = {'class': 'box1'}url_xiaoshuo = url_xiaoshuo.find_all('div', attrs=class_dict)# 因?yàn)榉治鰄tml中的代碼可以發(fā)現(xiàn)div的class為box1的有兩個(gè),通過上面的代碼返回的是一個(gè)list格式的結(jié)果,所以下面的索引應(yīng)該是1# 我們要獲取li中的值,所以find_all,這個(gè)方法返回的是一個(gè)list集合url_xiaoshuo = url_xiaoshuo[1].find_all('li')# print(url_xiaoshuo)# 創(chuàng)建一個(gè)集合,用于存放每個(gè)章節(jié)的鏈接url_xs = []for item in url_xiaoshuo:# 獲取每個(gè)元素中的href值url = item.a['href']# 將值傳入url_xs集合中url_xs.append(url)return url_xs
具體的解釋,我已經(jīng)寫在注釋里了,不懂的可以在公眾號后臺留言
5.我們獲取到每個(gè)章節(jié)的鏈接之后,我們就需要把每一章節(jié)的內(nèi)容給弄下來并且把它寫入到txt文本而且每個(gè)文本的標(biāo)題為章節(jié)的標(biāo)題
# 解析小說每個(gè)章節(jié)的的主要內(nèi)容def jsoupXiaoshuo(list):for item in list:html = getHtml(item)html = BeautifulSoup(html)# 獲取小說標(biāo)題title = html.h1.get_text()xiaoshuo = html.find_all('p')for item in xiaoshuo:str = item.get_text()# open中的第二個(gè)參數(shù)是讓每一次的字符串接連到上一個(gè)字符串,千萬不能是wwith open(title + '.txt', 'a') as f:f.write(str+'\n')
6.最后我們在main方法中運(yùn)行這幾個(gè)方法即可:
if __name__ == '__main__':html = getHtml("http://www.136book.com/dadaozhaotian/")url_xs = jsoupUrl(html)jsoupXiaoshuo(url_xs)
大功告成!
不懂的可以在公眾號后臺留言,我全部都會(huì)回復(fù)的哦!
準(zhǔn)備工作:1、提前準(zhǔn)備好pr2022軟件安裝包(*沒有的看文末*)2、系統(tǒng)必須是Windows 10 64bit3、保證電腦中有任意一款解壓軟件安裝步驟1.找到下載好的安裝包,并將其解壓到當(dāng)前位置2....
2025.07.03文件同步備份工具都有哪些?在你需要文件同步時(shí)你最先考慮的是選擇哪個(gè)軟件?今天小西給你推薦一款非常簡單實(shí)用的文件同步工具-FileYee。文件同步備份工具:FileYee同步備份模式:本地同步備份、百度...
2025.07.03Windows Server 2019是由微軟(Microsoft)官方推出的最新版服務(wù)器版操作系統(tǒng),該系統(tǒng)基于Win Server 2016開發(fā)而來,后者是微軟迄今為止普及速度最快的服務(wù)器系統(tǒng)。Wi...
2025.07.03隨著微軟對win7系統(tǒng)的服務(wù)停止,各類硬件廠商也慢慢發(fā)布新品硬件適配win10系統(tǒng)的使用,比如華碩、技嘉、華擎、微星等大廠商,部分主板已經(jīng)無法安裝win10系統(tǒng),當(dāng)然大多數(shù)新品主板也會(huì)兼容win7系統(tǒng)...
2025.07.03轉(zhuǎn)自堆糖網(wǎng)2.《開局就無敵, 我獲得智能領(lǐng)袖能量系統(tǒng)》 作者:麗聲 簡介【熱血+御姐+勵(lì)志+寫實(shí)+日常+獵奇+冒險(xiǎn)+泡妞+咸魚翻身+絕處逢生+懸疑】 “咳咳咳……咳咳咳!同學(xué)……咳咳咳,同學(xué)們祝你們...
2025.07.02