非凡首页|软件资讯|最新更新|下载排行|软件分类|软件专题
您当前位置: 下载首页编程软件程序源码python爬取138看书网小说源码

python爬取138看书网小说源码 v2.17 程序源码

  • 软件等级:3 stars.
  • 软件大小:189.09KB
  • 支持语言:简体中文
  • 授权方式:免费版
  • 软件分类:编程软件/程序源码
  • 官网链接:
  • 更新时间:2024-09-11 03:14:02
  • 运行环境:WinXp,Win2003,WinVista,Win 7,Win 8,Win 10,x64
  • 厂商:
关 键 字: 小说爬虫
软件介绍 软件截图 软件专题 软件问答 相关文章 相关软件 下载地址

python爬取138看书网小说源码由论坛用户制作并分享,适用于138小说网,能够帮助用户爬取网站获取小说资源,软件提供分类搜索查找的功能,支持目录爬取,还附带书签功能,用户使用这款软件能够更加轻松地看小说,非常实用。

软件说明

记录一下今天爬的第二个小说网,第二次弄起来比较熟练了,不像第一次弄一半就得找教程边看边搞。

但实际上爬小说应该是最简单的事情了吧,涉及的技术也没有那么深。

把代码发出来让想刚入门却不知道从何下手的同萌新们看看吧,看教程总是云里雾里的,还是还得上手多练练才能加深印象。

这个小说爬虫还是有点垃圾,多线程没有,而且有些函数也是用的跟*一样,这玩意该怎么改进也没有头绪。

演示一览

import requests

import lxml

import re

headers = {

'user-agent': 'User-AgentMozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.132 Safari/537.36'

}

print ('本脚本仅适用于138看书网:https://www.13800100.com/')

#url_list = 'https://www.13800100.com/list/72262/'

url_list = (input('粘贴小说目录url,必须是小说目录,小说首页不支持⁄n'))

downurl = 'https://www.13800100.com/article/'

url_list = requests.get(url_list)

text_list = url_list.text

#爬小说书名

text_title = re.findall(r'

(.*?)',text_list,re.S)[0]


text_title = text_title.replace('⁄r⁄n','')

text_title = text_title.replace('

','')


text_title = text_title.replace(' ','')

#爬小说目录列表

text_list_info = re.findall(r'

.*?

',text_list,re.S)[0]


text_list_info = re.findall(r'(.*?)',text_list)

for i in text_list_info:

#每章小说的url和每章章名

list = i[0]

name = i[1]

download = downurl + list

download_info = requests.get(url = download,headers=headers)

html=download_info.text

html_info = re.findall(r'

(.*?)

',html,re.S)[0]


html_info = html_info.replace ('   ','')

html_info = html_info.replace ('
',('⁄n'))

html_info = html_info.replace ('  ','')

print (name)

#输出为记事本

with open ('%s.txt' % text_title,'a+',encoding = 'utf-8')as f:

f.write(' '+ name + '⁄n')

f.write('⁄n')

f.write(html_info + '⁄n')

f.write('⁄n')

print ('下载完成')

上文就是小编为您带来的python爬取138看书网小说源码了,更多精彩软件请多多关注非凡软件站

软件截图

查看安装过程

编程软件下载

编程软件下载 编程软件就是用一种开发语言,写出一个能够满足人们某种需要的系统,易扩展操作系统的功能,本专题提供各类编程软件供您选择下载!

  • gcc编译器 v14.1.2

    gcc编译器v14.1.2 GCC是一款由GNU工程开发的、功能强大的编程语言编译器,支...详情>>

  • python idle v3.12.2150.0

    python idlev3.12.2150.0 Python IDLE是Python编程语言自带的一个集成...详情>>

  • 诺宝RC v15.0

    诺宝RCv15.0 诺宝RC是一款专为机器人编程设计的软件工具,旨在为用户提供一...详情>>

  • 华程编程辅助工具 v1.1

    华程编程辅助工具v1.1 华程编程辅助工具通过小程序框架,为后端开发、UI设计及程序测...详情>>

软件资讯

更多>
  • 谷歌商店下载的应用打不开怎么办

    谷歌商店下载的应用打不开怎么办

    在当今这个数字化时代,智能手机已成为我们生活中不可或缺的一部分。而应用商店作为手机上安装应用程序的主要途径,其重要性不言而喻。谷歌商店作为android系统的官方应用市场,提供了海量的应用供用户选择。然而,有时用户会遇到下载了的应用无法打开的问题,这无疑会让人

  • 如何更改Google Play商店的地区设置

    如何更改Google Play商店的地区设置

    在使用googleplay商店时,你可能会遇到某些应用或游戏仅在特定国家/地区提供,或者想访问不同地区的促销活动和内容。本文将指导你如何更改googleplay商店的地区设置,以便你能享受到更多元化的服务。为什么需要更改地区设置?有时,你可能发现想要的应用程序

  • 淘宝客服如何操作退货退钱流程

    淘宝客服如何操作退货退钱流程

    在淘宝购物时,如果遇到了商品质量问题或与描述不符等情况,退货退钱是一个保障消费者权益的重要环节。下面,我们就来详细了解一下淘宝客服退货退钱的流程,帮助大家更好地处理这一问题。一、联系卖家并申请退货首先,当你发现购买的商品有问题时,第一步是联系卖家。通过淘宝聊天

  • 支付宝友善福图片2025大全

    支付宝友善福图片2025大全

    2025年支付宝的集五福活动正如火如荼地进行中,友善福作为其中较难获得的一种福卡,受到了不少用户的关注。为了帮助大家更容易地收集到友善福,这里提供一些可能有助于扫出或获得友善福的图片。支付宝友善福图片2025大全好了,以上就是小编今天带来的所有内容了。想要了解更多资讯、教程、攻略就来非凡软件站,快快收藏吧,更多精彩不容错过!

  • 抖音直播观众隐私如何关闭

    抖音直播观众隐私如何关闭

    抖音是一款十分好玩有趣的社交软件,用户们可以随心所欲的进行各种不同的直播互动,但是直播过程中也是需要注重个人隐私的,下面小编就来为大家介绍一下设置教程,有需要的小伙伴及时关注哦!抖音直播观众隐私设置方法一览第一步:打开抖音APP,点击底部中央的“+”号按钮进入拍摄页面。第二步:在拍摄页面,点击右上角的“设置”图标(通常为三个点或齿轮状图标)。第三步:在设置页面向下滑动,找到“允许观众查看他人资料”

  • 林肯之道怎么扫描二维码

    林肯之道怎么扫描二维码

    林肯之道作为林肯车主的专属智能助手,提供了诸多便捷服务。其中,扫描二维码功能更是让车主们能够轻松连接车辆与手机。那么,你是否遇到过需要使用林肯之道app扫描二维码,却不知如何操作的情况呢?接下来小编将为你介绍一下详细的操作步骤,快来看看吧!第一步:打开林肯之道APP的图标册趣。第二步:在首页中选择【我的】。第三步:点击【扫码】图标。第四步:即可扫描二维码。以上就是林肯之道怎么扫描二维码的全部内容了

注意事项

本站所有资源(含游戏)均是软件作者、开发商投稿,任何涉及商业盈利目的均不得使用,否则产生的一切后果将由您自己承担!本站将不对任何资源负法律责任,所有资源请在下载后24小时内删除。
如侵犯了您的版权、商标等,请立刻联系我们并具体说明情况后,本站将尽快处理删除,联系版权说明注意事项)。若有关在线投稿、无法下载等问题,请与本站客服人员联系
用户可自行按线路选择相应的下载点,可以直接点击下载/另存为,若直接点击下载速度太慢,请尝试使用高速下载器。为确保下载的文件能正常使用,请使用WinRAR最新版本解压本站软件。
建议大家谨慎对待所下载的文件,大家在安装的时候务必留意每一步!关于360安全卫士QQ电脑管家的有关提示,请自行注意选择操作。