小说网站爬虫


小说网站爬虫第一天
从今天开始,学习一下爬虫的知识,爬取小说网站。
第一天:免费云主机域名
网站:http://www.bxwx9.org
小说:大主宰
语言:IDEA+java
jar包:maven工程,所以放上dependencies,每一个jar包的作用大家去研究一下项目结构:
需求:获取小说的章节列表中的标题和URL
原理:


代码如下操作:

中文乱码的解决:

运行的效果图:

明天继续!!!!

相关推荐: 关于虚拟机与宿主机同网段主机互ping的一点疑问

宿主机win10(192.168.1.0/24)虚拟机win2008r2(192.168.159.0/24)使用NAT模式,宿主机和虚拟机能够互ping通,虚拟机能够ping通与宿主机同一网段的任何计算机,但与宿主机同网段的计算机却不能pin免费云主机域名g通…

免责声明:本站发布的图片视频文字,以转载和分享为主,文章观点不代表本站立场,本站不承担相关法律责任;如果涉及侵权请联系邮箱:360163164@qq.com举报,并提供相关证据,经查实将立刻删除涉嫌侵权内容。

Like (0)
Donate 微信扫一扫 微信扫一扫
Previous 01/26 11:09
Next 01/26 11:09