我用python爬虫技术,下载了2万多本电子书
mobi小书馆
2021-02-27 15:02:36
19年闲着没事儿就自学了点python的基础知识,然后在网上找案例练手,一不小心爬下来2万多本电子书。
虽然我有kindle,但我也看不了这么多呀,然后就想着如何把这些电子书分享出去。
第一个想到的是百度网盘,但说实话体验太差,下载速度慢的要死,还要面临链接失效的问题,作为一名程序员就想到一个耍酷(装逼)的解决方案。
思路:购买腾讯云,把电子书放到云上,写程序给电子书编号,把编号和路径放到数据库中,用户通过简单的命令可以搜到电子书对应的编号,再通过命令把电子书发到自己的邮箱或者kindle上。
交互方面,采用现在当时还比较流行的公众号方式,因为我不擅长前段页面,就图一个省事。
大概就是这样,但里面还有很多细节就不多说了,最后呈现的效果如下:

首页

s +空格+书名+空格+格式

p+空格+编号+空格+邮箱

过几分钟后查看邮箱收到了电子书

数据库截图有21776本电子书
因为本人技术有限,做的比较简陋,还望大家轻喷,溜了溜了。
-
mobi小书馆 楼主 2021-02-28 00:19:42
不做前端,纯文字交互式的方式也行,计算机技术上一般较为CLI。 你可以往下面的方向考虑: 场景 不做前端,纯文字交互式的方式也行,计算机技术上一般较为CLI。 你可以往下面的方向考虑: 场景1.浏览分类找书 发: 分类 # 获取分类列表 收: 科幻 武侠 文学... 发: c 科幻 # 获取分类下的书名列表,每次50条 收: 书名1[编号1] 书名2[编号2] ... 发: N # 下一页 收: 书名51[编号51] 书名52[编号52] ... ... # 后面接下载流程 场景2.查看Top100 发: Top100 收: 书名1[编号1] 书名2[编号2] ... 发: N # 下一页 收: 书名51[编号51] 书名52[编号52] ... ... # 后面接下载流程 其他的场景其实很容易想的,只是用户操作起来不太方便而。 这么方面写起代码来如果底层考虑全了就方便很多,如果每个场景都一句一句去写的话扩展起来就很头大,状态关联等待也头疼。 最后提一句,涉及爬虫之类的,尽量谨慎些。 ... 喜欢放葱的怪物你搞产品的,分析的很专业,你说的可行就是需要耗费大量精力和时间,体验上确没很大提升,感觉得不偿失啊。
-
mobi小书馆 楼主 2021-02-28 07:52:35
因为我也做过类似的事情,当时学校的图书馆只有电脑版的搜索页面,而且兼容性很差,就做了个和你 因为我也做过类似的事情,当时学校的图书馆只有电脑版的搜索页面,而且兼容性很差,就做了个和你这个公众号类似的小工具,只不过搜索结果是图书信息,比如在哪个馆、有几本、借出状态以及和豆瓣评分等。没几个人用,主要是我自己用的多,最后也就几百个关注量,后面我毕业了图书馆也改版还出了app,也就没什么价值了,现在连公众号都冻结了。 我刚学python的时候是很有精力和兴趣来弄这些看似没意义的东西,是会花掉很多时间,那时候也无所谓的,最多最廉价的就是时间,花几天加上个小功能就能沾沾自喜。 现在不一样了,我的确有更好的方式来实现这个功能,但知道没有人愿意花一毛钱来买单,那也就没有去折腾的力气了,那些和金钱无关的成就感无缘了。 ... 喜欢放葱的怪物哥们儿,现在还从事开发工作么?
你的回复
回复请先 登录 , 或 注册相关内容推荐
最新讨论 ( 更多 )
- 【好书分享】电子书分享专题~ (一个人的朝圣)
- 《肖星的财务思维课 : 看懂财富流转的规律》(豆瓣8.2) (一个人的朝圣)
- 豆瓣2024年度书单【来了】 (豆友爱读书)
- 最可爱的书搭子群(全女)📖🌲 (童)
- 求《环界》的电子书 (Dubbysang)