漫画

用koa2.x写下载漫画的爬虫

倾然丶 夕夏残阳落幕 提交于 2019-11-28 13:02:05
原文引用 https://www.dazhuanlan.com/2019/08/25/5d6235bb190fd/ 用koa2.x写下载漫画的爬虫: 使用koa2.x的async ,await解决异步问题,写一个下载漫画的爬虫,代码里有惊喜和福利哦! 项目搭建 安装nodejs>7.6,安装koa-generator 直接 koa2 spider ,生成项目 安装request,request-promise,cheerio,mkdirp npm install安装依赖 思路 图片或者漫画爬虫的思路很简单,首先观察url的规律,把url按规律加入到下载任务,其实就是请求获得html内容,然后对html进行解析,找到下载的图片url(一般都是img标签的src属性值),把url放到数组保存,使用async await控制所有的任务,直到把所有的图片下载完。 难点 但是nodejs本身上异步的,如果你直接在for循环里去下载,肯定是不行的,必须控制好异步的执行上关键。 爬虫简单,处理好异步难。这里我使用的es7中async,await配合promise解决异步问题,还可以使用async模块,eventproxy,等等异步控制模块来解决。 核心代码,spider.js

【漫画】程序员怼产品高清图鉴《三十六计》

▼魔方 西西 提交于 2019-11-28 09:36:45
点击上方“ Python爬虫与数据挖掘 ”,进行关注 回复“ 书籍 ”即可获赠Python从入门到进阶共10本电子书 今 日 鸡 汤 精诚所加,金石为开。 《 Tonyの日常逗比乐》 第一话:怼产品上篇 蜜汁点评:更改需求被夸大时间周期?那是你的福报!上一个这么做的还躺在医院。 蜜汁 点评:程序员中有句名言叫“Talk is cheap, show me your code”,对于产品的需求同样“ Talk is cheap, show me your value” 蜜汁 点评:程序中出现Bug在所难免,如何优雅的向程序员提出Bug是个社会学问题。 蜜汁 总结:变更需求在所难免,频繁的变更需求,那么受伤也在所难免。 蜜汁 点评:抄袭是实现成功成本最小的方式,特别是在互联网行业,当然已经失败的产品就别抄了。 蜜汁 点评:总有些产品经理提出一些“富有想象力”的需求!这种时候广大程序员同胞们就不要硬撑啦,勇于承认自己弱爆了、脑子瓦特了。 蜜汁 点评:同胞们,来日方长,认怂者得永生。 蜜汁 点评:不只是产品会变需求,开发也能!👍 蜜汁 点评:内容过于真实,引起强烈舒适。 蜜汁 点评:AD钙奶很好喝! 感谢大家的支持,本漫画为原创作品 版权已授权第三方保护 转载需授权并请 保留下方二维码 -- -- --- --- --- -- --- End --- -- --- -- --- --- -

动画or漫画相关工具

只愿长相守 提交于 2019-11-28 01:00:07
用boujou做跟踪,maya做动画和模型,houdini做特效,arnold渲染 2.熟练使用CUDA; 3.熟练使用C/C++; 4.有Maya API插件开发经验; 5.对Maya节点运算原理有了解; 6.对绑定有了解; 来源: https://www.cnblogs.com/Bejadin/p/11384774.html

python---爬取豆瓣漫画书

狂风中的少年 提交于 2019-11-27 07:22:39
首先是访问网址:使用requests去访问 这里爬取的是豆瓣网上的漫画书 接着解析网址:使用BeautifulSoup 然后在所要爬取的网页中,右键--->检查,就可以查看网页的代码结构 由上面的代码结构可以看出,漫画书的所有信息都包含在id为content的div标签中 这里利用soup.find()就可以查看整个网页的信息 如果要得到h1的标签 那就在soup.find('div',id='content')后加.h1就可以了 如果想爬取网页的大标题,则在soup.find('div',id='content').h1后加上.text 采集整个页面的信息:在class为subject-list的ul标签中 查看第一本书的信息 找到所有的li标签 采集第一本书的内容,并查看h2的标签 获取第一本书的书名、评分、评价人数以及作者、译者、出版社、出版日期等其他信息,并存到字典里 那么如何提取出(47231人评价)中的47231呢?用正则表达式 正则表达式可以快速提取内容 同理提取价格 爬取到的漫画书信息处理过程代码如下: 最后结果存储到数据框中,其结果显示如下(这里查看的是后10行): 这是我在一门爬虫课程里面的笔记,因为初涉爬虫 ,咱啥也不太懂 只能说听了课程之后,知道了大概的爬虫框架 所以先在这记录下目前学到的一点皮毛,后面深入学习之后再修正 来源: https://blog

利用正则提取discuz的正文内容

六眼飞鱼酱① 提交于 2019-11-27 04:09:12
源正文: [p=24, null, left][color=#000][font=宋体]近日,香港著名漫画家马荣成在香港举办的“[color=#ff660][url= http://cul.china.com.cn/2013-08/04/content_6179875.htm#]风云[/url][/color]盛宴”上宣布封笔,并宣布即将完结连载24年的《风云》漫画。[/font][/color][/p][p=24 , null, left][color=#000][font=宋体]“风云”是幻想式武侠故事,主要围绕聂风和步惊云展开。从1989年开始连载,至今已有24年。漫友杂志社社长兼总编辑金城说,[color=#ff660][url= http://cul.china.com.cn/2013-08/04/content_6179875.htm#]香港漫画[/url][/color]市场销量近年一直下滑,内地漫画市场还好,但香港漫画衰退很快,读者越来越少,这也成为马荣成封笔的直接原因,因为他不再有画下去的动力。[/font][/color][/p][p=24 , null, left][color=#000][font=宋体]52岁的马荣成表示,五年前就萌生退意,两年前决定封笔,“因为不想再为延续销量而不断消磨自己的斗志,与其让主角无限次受伤、离别及永远的化险为夷

青春漫画

≯℡__Kan透↙ 提交于 2019-11-26 19:15:50
今天看了一部韩剧,开始的时候觉得没有味道,后来发现是一部很不错的片子 路子有些老套:开始很搞笑,后来很感人。抓些图留个纪念。 --------------------------------------------------------------------- 儿时相识就做了一件XXX的事 --------------------------------------------------------------------- 你并没有生气,我俩反而成了好朋友 ------------------------------------------------------------------ 做个鬼脸逗你笑 ------------------------------------------------------------------- 你笑得很开心 ----------------------------------------------------------------- 转眼我们已长大 ----------------------------------------------------------------- 青春难免有些尴尬 -----------------------------------------------------------------

漫画追踪器Tracker

ⅰ亾dé卋堺 提交于 2019-11-26 19:15:21
1. 动机 关注漫画的人肯定会发现漫画的更新时间差异非常大:有的一个星期更新一集,有的一个月更新一集,有的一季度更新一集。如果关注的是日本漫画,并且不会日文,那么更新后的漫画还要等待汉化组翻译成中文才能看。这一等,少则几小时,多则几个星期。 等得多了,就会产生这样一种想法:如果漫画更新后能通知我就好了。有的漫画网站抓住了这种想法,增加了关注的漫画更新后就发邮件通知的功能。但是,对于不经常查看邮箱的人来说,这种功能并没有多大帮助。于是,就有了进一步的想法: 如果关注的漫画更新后,就立刻下载到我的电脑上,并且弹出提示框就好了 。 根据这个想法形成的工具正是tracker。因而它的核心功能就是追踪漫画——当关注的漫画更新时,立即下载到指定文件夹,并弹出对话框提示。 2. 关键功能实现 实现tracker的追踪功能的难点在于漫画更新的判定,而下载功能的难点则是搞定漫画网站的防盗链/防盗图。以下以99漫画网( http://www.99comic.com )为例说明这两个功能是如何实现的。 2.1 判定漫画更新 在99漫画网中,打开《火影忍者》可以得到如下页面: 从上图可以得到一个猜测,漫画集数都放在同一个div中(观察该页面的源代码可以证明这个猜测是正确的)。既然如此,当漫画更新了,新一集的名称必然也是放在这个div中。根据这个特性,可以得到如下想法: 记录 div 的当前集数

简易漫画网站搭建-漫画喵Server版

江枫思渺然 提交于 2019-11-26 19:14:51
小喵的唠叨话:寒假的时候写了一个漫画爬虫,爬取了好几个漫画,不过一直没有找到合适的漫画阅读的工具。因此最近就试着自己写一个漫画的网站,放在公网上或者局域网里,这样就能随时随地用手机、Pad看漫画了。 先放上项目的地址: https://github.com/miaoerduo/cartoon-cat-server ,欢迎大家随时star、fork和指教。 关于漫画爬虫的内容,请参看之前的博客: http://www.miaoerduo.com/python/爬虫-漫画喵的100行逆袭.html 本文系原创,转载请注明出处~ 小喵的博客: http://www.miaoerduo.com 博客原文: http://www.miaoerduo.com/nodejs/ 简易漫画网站搭建-漫画喵server版.html ‎ 写在前面 这里,我们先试着思考几个问题: 1、为什么要做一个漫画网站,而不是APP呢? 小喵最开始其实是打算做一个QT的漫画阅读软件,这样能够在各种操作系统上用。开发了一小段时间之后,觉得用手机或者Pad看漫画的情况会更多。难道要给手机、平板甚至是PC都编写一套软件吗?这个小喵确实能力上达不到。其次是,如果是本地的APP的话,图片可能还是需要存到设备上,这样同样很麻烦。于是,漫画网站就成为最适合的选择,只要在联网的情况下(或者在同一个局域网中),只要有浏览器

毒奶粉、问题奶相关漫画与对话

混江龙づ霸主 提交于 2019-11-26 11:53:27
对话: 伊利、蒙牛与三鹿的对话 伊利、蒙牛与三鹿的对话 伊利:你他妈加就加,不能少加点? 蒙牛:我从来都是奶粉里加三聚氰胺,你他妈三聚氰胺里加奶粉? 三鹿(委屈):那天漏斗坏了,没控制住量 。 转载于:https://www.cnblogs.com/samlin/archive/2008/09/19/1294239.html 来源: https://blog.csdn.net/weixin_30824479/article/details/98832598