0%

用过B站的小伙伴们都知道,B站的弹幕是一绝。 今天我们爬取指定bv号视频下的弹幕,添加到csv文件中并制作成词云。

优化后的完整代码:代码地址

一、分析弹幕的接口url地址

这里有两个地址可以实现爬取弹幕,一个是有限条的,另一个则是根据日期循环爬取,可以实现所有弹幕的爬取。
案例是冰冰的vlog.001

阅读全文 »

侵权删除。

前言

今天准备在网上找一个web模板,用来做Echarts的数据可视化。寻找模板的过程中像往常一样,遇到了很多的收费网站,一般都是月费年费类型的。然后我就遇到了下面这个网站:

阅读全文 »

问卷星的自动化操作

前言

身边的很多同学需要填写问卷星,有很多需要刷任务的操作,等等类似场景,可以使用selenium实现

以下是本篇文章正文内容,下面案例可供参考

一、selenium是什么?

Selenium 是一个用于Web应用程序测试的工具。Selenium测试直接运行在浏览器中,就像真正的用户在操作一样。支持的浏览器包括IE(7, 8, 9, 10, 11),Mozilla Firefox,Safari,Google Chrome,Opera等。这个工具的主要功能包括:测试与浏览器的兼容性——测试你的应用程序看是否能够很好得工作在不同浏览器和操作系统之上。测试系统功能——创建回归测试检验软件功能和用户需求。支持自动录制动作和自动生成 .Net、Java、Perl等不同语言的测试脚本。

阅读全文 »

使用python对豆瓣进行评论爬取,并数据可视化

前言

对豆瓣界面进行分析,没有前后端分离,对界面元素分析后,爬取相关信息并保存在csv表格中,然后进行数据分析。

提示:以下是本篇文章正文内容,下面案例可供参考

一、思路分析

分析豆瓣页面数据,以及怎样实现循环爬取。

阅读全文 »

微博相册的批量爬取

微博有相册功能,那么我们如何批量下载相册中的所有照片呢?

以下是本篇文章正文内容,下面案例可供参考

一、分析实现思路

因为微博相册也是前后端分离,所以我们先去抓包对应的json数据

阅读全文 »

微博个人主页的信息爬取

闲话少说,先进入分析过程。
因为相对而言移动端的界面会比较好爬取,所以今天我们爬取移动端微博的页面,如下:

阅读全文 »