使用appium和夜神模拟器爬取抖音视频链接

经过几天的努力,终于有了最终的结果,哈哈。 暂时实现了抖音视频的滑动,同时用了一个很笨的方法来避免抖音的反向爬行,最终保存了抖音视频的链接

1. 准备工作

就是这样。

2.安装模拟器并连接模拟器。 安装业神模拟器后,桌面上会出现两个快捷方式安装抖音,分别是多开器和模拟器。 默认安装了模拟器的版本,但是由于版本太高,也就是bug太少,所以我们选择自己安装一个5.0版本左右的模拟器。 安装过程这里省略一万字。启动模拟器并安装抖音app即可启动软件

启动

然后单击按钮启动该服务。 4.配置模拟器信息,点击下方按钮。

在此插入图片描述

然后根据我的模拟器信息,输入我对应的版本信息等,最后点击开始。 如果链接成功,会跳转到如下界面。

在此插入图片描述

链接成功界面

在此插入图片描述

这说明基本连接已经成功了! !

3.爬取视频地址

下一步是使用脚本控制模拟器并获取视频连接。 我一开始尝试使用网络抓包来获取视频链接,但是反爬虫手段太强,或者我的思路不够全面,很难从网络抓包中获取有用的信息。 最后我想到了一个办法,那就是我偷不了安装抖音,所以我就想办法从你那里得到,你就主动给了我。 我发现每个视频都有一个分享按钮,然后我访问分享网址确实可以访问视频,所以我抓住了这个机会,每次滑动屏幕,每次点击分享按钮,每次复制按钮,获取分享信息后,使用正则匹配来匹配URL和对应的复制信息。 我的代码如下所示,设计了一些简单的技术来防止一些意外导致爬行停止。

多次报错后,说明可能是某些部件出现了问题。 解决问题最简单的方法就是重启app,所以我设计了当报错次数超过15次时重启app。 同理,如果你不再向我推荐,就继续往下滚动重复,同样的方式重新启动,让我再推送一次。 为了防止重复视频被爬取,每次写入前都会判断文件中是否存在视频链接。 '':''参数的配置主要是因为容易报错:

Message: An unknown server-side error occurred while processing the command. Original error: Failed to execute touch even

复制

滑动屏幕时,所有坐标参数都加减一个随机数,可以更好地伪装成真人操作。

相信有想法爬取这些视频的人应该都能看懂基本代码,所以我就不多解释了。 下面发布我的代码:

下面是整个爬取的例子。 我想插入视频但是好像不方便,所以就不插入了,因为麻烦。

在此插入图片描述

这可能就是您抓取链接的方式。 错误文件内容如下:

在此插入图片描述

四个下载视频

我不会写有关下载视频的内容。 你可以爬下来。 我想下载应该不难。 您可以根据自己的需要编写自己的代码来下载。

以上纯属学习使用,不可用于商业用途。 如有侵权,请及时留言。 如果有什么不对的地方,还请大家批评指正。

参考链接:

版权声明:
作者:投稿用户
链接:https://www.xdwlyx.cn/1372.html
来源:网络营销圈
文章版权归作者所有,未经允许请勿转载。

THE END
分享
二维码
< <上一篇
下一篇>>