抖音脚本可能的替代方案
因为我的手机用不了脚本,所以就在尝试有没有什么替代方案可以使用。然后稍微查了一下之后发现了这个博客:https://www.cnblogs.com/cherish-hao/p/12815603.html
一开始是照着试的,然后发现链接是有的,但是单纯的用requests库不行,可能是由于拿不到签名(或者过期了),返回的数据里什么都没有。后来根据它的其他博客https://www.cnblogs.com/cherish-hao/p/12828027.html,换了selenium试了试,一开始成功读取到了网页上的视频地址,但是发现有一个问题,网页上的请求不是每次都能成功,但是请求次数太多了之后,好像就再也成功不不了了。
总结一下上述内容就是抖音视频重定向之后的网址长这样:https://www.iesdouyin.com/share/video/6874454375998311694/?mid6802184753988471559,这一串数字会存在:“aweme_id”这个里面,然后只要加载除了‘aweme_list’就可以知道视频网址,也就可以进行采集啦。而/?mid6802184753988471559这一段好像是随机生成地,就如果没了这一段,采集就不会成功,但是还是能在网页上打开。
最后又查了查,发现可能可以抓包,然后我就试了试charles。找资料的时候发现最新版的抖音已经没办法用charles抓包了,但是我看到有个老哥说可以用4.3.3的抖音来弄,然后尝试了一下发现真的可以。
接下来就是先安装配置一下charles,这个的话教程很多,我就不详细写了,毕竟我也不是专业的。唯一需要注意的点是在安卓手机上安装证书的时候,需要复制chls.pro/ssl这个网址,如果手动输入的话会下不下来,我也不知道为什么,然后就是在【安全】设置里面安装证书啥的。还有就是要用virtualxposed和JustTrustMe配合,要不然的话好像会因为证书检查所以链接不上去。
安装完之后,配合4.3.3的抖音,就已经可以采集到需要的数据了。然后需要在sequance下面找到下图所示的response,然后就可以看到上面所说的aweme_id和aweme_list了。
之后就是在charles里面全选,然后export session为HTTP ARCHIVE格式;然后因为我只会一点python,所以我就用python把这个文件里面需要的信息提取成一个txt,最后结果如下图所示:
这里有个问题,就是如果只是单独export一条记录,他就是一个json文件,非常的好获取aweme_id,但是一起导出的话会导致他把content转成了string而且还是base64加密那种,就会麻烦很多,所以我大部分时间也是花在了把这个base64转成正常的string;不过我刚刚突然发现它好像在status下面也有记录,这样的话会简单很多。
还有一个问题就是,目前的这个抓包需要手动去滑作者主页,之后可能可以用脚本弄成自动的,不过手动其实也没有特别麻烦就是了。
最后就是把这个list交给秀儿,然后让他教下我怎么通过接口直接上传~
这个人暂时没有 freestyle