2024版蒲公英平台收罗软件，批量爬取小红书优质博主！ ...

丝 · 2024-6-22 07:47:49

一、配景先容

1.0 爬取目标

众所周知，蒲公英是小红书推出的优质创作者商业合作服务平台，致力于为品牌和博主提供内容合作服务，可以高效的为品牌匹配出最符合的优质博主。
蒲公英平台，必要有一定权限的企业资质账号才能申请开通。开通之后，进入【探求博主】页面，即可根据一定的筛选条件过滤出满意的博主列表，如下:

上面是筛选条件，下面是筛选结果。
爬虫功能分为2大类模块：第一是根据筛选条件爬取博主列表，第二是根据爬取到的博主id进入详情页面爬取详细数据，详情页如下：

通太过析网页接口，开发出了爬虫GUI软件，界面如下：

共爬取到34个字段，字段如下：

复制代码

详细演示数据：（看《蒲公英》这个sheet页）

见原文

1.1 演示视频

软件操作演示视频：见原文
1.2 软件阐明

重要阐明，请详读：

Windows用户可直接双击打开使用，无需Python运行情况，非常方便！
必要在cookie.txt中填入cookie值，持久存储，方便长期使用
支持筛选笔记搜索关键词、笔记类型(不限/图文笔记为主/视频笔记为主)、粉丝数目、图文报价、搜索页范围。其他个性化筛选条件，可以和我沟通定制
爬取过程中，有log文件详细记录运行过程，方便回溯
爬取过程中，自动保存结果到csv文件（每爬一条存一次，防止数据丢失）
可爬34个关键字段，含：关键词,页码,小红书昵称,小红书号,地点,机构,数据更新至,小红书链接,粉丝数,账号类型,图文报价,视频报价,合作笔记数,预估阅读单价_图文,图文3秒阅读,一样平常_阅读中位数,一样平常_互动中位数,一样平常_阅读来源发现页占比,一样平常_阅读来源搜索页占比,合作_阅读中位数,合作_互动中位数,合作_阅读来源发现页占比,合作_阅读来源搜索页占比,女性粉丝占比,年龄占比最多的,账号评估,合作笔记1阅读数,合作笔记2阅读数,合作笔记3阅读数,合作笔记4阅读数,合作笔记5阅读数,合作笔记6阅读数,合作笔记7阅读数,合作笔记8阅读数。
以上爬取字段已经包含，如无法满意个性化要求，可定制开发（接口已调通）
以上。

二、代码讲解

2.0 关于接口

由于收罗字段较多，开发者模式中分析接口不止一个，收罗程序整合多个接口开发而成，归纳如下：

以上。
2.1 爬虫收罗模块

此软件开发本钱较高，代码量大、实现逻辑复杂，为掩护个人知识版权，防止恶意盗版软件，不展示爬虫核心代码。
2.2 cookie获取

运行软件之前，必要填写cookie值到txt配置文件中，获取方法如下：

2.3 软件界面模块

主窗口部分：

复制代码

部分界面控件：

复制代码

日志输出控件：

复制代码

2.4 日志模块

好的日志功能，方便软件运行出题目后快速定位缘故原由，修复bug。
核心代码：

复制代码

软件运行过程中天生的日志文件：

三、转载声明

转载已获原作者@马哥python说授权：
博客园原文链接: 【GUI软件】小红书蒲公英数据批量爬取！高效筛选优质博主，助力品牌商!

免责声明：如果侵犯了您的权益，请联系站长，我们会及时删除侵权内容，谢谢合作！更多信息从访问主页：qidao123.com:ToB企服之家，中国第一个企服评测及商务社交产业平台。

		自动登录	找回密码
密码			立即注册

0 个回复