影刀RPA自动化工作流:小红书爆款笔记采集与AI评论辅助分析,进行数据驱动的内容创作
在前段时间做小红书的过程中,我总结了一套利用影刀RPA进行数据采集和评论分析的工作流,根据关键词与衍生的联想词采集小红书笔记,对于异常值笔记进行文案与评论采集并通过大模型分析用户需求、提供选题建议等。下面分享给大家:
工作流详情:
第一步:启动RPA根据关键词采集笔记信息
首先,我们需要输入想要分析的关键词,例如“美妆”或“旅游”。然后自动拓展平台上的一级/二级关联词,不放过任何一个潜在的流量词。采集所有关键词与联想词相关的笔记。
第二步:筛选异常值
我们将点赞数或互动量远高于平均水平的笔记或作品定义为异常值。根据GPT-4的建议,我们使用RPA+IQR和CES计算的方法对采集到的数据进行异常值判断,采集完成数据后会根据设定的阈值自动标记这些异常值作品,方便我们后面评论采集与深入分析。
第三步:评论分析与选题建议
用户的声音和反馈相当重要,其中蕴藏着大量的用户数据和真实想法。这些平台的爆款内容往往能够反映出用户的真实诉求和生活状态。因此,通过采集和分析这些平台的数据,我们可以洞察用户需求,挖掘市场机会。通过数据采集和AI分析,洞悉用户需求。
我们继续使用影刀采集异常值笔记的文案和评论数据,并导入 Claude opus 或 Gemini 1.5 等大模型进行分析。通过情感分析和主题提取,我们可以深入了解用户的真实想法和关注点,并获得AI选题建议,为内容创作提供灵感。
演示
https://ia0969wpr2.feishu.cn/wiki/DRcfw8JohiERrQktaMtcvi5enke
下面将详细介绍如何利用影刀RPA自动化工具,实现小红书和抖音平台的数据采集和评论分析,并以“备孕”为关键词分享整个过程与主要实现源码
第一部分:小红书数据采集:PC端与APP端结合进行数据采集
小红书数据采集分为PC端和APP端两种方式。
PC端采集: 优点是操作便捷,但缺点是每个关键词最多只能采集约200条笔记。所以这里我们自动拓展小红书上的上的一级/二级关联词,并且使用这些新的关键词进行笔记采集,还是以“备孕”为例,一级联想词为10个,如下:
备孕男生注意事项、备孕攻略、备孕期间吃什么、备孕男士吃什么、备孕需要准备什么、备孕检查去什么医院什么科、备孕多久怀孕正常、备孕叶酸推荐哪个品牌、备孕多久后可以去洗、备孕期间注意事项
二级联想词大概二百多个,采集后如下,可以看到二级联想词更多,几乎涵盖了原始关键词下的所有热门拓展搜索,我们以这些词重新进行笔记采集
APP端采集: 可以突破数量限制,采集关键词下的所有笔记。APP端小红书的采集方法我分享在了这里:https://t.zsxq.com/Xpvu2
PC端小红书的影刀采集流程和主要源码如下:
1.采集输入关键词的一级联想词
2.采集原关键词与所有联想词相关的笔记
笔记采集 根据设置RPA会选择一级/二级联想词进行笔记采集 二级联想词有二百多个,我们先以一级联想词为例,执行完成后可以看到我们已经采集了该关键词下的1000多条笔记,并且影刀通过IQR的方式对所有异常笔记进行筛选,并且导出了一个新的只有异常笔记的Excel:小红书笔记采集_备孕_异常笔记.xlsx。我们可以继续采集这部分异常笔记的评论信息并进行分析。当然,我们也可以完全自动化,采集完成异常笔记之后直接进行评论采集与大模型分析,这样适合在无人值守的情况下进行批量采集。如果需要对采集评论的笔记进行筛选的话可以使用半自动的方式。
3.小红书评论采集
用户的声音和反馈相当重要,其中蕴藏着大量的用户数据和真实想法。这些平台的爆款内容往往能够反映出用户的真实诉求和生活状态。因此,通过采集和分析这些平台的数据,我们可以洞察用户需求,挖掘市场机会。
这部分是自动进行的,开始采集前如果我们勾选了评论采集,我们继续使用影刀采集异常值笔记的文案、点赞评藏、所有评论数据进行采集。采集后的评论如下,包括笔记的文案、标签、点赞评藏、评论详情等
如果我们勾选了大模型分析之后会导入 Claude opus 或 Kimi 等大模型根据提示词进行分析。我们可以深入了解用户的真实想法和关注点,并获得AI选题建议,为内容创作提供灵感。如下,机器人会把大模型分析后的结论保存到桌面文件。报告内容提示词可以自行进行修改
最后感谢大家阅读到了这里,通过数据采集和AI分析,我们可以更好地了解用户需求和喜好,从而优化内容创作和营销策略。无论是小红书、抖音,还是其他平台,都可以应用类似的方法进行数据挖掘,获取有价值的用户信息。在信息时代,善于结合AI进行数据驱动的分析和内容创作或许是突围的关键。这套工作流,希望能给大家提供的一个思路。
以上就是我的分享,希望你能阅有所获,下面是我的微信,如果你也对RPA+AI或者工作自动化感兴趣,欢迎添加微信链接