采集公众号后台文章的运营数据做统计分析

采集

怎么采集具体就不多说了,和之前aardio爬虫) 实战篇:采集自己的公众号粉丝列表原理基本一样,代码也放在那篇文章里的github地址。

详细运营数据

采集页面: https://mp.weixin.qq.com/misc/appmsganalysis?action=detailpage&msgid=2247484986_1&publish_date=2024-06-12&type=int&token=1200324727&lang=zh_CN

这里面基本只有2024年的,2023年只有几篇,因为再往前的文章没有这些具体的数据,所以采集不到。不清楚是今年做的改动还是我的公众号的原因。

表格中具体的字段解释:

  • title: 文章的标题
  • msgid: 文章的id
  • publish_date: 文章的发布时间
  • read_pv: 文章的阅读次数
  • finished_read_pv_ratio: 完成阅读比例
  • avg_article_read_time: 平均阅读停留时间(单位秒)
  • follow_after_read_uv: 阅读后关注人数
  • share_pv: 文章的分享次数
  • zaikan_cnt: 文章的在看次数
  • like_cnt: 文章的点赞次数
  • praise_money: 文章的赞赏次数
  • comment_cnt: 文章的评论次数
  • subscribe_send_uv: 订阅送达人数
  • subscribe_read_pv: 订阅阅读次数
  • fans_share_pv: 粉丝分享次数
  • read_in_share_scene_pv: 分享产生的阅读次数
  • recommend_expose_pv: 推荐的曝光次数
  • recommend_read_pv: 推荐产生的阅读次数
  • recommend_follow_after_read_uv: 推荐阅读后关注人数
  • recommend_expose_read_ratio_raw: 推荐的阅读转换率
  • recommend_read_follow_ratio_raw: 推荐的阅读关注率

列表页数据

采集页面:https://mp.weixin.qq.com/cgi-bin/appmsgpublish?sub=list&begin=20&count=10&token=1200324727&lang=zh_CN

这里面包含了全部的文章,不过只有几个基础的数,具体的字段解释:

  • title: 标题
  • appmsgid: 文章id
  • send_time: 发布时间戳
  • content_url: 内容链接
  • copyright_type: 文章是否原创,1为原创,2为转载
  • read_num: 阅读数,上面的read_pv有点差异,不清楚具体计算方式,这里的和公众号网页看到的是一样的
  • old_like_num:点赞数
  • reward_money:赞赏金额
  • like_num:再看数

数据分析

数据分析我并没有接触过,所以以下只对一些字面量做统计,不会涉及专业的分析。后面有机会写一篇怎么利用免费的大模型做数据分析,例如Kimi、清华的智谱清言等。其中最强的应该是chatgpt的Code Interpreter,不过需要plus会员,就不去测试了。

订阅推送

有两个数据比较有意思:subscribe_send_uv订阅推送次数,subscribe_read_pv订阅阅读次数

粉丝增长情况

subscribe_send_uv可以看出粉丝增长的情况,因为推送次数其实就是当前的粉丝数。

这里有个掉下去的位置也是很奇怪,看了下是搭建一个问答交流平台这篇文章的推送数少了,应该是公众号后台统计的数据有问题。

粉丝增长比较稳定,按这个速度,只需要六七年就能到十万粉了,到时候还在不在做公众号都不知道了。

订阅阅读率

subscribe_read_pv数据本身没什么意义,需要计算阅读率才能反映阅读情况。画个柱状图看看(红线是平均值)

并没有什么规律,阅读率应该跟文章的标题、简介和封面图关系更大,所以才有那么多标题党。另外,阅读率前五的文章:

  1. 26.1588% 视频号下载工具重构版本2.0
  2. 22.6313% 视频号下载工具更新
  3. 18.2900% 写个视频号下载工具
  4. 17.2569% 用aardio来做网络爬虫,一键打包成exe
  5. 15.9119% aardio封装库) sunny抓包工具的使用

看来公众号的粉丝大部分还是因为视频号下载工具来的。阅读率最低的是一加七Pro刷Lineageos19(kernelsu+MicroG),只有3.1439%,同类型的另一篇文章也只有3.3242%,这种文章受众面小,大部分看到这些标题估计不会点进去看。

推荐的阅读转换率

阅读转换率 = 推荐产生的阅读数recommend_read_pv除以推荐总数recommend_expose_pv,这里的推荐应该是指看一看。

阅读转换率最高的三篇文章:

  1. 11.9762% Windows实现多用户同时远程连接
  2. 11.2516% 用aardio来做网络爬虫,一键打包成exe
  3. 11.0688% 【Python微信机器人】写一个监控采集公众号文章的插件
  4. 10.2734% aardio教程三) 元表、元方法
  5. 9.6561% PC微信逆向) 定位微信浏览器打开链接的call

一篇文章能有10%的阅读转换率应该还算不错的,毕竟每篇文章的受众面不一样,想要这个数值特别高,估计只能用引战类的标题或者擦边的封面图。

最低的是视频下载器更新2.5版本,只有0.7491%,可能因为不需要视频号下载的基本不会点,需要的自己会去搜。

推荐的阅读关注率

推荐的阅读关注率 = 阅读产生的关注数recommend_follow_after_read_uv除以推荐产生的阅读数recommend_read_pv

图里那根特别长的文章是aardio教程一) 基础语法-上,有8.8235%,而第二才4.3859%。想要这个数值高,标题取的好可没啥用,不过可以内容写的比较引战,然后设置关注才能评论,那估计也有可能提高阅读关注率。

当然,最好还是文章质量过硬,不然关注率虽然高,但是留存率几乎为零也没啥用。

最高值统计

下面就是对一些数据统计前五的文章

阅读量

截至今天,阅读量最高的前五篇文章:

  1. 9018 远程连接被爆破的最佳解决办法
  2. 8025 用aardio来做网络爬虫,一键打包成exe
  3. 7860 Windows实现多用户同时远程连接
  4. 7087 PC微信逆向) 定位微信浏览器打开链接的call
  5. 6755 写个视频号下载工具

很可惜,最高的也没有破万。

点赞数

截至今天,点赞量最高的前五篇文章:

  1. 72 视频号下载工具重构版本2.0
  2. 70 用aardio来做网络爬虫,一键打包成exe
  3. 57 写个视频号下载工具
  4. 42 PC微信逆向) 定位微信浏览器打开链接的call
  5. 42 aardio教程一) 基础语法-上

看来视频号下载和aardio教程比较受欢迎

分享数

截至今天,分享量最高的前五篇文章:

  1. 468 视频号下载工具重构版本2.0
  2. 442 【Python微信机器人】写一个监控采集公众号文章的插件
  3. 421 写个视频号下载工具
  4. 342 Windows实现多用户同时远程连接
  5. 333 用aardio来做网络爬虫,一键打包成exe

阅读后关注数

截至今天,阅读后关注数最高的前五篇文章:

  1. 213 视频号下载工具更新
  2. 210 写个视频号下载工具
  3. 134 aardio教程一) 基础语法-上
  4. 81  【Python微信机器人】写一个监控采集公众号文章的插件
  5. 76 PC微信逆向) 定位微信浏览器打开链接的call

在看数

截至今天,在看数最高的前五篇文章:

  1. 27 视频号下载工具重构版本2.0
  2. 18 用aardio来做网络爬虫,一键打包成exe
  3. 17 写个视频号下载工具
  4. 13 视频号下载工具更新
  5. 13 【Python微信机器人】写一个监控采集公众号文章的插件

前三和点赞是一样的,估计是有些点赞的人同时也点了在看,五个里面三个视频号下载的,这大概是因为公众号粉丝有相当一部分是视频号下载引流来的。

赞赏

截至今天,赞赏金额数最高的前五篇文章:

  1. 121 aardio教程一) 基础语法-上
  2. 20 基于决策树的简单验证码识别
  3. 10.04 视频号下载工具重构版本2.0
  4. 7 【Python微信机器人】写一个监控采集公众号文章的插件
  5. 6 Python调用微信OCR识别文字和坐标

第一个是aardio作者直接赞赏了100。第二篇文章是2020年写的,那个时候正好看到一些机器学习算法比较有意思,其实内容并没什么实战意义,验证码识别现在都是深度学习算法了。

公众号总共收到192.04元赞赏,离提前退休又近了一步。

推荐量

截至今天,推荐量最高的前五篇文章:

  1. 69345 PC微信逆向) 定位微信浏览器打开链接的call
  2. 62569 用aardio来做网络爬虫,一键打包成exe
  3. 60470 视频号下载工具更新
  4. 53276 写个视频号下载工具
  5. 46200 Windows实现多用户同时远程连接

这个推荐量估计是系统根据某些数据来决定的,有的文章会获得大量推荐,而有的则基本不会到推荐里。

平均停留时间

截至今天,平均停留时间(单位秒)最长的前五篇文章:

  1. 240 aardio教程四) 理解名字空间(namespace)
  2. 141 简单编程调用微信 OCR 识别图像文本
  3. 107 aardio教程) 搭建自己的扩展库仓库
  4. 85 多个开源的js补环境框架测试
  5. 76 aardio实战篇) 下载微信公众号文章为pdf和html

看来是真有人认真看文章学习。

完读率

截至今天,完读率最高的前五篇文章:

  1. 0.671875 简单编程调用微信 OCR 识别图像文本
  2. 0.614815 香橙派5plus从ssd启动Ubuntu
  3. 0.612959 视频号下载器更新2.5版本
  4. 0.608962 Windows实现多用户同时远程连接
  5. 0.574525 搭建一个问答交流平台

一般一些比较基础的教程完读率会高一些,稍微深一点的教程很多人基本打开就退出了。


请使用浏览器的分享功能分享到微信等