时代少年团成员原创微博画像|Part 1A|简单数数
写在前面
总目录、数据来源及预处理,请转至Part 0。
本文为Part 1的第一篇。它简单粗暴,统计并比较了成员们的原创微博/视频博数量,以及话题标签(如#元气爱豆的日常#;以下称hashtag)与@标签(如@时代少年团;以下简称@)的使用状况。
原创微博/视频博总数统计
笔者首先计算了所统计时段内,成员们原创微博/视频博的总数。对于视频博,亦计算了其占比,以及最近十条中有几条视频博。详情请见下图(图表按多寡排序;如有并列,番位高的在下)。

从上图能看出如下几点:
- 宋亚轩、张真源的原创微博/视频博总数均在前三(尤其是张真源,两项都在第一名)。应该可以说是成员中最勤快更新的。
- 马嘉祺、贺峻霖更新微博时有明显的偏好。马嘉祺的原创微博总数队内最低(而且和倒数第二名有很大距离),但视频博占比高达55%(队内第一),且视频博总数为队内第三。贺峻霖的原创微博数很高(而且字数都非常非常多——笔者还没计算,但估计总字数应该会是全团第一),但视频博的比例很低。
- 丁程鑫、刘耀文、严浩翔的原创微博/视频总数均在中下游,其中刘耀文、严浩翔的视频博占比更低一些,与贺峻霖相仿。
- 最近十条原创微博中,马嘉祺、张真源的视频博比例仍然过半。可以说是很喜欢发视频了。
以上仅仅简单计算了原创微博的总数。那么,这一年多的时间里,成员们的发博频率有什么变化呢?笔者进一步计算了成员们每个月的原创微博总数(见下图)。

从上图能看出如下几点:
- 马嘉祺、丁程鑫没有明显的发博高峰期,可能是因为在时代少年团出道之前已经搬家完毕?
- 宋亚轩、刘耀文的微博更新数在2020年3月达到了顶峰。同理,有张真源、严浩翔的2020年4月以及贺峻霖的2020年5月。不知道是不是这些成员在当月都在搬家。
- 这几个顶峰之后,每个成员的发博数量都有明显下降,基本没能达到2019年末/2020年初的水平。可能是大家都变忙了吧。
- 不过,2020年6月至10月(以及2021年1月),张真源仍然维持着较高的每月发博总数(与刚出道时基本持平;队内一直保持第一)。尤其是在10月,他的每月发博总数甚至迎来了第二个小高峰,不知道这个月对张真源是否有特殊含义。直到高考闭关,张真源的每月更博数才开始减少,他的努力值得肯定。
- 2020年年末,队内最勤劳更新的是丁程鑫;而2021年2月及之后,宋亚轩一直是队内最努力更新的成员。这或许与他们各自的在播综艺有关。
Hashtag的使用
接下来,笔者提取并统计了成员们在原创微博中使用的hashtag数。详情请见下图(图表按多寡排序;如有并列,番位高的在下)。

从上图能看出如下几点:
- 张真源、严浩翔、贺峻霖的hashtag总数最多。
- 刘耀文、张真源、严浩翔平均每条原创微博的hashtag数最多,最近十条的hashtag总数前三名也是他们。
- 相比其他成员,马嘉祺原创微博中的hashtag明显偏少,统计的三个方面都是最后一名。
- 笔者亦统计了一下成员们最常使用的hashtags,除了有固定综艺的三个人(马嘉祺、丁程鑫、宋亚轩),大家的top 5都是很相似的tag,看不出什么倾向性。
@的使用与队内的互@网络
笔者进一步提取并统计了成员们在原创微博中@其他人的次数。详情请见下图(图表按多寡排序;如有并列,番位高的在下)。

从上图能看出如下几点:
- 马嘉祺、丁程鑫、宋亚轩@他人的总次数、平均次数都是最多的。恰好他们也是番位的前三名以及有固定综艺的成员。
- 相较之下,其他成员@他人的频率都比较低。从总次数/平均每条微博次数来看,4-5位都是严浩翔、贺峻霖,而6-7位都是刘耀文、张真源。
- 除了马嘉祺(章子怡、张颂文)、丁程鑫(郭敬明)、刘耀文(GUCCI)三名成员,大家最常@的top 3都是队内成员。所以,笔者进一步统计了队内互@的次数,请见下表。

上表中, 第 (A行, B列) 个单元格为全部原创微博中,成员A@成员B的总次数。比如,马嘉祺共@了丁程鑫3次,而丁程鑫共@了马嘉祺2次。宋亚轩、张真源两名成员不知为何分别@了自己一次,这里笔者进行了保留(去除亦不影响下面的结论)。可以看出:
- 宋亚轩@其他团内成员的总次数是最多的,刘耀文@其他团内成员的总次数是最少的。
- 张真源被其他团内成员@的总次数是最多的,严浩翔被其他团内成员@的总次数是最少的。
- 除此之外,也能看出每个成员分别被谁@次数最多/少,@谁次数最多/少,这里笔者不一一赘述了。
把上面的表格以网络的形式展现,就得到了下图。这里的节点位置是由算法自动决定的最优位置,没有经过任何手动调整。

可以看出,宋亚轩在这个网络的中心位置,因为@别人多(队内第一),被别人@也多(队内第二)。这里的箭头都是有向的,我们可以进一步简化这个网络,计算每两个成员之间的“互动值”,即取(成员A@成员B,成员B@成员A)的平均次数。
用这个“互动值”,我们可以画出一个无向的互@网络(下图左),并且找到它的最大生成树(下图右)。

结果还是比较有趣的:
- “互动值”明显较高(图中的边粗且颜色深)的是丁程鑫—宋亚轩—张真源—严浩翔—贺峻霖这条主轴(刚好与番位顺序一致哈哈),而马嘉祺、刘耀文与其他人互动得相对较少。
- 宋亚轩、张真源两个人处在这个互@网络及其最大生成树的中心位置。我们得到的最大生成树是:宋亚轩与马嘉祺、丁程鑫进行连结;张真源与刘耀文、严浩翔进行连结;严浩翔进一步连结了贺峻霖。
写在后面
笔者欢迎一切有建设性的讨论。如需转载,请注明出处及作者。
下期预告
- 时代少年团成员原创微博画像|Part 1B|表情的使用