豆瓣
扫码直接下载
好哒,我去关注~
人数比较多,曲线放在一起会很杂乱,其实并不利于观察比较,我相信组里的观察员们都会结合纵坐标实际数值综合评估数据的😊。
…….你在说什么?我在说基准线的建立,你在说底气?我两说的都不是一个东西,一个人的数据肯定会有异常值的(注意此异常不是贬义不是二极管理解的注水数据),比如播剧比如生日比如一些活动,不能每一天都能拿来做基准,一年之内做数据平均值或者趋势线来做拟合才勉强合格,这是基于统计学的一个观点,当然这个工作量确实有点大,但这才有基准的意义,还可以通过每一年的平均值来判断这个人的粉丝活跃度或者粉丝盘,我们可以环比还可以同比
数据大拿,厉害
那工作量还挺大的,其实是不是可以找相对平和月份做一个,一年数据实在太多了
我明白你的意思,因为每个明星的受众不一样,活跃度也不一样,直接横向比较就会失去意义,纵向比较确实比较好,拿明星上一年的平均拟合值作为基准线,与下一年的每天签到来做比较,更能看出明星的异常值,但是这个工作量太大了,历史数据源没有或者很难查询,没钱拿我反正不会干,除非写个程序抓取微博的历史数据,但会被抓吧?!!!因为我不确定这算不算窃取
一年的其实也才勉强合格而已
啊,我不是这个意思。我理解横向和纵向应该都要结合数据一起分析下。先不说花粉的情况,我理解生粉都是有共性的,横向看数据很重要。
一年的话,工作量有点大了吧!而且比如去年一年肖战连着播了三部剧,今年目前为止还没有播剧,也不好比啊?而且我总觉得“流量”就是流动的
个人觉得这样比较其实已经挺清晰明了了,太专业太深入也没太大必要😂
我觉得楼上在讨论的用肖战超话的某段时间(一年)内的签到情况作为基准线的这个想法,首先可能很耗费精力去弄这个事情,其次,好像没有必要。比如,有些明星超话日常签到30万,如果哪天他/她发微博了或者有新商务官宣,那签到人数肯定会涨,到了生日那天,应该是全年签到人数最多的时候,可能多个一二十万,达到二三十万,不过像生日这种情况一年也就一次。 楼主用了11号和15号两天肖战超话的签到情况分别来作为对比背景板,很多组员已经能看出来名堂了,那就是统计区间内的增量情况,签到高峰期时间段都符合人类的作息规律。如果某个明星的超话签到在大家大多数在睡觉的时间段,猛增五万、十万的话,这个事情本身就能说明问题了。即使存在大家提前商量好一起团建的这种情况,也不会选大家都休息的凌晨时间段,一般抢完靠前的签到名次以后,半小时一小时之内就睡了。
楼主真厉害!佩服!
这是一个博主发的肖战23.6和24.6的抽查的样本,可以参考一下。
再发一个参照
原来几个钻二也就十万的水平😅
其实不需要这样一个基准值,就算找到了肖战的平均趋势,也不见得适合其他家。没家粉丝的年龄、地域分布不一样,本来数据曲线就该不一样。但总体趋势应该是类似的,都是常规能理解的。
很炫的样子,但看不太清🤣🤣
总结,就是肖战的超话签到总体呈平稳状态,绿色的线是基准线,大幅度偏离这根线就是有异常数据,他总体稳定
我说的是第三排额图
看数据线是否平滑无折角,多次抽查是否基本一致,签到有增有减,但曲线应差不多,活人正常作息规律不会变。
楼上各位,一个超话数据而已,不用上精度吧,留点余地给阿+养养鱼吧,不然这盛世繁华舞给谁看啊😔
🐮
凌晨5点😋
这样一看,谁氵了就一目了然了,其中几个都注成海了🤣
这个帖好牛呀👍让氵无所遁形😂
给楼主点大赞!
我说怎么有人在别组内涵呢,原来是这个贴啊,其实之前有比较粗糙的鉴氵方式,其实就是看剧播那段时间的数据,剧播完数据回落是正常的,当然现在微博都快成夕阳红产业了,历史的车轮是不可避免的,就像萝卜快跑的出现
这帖子内容这么棒管理员怎么没加精?女明星版本的楼主也是用同样方法还没完整内容就加精了呀 ( ・◇・)?
我记得之前好像是加精了的,楼主改过一次大标题。 我猜是改了标题以后掉了?我也不确定哈,可以让管理员重新加精。
改标题会取消呀?好神奇的规定 感谢解答✧。٩(ˊᗜˋ)و✧*。
我猜大概原因是精这个红色的字本来就打在标题那儿的
@豆友257590791 @Alex @亦若云 麻烦管理员加精,谢谢ฅ^•ﻌ•^ฅ
[内容不可见]
是假的又如何,没几个人研究真假,大多数人是关心数量
大工程哇!楼主辛苦
非常棒,后加的每小时占比图太直观了,每个人氵多少比例一目了然
清晰直观,作图👍👍👍
好吧看完主楼更新,感觉除了三字四字几乎全军覆没了,增量占比折线图真是让💦无处遁形。
楼主如果可以的话,能拉一下签到、互动、热度三条线吗?想看一下这三者之间的关联性。@大长腿(已停用
抱歉现在暂时没有时间做呢😂。
楼主叠的这个甲👍👍👍👍
想问好久了,一直不好意思问,叠甲是什么意思?这是游戏方面的用语吗?
辛苦了(。•ㅅ•。)♡
本指游戏里的护甲,可以抵挡伤害。现在一般是防止在网上的发言被人曲解/杠/辱骂,所以提前声明利益相关的某种身份立场 ╮(╯∀╰)╭
嗯嗯,就是防止抬杠,我事先说明,叠甲,我再次说明,哈哈,大概是这么个意思吧。
是的,上手很快( ิ◕ܫ ◕ ิ)b 像我回话就会常加表情就是怕纯文字会让人误会语气之类的,这也是种叠甲(つд⊂)
是的,就是为了防杠的事项说明,每次看说明都不一样,楼主的说明一次比一次多
开个数据贴不容易啊,说明得给够
楼主,看你文中提到的其他几个数据,好像互动量也是一个类似签到的动态数据,不知道互动量是不是可以用同样的方法抓取一天的变化曲线呢?
因为你和楼上其他友友都提了这个需求,所以我刚去超话评估了下这块数据,在此统一回复下大家。 互动量和热度我在手机APP端看到了,但是在网页端没找到(如果同学你知道网页端在哪,辛苦告知我)。我的程序目前仅支持网页端数据抓取,对于网页端没有的数据就无法获取了。 至于手机端数据,一般都是加密的,去解密这些数据不仅很难实现,而且最关键的一点是容易违法,真“刑”的事咱不能碰😂。
夸夸楼主!又跟着涨知识了!!
好多买了,有的人买的太多了
好直观啊,看来老牌流量还都比较老实,这几个新流量都好水啊
有几个水的
增量占比这个曲线好明显啊
这两天被大规模扒出的“鸡淇人”也可以用AI实现发帖,签到,回帖等操作,但需要大数据去喂,所以还是要多数据去看,有些高级水,就是在模拟真人了。花花那个这几天突然热度高起来的,其做法总是似曾相识。
男明星的好像没有统计每个人一天一共签到多少
看男明星各自签到明细数据的最后一行即可。
哦对哦,楼主我比较想知道每个人大概氵了多少,因为氵1万2万的我觉得还好,如果氵5万10万的那就不是一个档次了。注氵和注海的区别
这几天男⭐有突增的,不知道楼主有没有兴趣做下近几天签到的
哈哈奇奇怪怪的知识又学到了
不知你是想看哪些明星的呢
想看播剧的那几个🙏🏻
因而最近在播和刚播完的剧还是有一些的,能辛苦具体说下是哪个明星嘛。
有的人真的很明显
到时候可以跑一下暑假播了剧的几位ll
肖战和三小只还是厉害啊
楼主你的数据被别组引用,把几个异常时间点列出来了,感觉重合率挺高的,难道用的是同一批机器?楼主有没有兴趣分析一下
厉害
搬运个图,举例突增1万以上的
某家被扒出注氵,然后注得更疯狂了,还不以为耻、反以为荣
纠正: 这个是预测模拟曲线,是抓取的粉丝晒的签到截图时间和签到名次,是模拟修正的数据,并不是真实数据。举个例子: 0:10:01 , 1人签到排名 1万名,0:10:59 签到1.5万名 ,你说的这个抓取的可能是1万的 也可能是1.5万的。
楼主的是真实数据,你发的是模拟修复预测数据,模拟修复每秒钟的误差,都会影响后面曲线的趋势。而且抓的是图片识别数据,错误率也不低(假如0点1分签到1万名,0点5分截屏。抓取数据数0点5分有1万签到),所以只能做参考,属于预测数据。但是楼主真实数据。这么说能懂吧。
而且楼主数据无法跑,历史的数据了,当天跑了才有有当天数据,当天没跑就没数据。
这是两年的,上面是6天24小时的签到曲线,下面是一个是凌晨3:00前的签到曲线,一个是修正数据。主要看的是签到曲线的平滑度,有无突起异常的折线。
回转发momo,多谢帮忙补充周深这边的数据趋势特征信息。 另,正如我帖子里提到的那样,我这暂时只展现实际签到人数,并不会基于一天采集数据就进行鉴水or鉴干操作的。
我就说 明明23-1点这个时间段最多才是正常的
隔壁有人反驳我说 0点签到吞热度所以大家都不零点签到
好几个是中午11点签到的咋回事
第一次看到这表,好先进啊。 另外感慨一下大家睡觉好晚啊,这么多人半夜签到。
自从那个🐔淇人被扒出来,几个人的号占据了他整个超话数据的半壁江山后………我都不信他到底有几分真了………
是不是5点的水比较便宜,22点-2点的水比较贵。
第一次看到这图,楼主厉害👍🏻
结合隔壁明灯组的统计数据,事实证明数据最真实的是肖战,四字,鞠婧祎。这三个人数据任何时候抽查都是基本真实的。
厉害!
赞你浪漫,我根据我的喜好,不管谁家先看但凡用绿色的(我的股票🤣
最近可以抽查一下,央视说抓了很多水军
怎么这么搞笑,生日转发比签到还少😂
今天有人做了7日分时曲线图,小水大水很明显,当然高级氵看来还是查不出。
长期来看到现在 三字的数据还是那么干 稳稳的
这个帖子含金量增加了,哈哈,看了昨天的签到大跳水。
牛人啊,自己整的小程序吗
在这里发现跟你一样特别的人,并与之交流...