某软件社区某专题内容抽样筛选
我感到很骄傲,因为我独立完成了一件很棘手的问题。
今天经理让我把某社区的某专题的内容做整合并分类。
我进去那个社区才发现,竟然接近3万条内容,包括博客、文档、问答等,起初我直接尝试把所有内容粘贴到文档里,然后再整理,可是这个网页太慢,而且这个数据实在太多,就算我全部整理好,接下来怎么分类统计呢?要知道这可是3万多条数据啊,而且全部都是英文。。。
于是我就想到了抽样,并且我想,我先拿出一些样本,然后统计这些样本的最受欢迎的内容,这些受欢迎的内容跟肯定是经理最关心的内容,于是我就这么做了。
接下来发现另一个难题,这个网页每次只显示下一页,我要抽样的话,必须选择第五页、第10页这样的页码啊。我不想一页一页的翻下去,太麻烦,我就观察每一页的网址变化,发现:每页网址最后的数字就是这个网页的页码乘以每页显示的数量20,比如第5页的网址最后的数字就是100,这个数字就是5乘以20得出的。哈哈,下面我只需要换一下网址最后的数字就可以随便跳转到我想要的页码了。
可可可是,当我尝试跳转的时候发现,网页自动屏蔽这种跳转,这样跳转得到的页面显示为“对不起,您查看的页码已经超出页码最大数”,于是我先跳到后一页,再返回一页,就可以正常显示了。比如我想要跳到第55页,我必须先跳到56页,这个页面是屏蔽不显示内容的,但我选择网页的上一页,这样可以到达55页,而且是正常显示的,哈哈。很快就搞定了3万条内容的抽样。
接着,我开始整理文档,发现选中某个单元格右键直接可以将这个单元格下面的所有内容筛选和排序,而且这个筛选还可以设定筛选范围,比如我可以选择‘浏览数’大于等于100的内容,哈哈太实用了。这样,不到一会儿我就完成了全部筛选排序的工作。这个阶段我还发现,我粘贴的内容带了浏览量一栏数据,这个正好可以做筛选啊,哈哈,我真是太聪明了。
我看了下时间,共花费不到2.5小时就搞定这个棘手的任务。
看来工作不能盲干啊,必须使用方法。而且小技能可以帮大忙哦。
今天经理让我把某社区的某专题的内容做整合并分类。
我进去那个社区才发现,竟然接近3万条内容,包括博客、文档、问答等,起初我直接尝试把所有内容粘贴到文档里,然后再整理,可是这个网页太慢,而且这个数据实在太多,就算我全部整理好,接下来怎么分类统计呢?要知道这可是3万多条数据啊,而且全部都是英文。。。
于是我就想到了抽样,并且我想,我先拿出一些样本,然后统计这些样本的最受欢迎的内容,这些受欢迎的内容跟肯定是经理最关心的内容,于是我就这么做了。
接下来发现另一个难题,这个网页每次只显示下一页,我要抽样的话,必须选择第五页、第10页这样的页码啊。我不想一页一页的翻下去,太麻烦,我就观察每一页的网址变化,发现:每页网址最后的数字就是这个网页的页码乘以每页显示的数量20,比如第5页的网址最后的数字就是100,这个数字就是5乘以20得出的。哈哈,下面我只需要换一下网址最后的数字就可以随便跳转到我想要的页码了。
可可可是,当我尝试跳转的时候发现,网页自动屏蔽这种跳转,这样跳转得到的页面显示为“对不起,您查看的页码已经超出页码最大数”,于是我先跳到后一页,再返回一页,就可以正常显示了。比如我想要跳到第55页,我必须先跳到56页,这个页面是屏蔽不显示内容的,但我选择网页的上一页,这样可以到达55页,而且是正常显示的,哈哈。很快就搞定了3万条内容的抽样。
接着,我开始整理文档,发现选中某个单元格右键直接可以将这个单元格下面的所有内容筛选和排序,而且这个筛选还可以设定筛选范围,比如我可以选择‘浏览数’大于等于100的内容,哈哈太实用了。这样,不到一会儿我就完成了全部筛选排序的工作。这个阶段我还发现,我粘贴的内容带了浏览量一栏数据,这个正好可以做筛选啊,哈哈,我真是太聪明了。
我看了下时间,共花费不到2.5小时就搞定这个棘手的任务。
看来工作不能盲干啊,必须使用方法。而且小技能可以帮大忙哦。