第一步,我爬取了本帖的所有楼层答复信息,如下图所示(大约1500楼层信息):
第二步,在excle中初步提取无效的答复信息,使用一个函数
複製代碼
=IF(ISNUMBER(FIND(\\”1024\\”,BXXXX)),99,0)=IF(ISNUMBER(FIND(\\”感谢分享\\”,BXXXX)),99,0)=IF(ISNUMBER(FIND(\\”谢谢分享\\”,BXXXX)),99,0)=IF(ISNUMBER(FIND(\\”1824\\”,BXXXX)),99,0)=IF(ISNUMBER(FIND(\\”1842\\”,BXXXX)),99,0)
排除掉无效答复楼层458份。然后根据非著名ID二呆大佬(宜家行写的不错)提供的信息,目前社区活跃ID大约1w左右,此次调查抽样人群约占到总活跃人群的10%,抽样统计结果真实且符合实际。
第三步,接着再excle表格中筛选有价值的信息
複製代碼
=IF(ISNUMBER(FIND(\\”80\\”,BXXXX)),80,0)=IF(ISNUMBER(FIND(\\”90\\”,BXXXX)),90,0)=IF(ISNUMBER(FIND(\\”70\\”,BXXXX)),70,0)=IF(ISNUMBER(FIND(\\”60\\”,BXXXX)),60,0)=IF(ISNUMBER(FIND(\\”00\\”,BXXXX)),00,0)=IF(ISNUMBER(FIND(\\”而立\\”,BXXXX)),90,0)=IF(ISNUMBER(FIND(\\”不惑\\”,BXXXX)),80,0)=IF(ISNUMBER(FIND(\\”天命\\”,BXXXX)),70,0)=IF(ISNUMBER(FIND(\\”退休\\”,BXXXX)),60,0)=IF(ISNUMBER(FIND(\\”198*\\”,BXXXX)),80,0)=IF(ISNUMBER(FIND(\\”197*\\”,BXXXX)),70,0)=IF(ISNUMBER(FIND(\\”199*\\”,BXXXX)),80,0)=IF(ISNUMBER(FIND(\\”8*\\”,BXXXX)),80,0)。。。
说句实话这些数据杂乱无章,紧靠这些公式玩法无法搞定,寄出神器,手动统计一波:
最终生成社区年龄构成的饼状图:
总结,社区年龄构成主力为80后,当然,目前70后和90后亦能够与之平分秋色,且社区在90后群体的影响力逐渐扩大的趋势,00后亦不容小觑,作为在社区比较特殊的群体出现,00后是唯一在社区里面可以两代人同框的一代,因为00后的父母多为70后,他们的父辈与自己同属于一个社区,这也是社区魅力所在。60后的影响力在逐渐消退。预测,社区的未来即将属于90后,他们热爱二次元、鬼畜这些新鲜元素,社区因为他们越来越精彩。
统计过程中发现的一些小插曲。社区年龄最大的楼层答复63岁,另一位说自己80多(待考证),莫非是长者,玩笑而已。同时也发现几位女聚聚,自爆性别。社区年龄答复最小的聚聚16岁(真为你的父母捉急),不过信息真实性待考。
1024社区作为全球性华人聚集的社区,这里充满了朝气,未来社区越来越多的新鲜血液涌入,必将是这里人才济济,社区长虹。