数据分析与可视化：谁是安全圈的吃鸡第一人

发布时间：2019-04-17 01:45:54 所属栏目：建站来源：Omegogogo

导读：副标题#e# 放假和小伙伴们打了几把PUBG，大半年没碰，居然也意外地躺着吃了次鸡。吃鸡这个游戏果然得4个认识的人打(dai)战(dai)术(wo)才更有趣。由于身边搞安全的人比较多，之前也会和一些安全圈的大佬一起玩，经常会有些认识或不认识的黑阔大佬开着高科技

社区发现算法用来发现网络中的社区结构，多数是聚类类型的算法。使用社区发现算法可以帮助我们发现联系相对紧密的社区，从而帮助我们把安全圈和其他圈子的人分割开来。

常见的社区发现算法有：Girvan-Newman、Louvai、K-Clique、Label propagation等。

在Python下可以使用NetworkX来完成各类社区发现算法的调试，但NetworkX本身只是算法工具，并不具备可视化功能，而笔者联调plt画出来的图实在奇丑无比。因此这里使用算法单一但可视化功能强悍的gephi来实现。

fast-unfolding是基于Modularity的算法，也是复杂网络当中进行社团划分简单高效、应用最广泛的算法。

用force atlas图布局：

fast-unfolding：

除此之外Gephi还支持GN算法，但内存要求较高，有兴趣的同学可以尝试下其他算法。

经过30000余次迭代，最终得到了19个社区，用图像来表示是这样的：

在社区发现算法中社区的数目和大小通常是不可知的，一般是用模块度Modularity来检查社区分类的合理性。由于本文采集的数据较少且这里的好友关系是双向的，不像微博的关注/粉丝的机制能较准确地找出图的连通性，所以这里的社区发现效果并不理想。

笔者在使用NetworkX尝试了多种算法和不同的参数后，最终选择了一个样本数量为1125的社区，覆盖了原数据集样本总数的88.58%。在简单观察了这个社区的合理性后，决定使用这份数据集来做后续的战绩分析。

三、战绩爬取和分析

1. 谁是安全圈的吃鸡第一人

（编辑：西安站长网）

【声明】本站内容均来自网络，其相关言论仅代表作者个人观点，不代表本站立场。若无意侵犯到您的权利，请及时与联系站长删除相关内容!