申请号:CN201610501484.7申请日:2016-06-30公开号:CN106204293B授权日:2019-05-31IPC分类号:G06Q50/00,本发明公开了一种基于Hadoop平台的社区发现算法,在MapReduce架构下实现,包括四个步骤:①读入社会网络数据,构建无向图G,通过数据分片得到节点n、相关节点个数D;②计算每两个节点之间的紧密度,并将处理后的数据写出到文件;③分割数据行为边和紧密度,完成节点集,将数据以(节点,节点集编号)的形式存储在数据结构Hashtable中;④根据步骤三的数据,找出未加入节点集的节点,将其划入与其有联系的相关节点所在节点集中。本发明显著提高了算法的数据处理能力,将运算规模提高到上亿次,大幅提高了对大规模社交网络的挖掘和分析能力,实时性高;本发明基于全网络进行分析和搜索,采用从社区核心向外逐渐扩散的挖掘方式,提高了社区算法的效率,准确度高。