人与人之间存在着多种关系,比如兄弟姐妹关系、父子关系、同事关系、师生关系等等,每一种社会关系把我们联系在一起,最终形成了一个庞大的社交网络。人类社会中存在着庞大的社交网络早已被熟知,但是社交网络能够为我们解决什么真实的问题呢?我们是否能够利用社交网络在生活中的某些方面做出准确的预测呢?就像前几年GOOGLE利用网民搜索的信息预测到流感一样,社交网络的研究学者Nicholas Christakis指出,现实生活中的社交网络同样可以预测。
以美国为例,美国疾病控制预防中心对于大规模疾病爆发的预测方法,是仅从实验室收集数据分析疾病的发病率,每当出现一个相同病例时,就把这些数据积累起来,作为最后预测的基础。这样做存在很大的随机性,并且数据收集上来后,会出现延迟,可能等到疾病爆发之后,预测结果才能演算出来。在预测前,假定每个疾病案例都是随机的,并且在传播过程中的作用是平等的,但是实际情况并非如此。一般情况下,将一个复杂的社交网络抽象出来,用点和边构成,会发现网络中存在重要的点和次要的点,一些点处于网络核心,它们与周围的很多点有存在联系,这也就是认识的人多、人脉广的那类人,一些点处于网络的边缘,它们仅与其中几个点存在联系,这也就是认识的人少、性格相对孤僻的那类人。通过这样分析之后,发现疾病在这类点中传播的效果是完全不一样的。即使疾病首先出现在边缘的节点,也有很大可能不会大规模爆发疾病。相反,即使只有几个核心节点出现疾病症状,极有可能会爆发大规模的疾病。沿着这个思路出发,在一群人里面随机抽取10个疾病样本的效果,肯定没有抽取10个处于核心节点的疾病样本的效果好。如果真的能够在人群中找到核心人群,就能够提前发现疾病的爆发,真正地做到预警。
现在的问题是,如何描绘出社交网络?正如上文所说,社交网络关系复杂,有些关系甚至没有办法统计,因此构建出一个完整的社交网络几乎是不可能完成的事情。Nicholas Christakis提出了一个值得借鉴的方法:你知道你的朋友有比你更多的朋友吗?这就是社会学家Scott L.Feld提出的“友情悖论”,在一个朋友“等级”的排位上,你最先想到的朋友,“等级”往往都高于你本人,也更接近社交网络的中心。从这个理论出发,在一群人中随机选取样本找到核心节点的概率要低于从这群人的朋友中随机选取样本找到核心节点的概率。Nicholas Christakis基于这个理论,在哈佛大学做了一项H1N1流感的预测研究,选取了7百多个学生作为样本,并让这些学生推荐朋友,实时跟踪观察两个样本群体之间的变化。实验结果与理论一样,朋友样本流感爆发比学生样本提前了16天,16天就是预警的天数。最后,将两组样本形成社交网络图,并绘制一个随时间变化的疾病爆发图,结果核心节点是疾病爆发的源头。
把这个理论延伸到虚拟的社交网络中,朋友可以用关注度更高的明星用户替代,关注度越高,表明该用户与其他用户的联系越紧密,越是处于社交网络的核心。如果在观察网络质量安全事件时,首先重点关注核心用户,就是尽早地发现质量安全信息传播的信息来源,提前做出预警。