Published on

NCM中的一些基本概念

Authors

三元闭包

在社交网络(Social Network, SN)和在线社交网络(Online Social Network, OSN),具体的人和社交关系可以抽象成一张巨大的图。 社会关系的变化就是随着时间迁移图的结构的变化。 那么这个网络构成的图有什么特点呢?社会学家发现了一个规律:

如果两个互不认识的人有了一个共同朋友,则它们两个在未来成为朋友的可能性提高。

也就是当网络中节点A和节点B之间的共同节点越多时,未来A与B直接建立边的概率更高。

我们可以通过聚集系数来刻画三元闭包,节点A的聚集系数=A的任意两个朋友之间也是朋友的概率

强三元闭包

后来社会学家Mark Granovetter发现了一个问题:就是在找工作这种重要的事情上,一般熟人会比亲近的朋友给予更多的帮助 我们可以给结点之间的边一个权值,表示这个关系的强度。在上面的例子中,熟人的关系强度是大于朋友的,给出更多帮助也很符合常理。 这样就引入了强三元闭包的原理

如果A-B和A-C之间有强关系,则B-C之间形成边的可能性提高

如果结点A存在两个强关系邻居,而邻居之间没有任何关系(Strong/Weak),则称A违背强三元闭包原理,反之则符合。
Social Network Model
综上,如果A满足强三元闭包原理,则与A相连的捷径都是弱关系。于是我们可以得到一个推论:社会网络结构就是用桥(捷径/邻里重叠度低的边/弱关系) 连接起来的相对比较密集互连的节点群。

同质性

我们经常说“近朱者赤,近墨者黑”,但究竟是因为两个人是朋友才相似,还是因为相似才成为朋友呢? 不妨就假设上面两个对社交关系的建立没有任何影响, 对人的特点抽象成节点颜色,就可以得到如下模型:

一个2色图中结点为白色的概率为pp,红色的概率为q=(1p)q=(1-p),随后在图上完全随机的建立边,我们不难发现,边两端颜色相同的概率为 p2+q2p^2+q^2,颜色不同的概率为2pq2pq。现在我们对一个样本进行统计,如果两个人有不同的特质并且是朋友概率要明显小于2pq2pq,则就可以认为这个群体的同质性明显,反之亦然。

比如下面的例子:
Homophily Occurrence
白色概率为p=23p=\frac{2}{3},红色概率为q=13q=\frac{1}{3}

按照公式计算2pq=492pq=\frac{4}{9}

统计异色边为5条,频率为518\frac{5}{18}

此时频率小于概率,体现出了一定的同质性。


现在我们能够解释共同特点对社交关系的影响了,应该怎么刻画社交关系对个人行为特点的影响呢?

社会归属网可以帮助我们理解这一点:
Closures
我们在社会归属网中看到了三种闭包现象,三元闭包,会员闭包和社团闭包。 其中会员闭包体现出了社会影响(Influence)的作用,而社团闭包体现了选择(Selection)的作用。

正负关系

但是人与人之间的关系并不是只有朋友关系,还有敌对和中立关系等。所以我们还可以对社会网络中的关系引入正负之分,正关系代表你们之间关系好,负关系表示你们之间有竞争或者敌对关系。 引入了正负关系之后社会网络的结构又会怎么变化呢?我们来看一个简单的例子:
Relation Example
  1. 在左上角的关系中,ABC三个人都是+关系,也就是说他们两两都是朋友,这是一种比较稳定的关系。
  2. 左下角的关系中,AB有一个共同的敌人C,所谓敌人的敌人就是我的朋友,所以AB之间也是朋友,着同样是一种比较稳定的关系。
  3. 右上角的关系中,AB和AC之间是正关系,等价于A有两个朋友B和C,但是BC之间是敌人。 这种关系就有演化成A撮合两个人,形成三个人都是朋友关系,或者A被某人离间,形成共同敌对某一个人(左下角的关系)的趋势,是一种不稳定的结构。
  4. 右下角的关系就代表ABC三个人都是敌对关系,这在某些情况下可以看作是稳定的,但是一般来说,这种关系并不是十分的稳定。

总的来看,当一个三角关系中存在 +++关系 或者 ++-关系 的时候是比较稳定的。

推广来看,就是当一个环形关系中存在奇数个-关系,那么就是不稳定的。

平衡定理

如果研究的是一个完全图,也就是所有人都认识所有人的情况,每三个人之间都可以形成一个三角关系。 当且仅当每一个三角关系都是稳定的,我们说这个完全图是平衡的。

“平衡”意味着改变关系属性的动力不足,或者有较强的动机维持现有的关系。

弱平衡网络

上面我们提到了++-(右上角)的三角关系是不稳定的,而---的关系有时候是稳定的。 现在我们允许网络中存在---的三角关系,定义网络内如果不存在++-的三角关系,那么它就是弱平衡的。


非完全图的推广

上面研究的完全图毕竟是少数情况,如果现在不知道一些节点之间的关系,是非完全图,那应该怎么判断这个网络是不是平衡的呢?

直观来想的话,一大群人中应该会形成很多“团体”。如果每个人仅存在在一个团体中,团体内的成员之间都是+关系,团体之间都是-关系,这种结构是平衡的。

于是就想到了可以将整个网络划分为几个以 +关系 连接的连通分量,每个连通分量可以作为一个“团体”,最后只需要判断,团体之间的环形关系是不是存在奇数个-关系就可以了。