全局向量的词嵌入(GloVe) 让我们先回顾一下word2vec中的跳字模型。将跳字模型中使用softmax运算表达的条件概率 P ( w j ∣ w i ) P(w_j\mid w_i) P ( w j ∣ w i ) 记作 q i j q_{ij} q i j ,即 q i j = exp ( u j ⊤ v i ) ∑ k ∈ V exp ( u k ⊤ v i ) , q_{ij}=\frac{\exp(\boldsymbol{u}_j^\top \boldsymbol{v}_i)}{ \sum_{k \in \mathcal{V}} \text{exp}(\boldsymbol{u}_k^\top \boldsymbol{v}_i)}, q i j = ∑ k ∈ V exp ( u k ⊤ v i ) exp ( u j ⊤ v i ) , 其中 v i \boldsymbol{v}_i v i 和 u i \boldsymbol{u}_i u i 分别是索引为 i i i 的词 w i w_i w i 作为中心词和背景词时的向量表示, V = { 0 , 1 , … , ∣ V ∣ − 1 } \mathcal{V} = \{0, 1, \ldots, |\mathcal{V}|-1\} V = { 0 , 1