Add files via upload

TensorUI · web-flow · commit 17a40e7c36f4 · 2019-12-30T22:45:08.000+08:00
relative position
diff --git a/relative_position.py b/relative_position.py
@@ -0,0 +1,27 @@
+class relative_position(nn.Module):
+
+    def __init__(self, num_units, max_relative_position):
+        super(relative_position, self).__init__()
+        self.num_units = num_units
+        self.max_relative_position = max_relative_position
+        self.embeddings_table = Parameter(torch.Tensor(max_relative_position * 2 + 1, num_units)
+        nn.init.xavier_uniform_(self.embeddings_table)
+
+    def forward(self, length_q, length_k):
+        range_vec_q = torch.arange(length_q)
+        range_vec_k = torch.arange(length_k)
+        distance_mat = range_vec_k[None, :] - range_vec_q[:, None]
+        distance_mat_clipped = torch.clamp(distance_mat, -self.max_relative_position, self.max_relative_position)
+        # 将序列distance_mat小于-max_relative_position或者大于max_relative_position的值都设置为-+max_relative_position
+        final_mat = distance_mat_clipped + self.max_relative_position
+        final_mat = torch.LongTensor(final_mat).cuda()
+        embeddings = self.embeddings_table[final_mat].cuda()
+
+        return embeddings
+
+r_k = self.relative_position(Q_.size()[1], K_.size()[1])
+outputs = outputs + torch.bmm(Q_.permute(1, 0, 2), r_k.permute(0, 2, 1)).permute(1, 0, 2)
+        
+r_v = self.relative_position(Q_.size()[1], V_.size()[1])
+outputs = outputs + torch.bmm(weights.permute(1, 0, 2), r_v).permute(1, 0, 2)
+#the size of Q,K,V is [heads*batch,length,dim//heads]