TensorFlow 向量乘以向量乘法

TensorFlow vector times vector multiplication

我有一个波动率向量和一个相关矩阵

volatilities = tf.constant([0.2, 0.4, 0.6], dtype=tf.float32)
correlations = tf.constant([[1, 0.25, 0.5], [0.25, 1, 0.3], [0.5, 0.3, 1]], dtype=tf.float32)

我想使用这些值创建一个协方差矩阵

covariance = tf.tensordot(volatilities, volatilities, axes=0) * correlations

到目前为止,还不错。现在我在批量训练过程中使用它,我的波动率和相关性的形状分别是 (batch_size, 3)(batch_size, 3, 3)。我花了很多时间试图弄清楚如何获得协方差矩阵。我先尝试获取形状为 (batch_size, 3, 3) 的波动率矩阵,然后将标量与相关性相乘,但我没有成功获取波动率矩阵。通过这样做,我得到的最接近的是 (3, 3) 张量:

volatility_matrix = tf.tensordot(volatilities, volatilities, axes=[[0], [0]])

如何通过计算有效地获得具有 batch_size 维度的相关矩阵?

正如@Lescurel提到的post,这个问题可以通过使用tf.einsum来解决:

volatility_matrix = tf.einsum("ij,ik->ijk", volas, volas)

解决波动率矩阵的获取问题。从那里开始,它只是沿第二个轴的标量乘法。 具体来说,为了得到协方差矩阵,我做了

covariance_matrix = tf.linalg.matmul(volatility_matrix, correlation_matrix)

这些是共价矩阵的应用矩阵乘积,当某些信息未表示时出现的波动性有助于确定从批量信息中读取时的目标关系。

[样本]:

import tensorflow as tf

Cell_A = 0.20
Cell_B = 0.20
Cell_C = 0.20

volatilities = tf.constant([[ Cell_A, Cell_B, Cell_C ]], dtype=tf.float32)
correlations = tf.constant([[ 33405, 33405, 33405 ], [ 33405, 40050, 33405 ], [ 33405, 33405, 37025 ]], dtype=tf.float32)

volatility_matrix = tf.einsum('ij,jk->ik', volatilities, correlations)
correlation_matrix = correlations

print( ' volatilities : ' )
print( volatilities )
print( ' correlations : ' )
print( correlations )
print( ' volatility_matrix : ' )
print( volatility_matrix )

print( ' Shortest: ' + str( tf.math.argmin( volatility_matrix[0] ).numpy() ) )
print( ' Hghest: ' + str( tf.math.argmax( volatility_matrix[0] ).numpy() ) )

[输出]:

 volatilities :
tf.Tensor([[0.2 0.2 0.2]], shape=(1, 3), dtype=float32)
 correlations :
tf.Tensor(
[[33405. 33405. 33405.]
 [33405. 40050. 33405.]
 [33405. 33405. 37025.]], shape=(3, 3), dtype=float32)
 volatility_matrix :
tf.Tensor([[20043. 21372. 20767.]], shape=(1, 3), dtype=float32)
 Shortest: 0
 Hghest: 1