1.tf.random.categorical()
tf.random.categorical(tf.math.log([[0.5,0.5]]), 5)
Out[26]: <tf.Tensor: id=2523670, shape=(1, 5), dtype=int64, numpy=array([[0, 0, 1, 0, 1]], dtype=int64)>
前一个参数是概率取log,后一个是采样次数,返回的是选中的动作位置,比如这里0对应输入概率矩阵[[0.5, 0.5]]中的第一个,1对应第二个
2.np.random.choice(a, size=None, replace=True, p=None)
np.random.choice([1,2,3,4,5], 3, p=[0.1, 0, 0.3, 0.6, 0])
Out[30]: array([4, 1, 4])
原文:https://www.cnblogs.com/ZAmateur/p/12355645.html