https://github.com/yizt/numpy_neural_network/blob/master/nn/losses.py dy = y_probability - y_true 这个地方的推导不是很理解。大佬这个多分类的损失函数求梯度咋来的啊。