Why is the loss increasing although I am updating the weights and biases using gradient descent? ####################################################################