AI, Deep Learning Basics/Basic

[Pytorch] 모델 만들 때 초기값을 설정해주는 이유

  1. 딥러닝 모델 자체가 거대한 feature space로 이를 값 하나하나를 적절하게 맞추기 위해서는 0보다는 임의의 값으로 설정하는 것이 유리하다.
  2. Backward propagation에서의 vanishing gradient 문제를 막기위해
  3. 아무리 좋은 optimizer를 가지고 있어도 초기값을 잘못 설정하면 global minimum을 가지는데 어려움이 있다.