728x90 그레이디언트 폭주1 [딥러닝] RNN & CNN(feat. 시카고 교통국 데이터셋) - 3 이전 내용 [딥러닝] RNN & CNN(feat. 시카고 교통국 데이터셋) - 2이전 내용 [딥러닝] RNN & CNN(feat. 시카고 교통국 데이터셋) - 1이전 내용 [딥러닝] 객체 탐지, 객체 추적이전 내용 [딥러닝] 케라스의 사전 훈련 모델 사용하기이전 내용 [딥러닝] 합성곱 신경망puppy-foot-it.tistory.com긴 시퀀스를 다룰 때 두 문제 긴 시퀀스로 RNN을 훈련하려면 많은 타임 스텝에 걸쳐 실행해야 하므로 펼친 RNN이 매우 깊은 네트워트가 된다. 다른 심층 신경망과 마찬가지로 그레이디언트 소실과 폭주 문제를 겪을 수 있는데, 이는 훈련하는 데 아주 오랜 시간이 걸리거나 훈련이 불안정할 수 있음을 의미한다. 또한 RNN이 긴 시퀀스를 처리할 때 입력의 첫 부분을 조금씩 잊게.. 2024. 12. 2. 이전 1 다음 728x90