[딥러닝]. 자연어 처리 모델 경량화 순서

Machine learning/Deep Learning

Acdong 2023. 3. 23. 21:26

[모델 경량화 기법 적용 순서]

딥러닝 모델의 크기를 줄이는 경량화 기법은 다음과 같이 적용 순서를 결정할 수 있습니다.

Pruning: 불필요한 가중치를 제거하여 모델의 크기를 줄입니다. 모델의 크기가 대폭 축소되면서도 모델의 정확도는 크게 감소하지 않습니다.
Quantization: 모델의 가중치와 활성화 함수 값을 낮은 비트 수로 표현하여 모델의 크기를 줄입니다. 모델의 크기가 줄어들어 메모리 사용량이 줄어들면서도 모델의 정확도는 크게 감소하지 않습니다.
Knowledge distillation: 대규모 모델의 지식을 작은 모델에 전달하여 작은 모델의 성능을 향상시킵니다. 작은 모델이 큰 모델의 성능을 따라잡게 되어 큰 모델의 정확도에 근접한 성능을 얻을 수 있습니다.
Low-rank approximation: 모델의 가중치 행렬을 저차원으로 근사하여 모델의 크기를 줄입니다. 모델의 크기가 줄어들면서도 모델의 정확도는 크게 감소하지 않습니다.
Knowledge-based activation pruning: 활성화 함수를 제거하여 모델의 크기를 줄입니다. 이 방법은 다른 경량화 기법을 모두 적용한 이후에 적용하는 것이 좋습니다.

이 순서는 모델의 특성과 용도, 경량화 기법 간의 상호작용 등을 고려하여 결정하는 것이 중요합니다. 경량화 기법을 적용하기 전에 충분한 분석과 검증이 필요합니다.