ML 모델의 성공 비결: 크기와 불균형 문제 해결하기
NLP 프로젝트에서 대형 모델과 데이터 불균형 문제를 해결하기 위해 TF-IDF, 클래스 가중치, 간단한 모델을 활용했습니다. SMOTE와 ADASYN 같은 재샘플링 기법과 비용 민감 학습을 통해 소수 클래스의 예측 성능을 개선했습니다. 특징 공학과 모델 단순화로 정확도와 효율성을 높였으며, 하이퍼파라미터 최적화로 최적의 모델을 찾았습니다. 이 과정에서 데이터 정리와 특징 공학의 중요성을 깨달았습니다.