활성화 전송을 통한 언어 및 확산 모델 제어
대규모 생성 모델은 점점 더 강력해지고 있지만 원하는 출력을 얻기 위해 제어하기 어려울 수 있습니다. 애플의 연구진은 활성화 전송(AcT)이라는 기술을 개발하여 최소한의 계산 비용으로 세밀한 제어를 가능하게 했습니다. AcT는 최적 수송 이론을 활용하여 모델의 활성화를 조정하며, 언어 모델과 텍스트-이미지 확산 모델 모두에 효과적입니다. 이 기술은 독립적인 활성화와 선형 맵을 고려하여 빠른 추론을 보장합니다. AcT는 독성 완화와 진실성 유도에서 성능을 크게 향상시켰으며, 사용자 기대에 맞춘 모델 정렬을 개선하는 데 기여합니다.