요약
Abstract
1. 서론
2. 관련 연구
2.1 시각적 객체 추적
2.2 Mixture-of-Experts
3. 본문
3.1 토큰화 및 정규화
3.2 트랜스포머 내 MoE 통합
4. 실험 결과
4.1 실험 환경
4.2 LaSHeR 데이터 세트 기반 성능 평가 지표
4.3 속성 기반 성능 분석
4.4 MoE 게이팅 동작 및 모달리티 적응성 분석
4.5 모델 복잡도 및 효율성 분석
4.6 전문가 수에 따른 성능 분석
5. 결론
Acknowledgements
참고문헌