요약
Abstract
1. 서론
2. 이기종 플랫폼에서의 병렬처리 프로그래밍
2.1. OpenCL
2.2. 메모리 구조를 이용한 GPU 프로그램의 최적화
2.3. 쓰레드 구조를 이용한 GPU프로그램의 최적화
2.4. 이기종 처리 환경에서의 프로그램 최적화
3. 공유 캐시 메모리에 기반한 효율적인 작업배분
3.1. 영상 필터링을 위한 OpenCL 커널설계
3.2 최적 작업배분량 계산
4. 실험 결과
5. 결론
참고문헌