빅데이터 라는 개념이 등장하며 이전과 달리 대용량 데이터에 대해 가용할 수 있게끔 기술이 발전함에 따라 최근 추천시스템은 대량의 리소스 내에서 유저에게 적절한 개체를 발견하여 제공하는 용도로 이용되고 있으며 이 프로세스가 그 플랫폼내에서의 서비스 만족도 등 고객만족지표에 영향을 끼칠 만큼 온라인 서비스에서도 점차 그 역할의 중요도가 커져가고 있는 추세를 보이고 있다. 전통적인 추천시스템 방법론은 주로 유저-아이템 간의 상호 기록을 분석하여 효율적으로 예측하고자 하였으나 앞서 언급하였듯이 '유비쿼터스', '5G' 등의 기술들이 주변 곳곳에서 데이터를 수집하고 가용할 수 있게 되었으며 이로 인해 데이터에 대해 중요도가 커져가며 다소 지엽적인 시각에서만 바라보았던 데이터를 좀 더 다양한 측면에서도 생각하며 그 내에서 유용한 데이터를 추출하고자 하는 노력이 주를 이루고 있다. 그에 따라 추천시스템도 다양한 종류의 보조적인 성격을 가진 데이터도 이용하고자 하는 연구들이 진행되고 있긴 하나 그 내에서는 몇가지 문제가 존재 한다. 상대적으로 다양한 정보들 덕분에 유용하나 다른말로 표현해보자면 다소 복잡한 구조를 가지고 있다는 특징 때문에 그러한 피쳐들을 잘 가공하여 어떻게 모델에 접목시킬것인가에 대해 현재까지도 추천시스템뿐만 아니라 데이터마이닝 측면에서 도전적인 과제로 남아있으며 이걸 어떻게 효율적으로 해결할 것인가에 대해 새로운 접근법을 모색하고 있다. 그 중에서도 네트워크 임베딩이 데이터 내의 잠재적인 구조를 추출하여 좋은 성능을 보이며 '분류', '클러스터링', '추천' 등 많은 데이터 마이닝에서 활용하고 있다. 특히 추천 쪽에서는 'random walk' 그리고 'skip-gram'이 결합된 'Deepwalk'라는 방법론을 주로 이용하며 임베딩 된 구조 내에서 또 각 노드간의 연결에 가중치를 둔 'LINE' , 'SDNE' 등의 알고리즘도 사용하고있다. 허나 지금까지 언급한 방법들은 '동종 네트워크('homogeneous network)'에만 적용할 수 있다는 한계점을 지니고 있다. 본 연구에서는 그래프 구조 데이터를 활용하여 추천 시스템의 알고리즘의 정확도를 제고하기 위한 새로운 접근법을 제안한다. 구체적으로 본 연구에서는 그래프 상의 노드(node)의 임베딩(embedding)을 주변 이웃 노드로부터 생성하는 GCN(Graph Convolutional Networks)의 변형모델인 GraphSAGE(Sample and aggreGatE)에 기반하여 사용자-상품 네트워크 구조를 학습하고, 이를 기반으로 추천 상품을 예측하는 추천 모델을 제안한다. 일반적인 GraphSAGE 알고리즘은 네트워크를 구성하는 모든 노드가 동질하다고 전제하는 동종 네트워크(homogeneous network)를 기반으로 동작한다. 하지만, 추천 시스템에서의 노드는 크게 사용자와 상품이라는 서로 이질적인 두 종류의 노드로 구성되어 있다. 이에 본 연구에서는 이러한 이종 네트워크(heterogeneous network) 구조를 다룰 수 있도록 확장된 GraphSAGE 알고리즘인 HinSAGE(Heterogeneous SAGE) 알고리즘을 적용하여 추천 모델을 구축하고, 이를 전통적인 추천 알고리즘인 협업필터링(CF, Collaborative Filtering)과 비교하여 성능의 개선이 있는지 실증적으로 확인해 보고자 한다.