Earticle

현재 위치 Home

Transformer 모델을 이용한 NGS 빅 데이터의 SNP/Indel 탐색
SNP/Indel detection of NGS big data using Transformer model

첫 페이지 보기
  • 발행기관
    한국차세대컴퓨팅학회 바로가기
  • 간행물
    한국차세대컴퓨팅학회 논문지 KCI 등재 바로가기
  • 통권
    Vol.19 No.4 (2023.08)바로가기
  • 페이지
    pp.29-35
  • 저자
    배준우, 노미나, 박희진
  • 언어
    한국어(KOR)
  • URL
    https://www.earticle.net/Article/A434882

원문정보

초록

영어
Numerous programs for finding SNPs and short indels based on NGS data have been developed. However, existing programs in which users directly set parameters and call variants miss many true positives or call many false positives. This is particularly serious when different SNP/indel variants are applied to one location. In order to solve this problem, we conducted a research to find SNPs/Indels from NGS read data by applying a deep-learning method that showed better performance than the general state-of-the-art algorithm. After processing the read pileup data to be suitable for text-based NGS data, we applied it to a deep learning model modified based on the Transformer model. This method showed better performance, especially in the special case where SNPs and Indels were mixed, and showed similar performance to other existing programs in other cases.
한국어
그 동안 NGS 데이터를 기반으로 SNP/indel을 찾는 수 많은 프로그램들이 개발되어 왔다. 하지만 사용자가 직접 매개 변수를 정해서 variant를 찾는 방식의 기존 프로그램들은 많은 true positive를 놓치거나 많은 false positive를 찾는다. 이는 특히 한 위치에 서로 다른 SNP/indel이 적용된 경우일 때 더욱 심하다. 이러한 문제점을 해결하기 위해 우리는 일반적인 알고리즘보다 좋은 성능을 보이는 딥 러닝 방법을 적용하여 NGS 데이터로부터 SNP/Indel을 찾는 방법을 시도하였다. 특히 텍스트 기반의 NGS 데이터에 적합하도록 read pileup data를 가공 한 후 Transformer 모델을 기반으로 변형한 딥러닝 모델에 적용하였다. 이 방식은 SNP와 Indel이 혼용되어 나타 나는 케이스에서 더 좋은 성능을 보였으며, 그 외의 경우에도 기존의 다른 프로그램들과 유사한 성능을 보였다.

목차

요약
Abstract
1. 서론
2. 관련 연구
2.1 기계 학습
2.2 딥 러닝
2.3 유전체학에서의 딥러닝
3. Transformer 모델을 이용한 SNP/Indel 탐색
3.1 Modified genome 생성
3.2 시뮬레이션 유전체 데이터 생성
3.3 특징 선택(Feature selection)
3.4 모델 구조(Model architecture)
4. 결과
참고문헌

키워드

차세대 시퀀싱 딥러닝 변이 탐색 트랜스포머 모델 NGS Deep learning Variant calling Transformer model

저자

  • 배준우 [ Junwoo Bae | 한양대학교 컴퓨터공학과 ]
  • 노미나 [ Mina Rho | 한양대학교 컴퓨터공학과 ]
  • 박희진 [ Heejin Park | 한양대학교 컴퓨터공학과 ] 교신저자

참고문헌

자료제공 : 네이버학술정보

간행물 정보

발행기관

  • 발행기관명
    한국차세대컴퓨팅학회 [Korean Institute of Next Generation Computing]
  • 설립연도
    2005
  • 분야
    공학>컴퓨터학
  • 소개
    본 학회는 차세대 PC 및 그 관련분야의 학술활동을 통하여 차세대 PC의 학문 및 기술발전을 도모하고 산업발전 및 국제협력 증진을 목적으로 한다.

간행물

  • 간행물명
    한국차세대컴퓨팅학회 논문지 [THE JOURNAL OF KOREAN INSTITUTE OF NEXT GENERATION COMPUTING]
  • 간기
    격월간
  • pISSN
    1975-681X
  • 수록기간
    2005~2026
  • 등재여부
    KCI 등재
  • 십진분류
    KDC 566 DDC 004

이 권호 내 다른 논문 / 한국차세대컴퓨팅학회 논문지 Vol.19 No.4

    피인용수 : 0(자료제공 : 네이버학술정보)

    함께 이용한 논문 이 논문을 다운로드한 분들이 이용한 다른 논문입니다.

      페이지 저장