번역 생성기와 문장 판별기 기반의 문장 데이터 증강 방법

SangWon Lee; WonIk Choi

216.73.216.207

개인회원 가입

개인회원
기관회원

개인회원 로그인

개인회원 가입으로 더욱 편리하게 이용하세요. 개인회원 가입

아이디/비밀번호를 잊으셨나요? 아이디/비밀번호 찾기

기관회원 로그인

소속기관에서 검색되지 않는 기관은 무료원문다운이 불가능합니다. 개인회원 가입 후 유료구매를 하시거나 소속기관 도서관에 이용문의해 주세요.

Home

Session 2 인공지능

번역 생성기와 문장 판별기 기반의 문장 데이터 증강 방법
Sentence Data Augmentation Method based on Translation Generator and Sentence Discriminator

발행기관

한국차세대컴퓨팅학회 바로가기
간행물

한국차세대컴퓨팅학회 학술대회 바로가기
통권

2021 한국차세대컴퓨팅학회 춘계학술대회 (2021.05)바로가기
페이지

pp.67-70
저자

SangWon Lee, WonIk Choi
언어

한국어(KOR)
URL

https://www.earticle.net/Article/A409327

원문정보

초록

한국어: 본 논문에서는 번역 생성기 (translation generator)와 문장 판별기 (sentence discriminator) 기반의 문장 데이터 증강 방법을 제안한다. 번역 생성기는 다른 언어로의 반복 번역을 통해 원본 문장과 비슷한 의미를 가진 변형문장을 생성하여 데이터의 수를 늘린다. 하지만 이러한 방식으로 생성된 문장의 일부는 학습에 방해가 된다. 이에 문장 판별기는 학습에 방해되는 문장을 판별하기 위하여 Convolutional Neural Network (CNN)와 Bidirectional Long Short-Term Memory (Bi-LSTM)를 병렬로 병합한 딥러닝 모델로 원본문장을 학습하고 변형문장 중에서 학습에 방해되는 문장을 판별하고 제거하여 데이터 증강 문장을 출력한다. 본 논문의 데이터 증강 방법으로 데이터를 증강한 후 5가지의 딥러닝 모델로 테스트를 진행한 결과, 데이터의 크기에 따라 최대 9.28%의 성능 향상을 보였다.

Abstract
1. Introduction
2. Related Works
3. Proposed Data Augmentation
3.1. Data Set
3.2. 번역 생성기 (Translation Generator)
3.3. 문장 판별기 (Sentence Discriminator)
3.4. 문장 데이터 증강 방법
4. Experiments
4.1. Experimental setup
4.2. 데이터 개수 변화와 데이터 증강 효과
4.3. 전체 데이터를 사용한 증강 실험 결과 비교
5. Conclusions
Acknowledgement
References

키워드

Data augmentation deep learning LSTM CNN self-attention

저자

SangWon Lee [ Electrical and Computer Engineering Inha University Incheon, South Korea ]
WonIk Choi [ Electrical and Computer Engineering Inha University Incheon, South Korea ] Corresponding author

참고문헌

자료제공 : 네이버학술정보

간행물 정보

발행기관

발행기관명

한국차세대컴퓨팅학회 [Korean Institute of Next Generation Computing]
설립연도
2005
분야
공학>컴퓨터학
소개
본 학회는 차세대 PC 및 그 관련분야의 학술활동을 통하여 차세대 PC의 학문 및 기술발전을 도모하고 산업발전 및 국제협력 증진을 목적으로 한다.

간행물

간행물명

한국차세대컴퓨팅학회 학술대회
간기
반년간
수록기간
2021~2025
십진분류
KDC 566 DDC 004

이 권호 내 다른 논문 / 한국차세대컴퓨팅학회 학술대회 2021 한국차세대컴퓨팅학회 춘계학술대회

피인용수 : 0건 (자료제공 : 네이버학술정보)

함께 이용한 논문 이 논문을 다운로드한 분들이 이용한 다른 논문입니다.

출처 : 네이버학술정보

0개의 논문이 장바구니에 담겼습니다.

페이지 저장

소속기관 조회

이용자님의 소속기관(단체)이 서비스에 가입되어 있는지 확인해 보십시오.
기관회원에 소속되어 있는 이용자는 원문을 무료로 이용할 수 있습니다.

상호: 주식회사 학술교육원 I 대표: 노방용 I 사업자등록번호: 122-81-88227 I 통신판매업신고번호: 제2008-인천부평-00176호 I 정보보호책임자: 이두영
주소: (21319)인천광역시 부평구 영성중로 50 미래타워 701호 I 전화: 0505-555-0740 I 팩스: 0505-555-0741 I 이메일: earticle@earticle.net

음성지원 및 돋보기 서비스

Earticle

번역 생성기와 문장 판별기 기반의 문장 데이터 증강 방법
Sentence Data Augmentation Method based on Translation Generator and Sentence Discriminator

원문정보

초록

목차

키워드

저자

참고문헌

간행물 정보

발행기관

간행물

이 권호 내 다른 논문 / 한국차세대컴퓨팅학회 학술대회 2021 한국차세대컴퓨팅학회 춘계학술대회

피인용수 : 0건 (자료제공 : 네이버학술정보)

함께 이용한 논문 이 논문을 다운로드한 분들이 이용한 다른 논문입니다.

Earticle

번역 생성기와 문장 판별기 기반의 문장 데이터 증강 방법 Sentence Data Augmentation Method based on Translation Generator and Sentence Discriminator

원문정보

초록

목차

키워드

저자

참고문헌

간행물 정보

발행기관

간행물

이 권호 내 다른 논문 / 한국차세대컴퓨팅학회 학술대회 2021 한국차세대컴퓨팅학회 춘계학술대회

피인용수 : 0건 (자료제공 : 네이버학술정보)

함께 이용한 논문 이 논문을 다운로드한 분들이 이용한 다른 논문입니다.

번역 생성기와 문장 판별기 기반의 문장 데이터 증강 방법
Sentence Data Augmentation Method based on Translation Generator and Sentence Discriminator