Earticle

현재 위치 Home

A Study on the Drug Classification Using Machine Learning Techniques
머신러닝 기법을 이용한 약물 분류 방법 연구

첫 페이지 보기
  • 발행기관
    중소기업융합학회 바로가기
  • 간행물
    산업과 과학 KCI 등재후보 바로가기
  • 통권
    제3권 제2호 (2024.06)바로가기
  • 페이지
    pp.8-16
  • 저자
    Anmol Kumar Singh, Ayush Kumar, Adya Singh, Akashika Anshum, Pradeep Kumar Mallick
  • 언어
    영어(ENG)
  • URL
    https://www.earticle.net/Article/A451352

※ 기관로그인 시 무료 이용이 가능합니다.

4,000원

원문정보

초록

영어
This paper shows the system of drug classification, the goal of this is to foretell the apt drug for the patients based on their demographic and physiological traits. The dataset consists of various attributes like Age, Sex, BP (Blood Pressure), Cholesterol Level, and Na_to_K (Sodium to Potassium ratio), with the objective to determine the kind of drug being given. The models used in this paper are K-Nearest Neighbors (KNN), Logistic Regression and Random Forest. Further to fine-tune hyper parameters using 5-fold cross-validation, GridSearchCV was used and each model was trained and tested on the dataset. To assess the performance of each model both with and without hyper parameter tuning evaluation metrics like accuracy, confusion matrices, and classification reports were used and the accuracy of the models without GridSearchCV was 0.7, 0.875, 0.975 and with GridSearchCV was 0.75, 1.0, 0.975. According to GridSearchCV Logistic Regression is the most suitable model for drug classification among the three-model used followed by the K-Nearest Neighbors. Also, Na_to_K is an essential feature in predicting the outcome.
한국어
본 논문에서는 인구통계학적, 생리학적 특성을 기반으로 환자에게 가장 적합한 약물을 예측하는 것을 목표로 하는 약물 분류 시스템을 제시한다. 데이터 세트에는 적절한 약물을 결정하기 위한 목적으로 연령, 성별, 혈압(BP), 콜레스테롤 수치, 나트륨 대 칼륨 비율(Na_to_K)과 같은 속성들이 포함된다. 본 연구에 사용된 모델은 KNN(K-Nearest Neighbors), 로지스틱 회귀 분석 및 Random Forest이다. 하이퍼파라미터를 최적화하기 위해 5겹 교차 검증을 갖춘 GridSearchCV를 활용하였으며, 각 모델은 데이터 세트에서 훈련 및 테스트 되었다. 초매개변수 조정 유무에 관계없이 각 모델의 성능은 정확도, 혼동 행렬, 분류 보고서와 같은 지표를 사용하여 평가되었다. GridSearchCV를 적용하지 않은 모델의 정확도는 0.7, 0.875, 0.975인 반면, GridSearchCV를 적용한 모델의 정확도는 0.75, 1.0, 0.975로 나타났다. GridSearchCV는 로지스틱 회귀 분석을 세 가지 모델 중 약물 분류에 가장 효과적인 모델로 식별했으며, K-Nearest Neighbors가 그 뒤를 이었고 Na_to_K 비율은 결과를 예측하는 데 중요한 특징인 것으로 밝혀졌다.

목차

Abstract
요약
1. Introduction
2. Literature Review
3. Methodology
3.1 Data set collection
3.2. Feature Engineering and Label Encoding
3.3. Model Background
4. Result and Discussion
5. Limitation and Future Scope
5.1 Limitation
5.2 Future Scope
6. Conclusion
REFERENCES

키워드

약물 분류 데이터 프로세싱 라벨 인코딩 하이퍼파라미터 튜닝 GridSearchCV Drug Classification Data Preprocessing Label Encoding Hyperparameter Tuning GridSearchCV.

저자

  • Anmol Kumar Singh [ Student, School of Computer Engineering, Kalinga Institute of Industrial Technology, India ]
  • Ayush Kumar [ Student, School of Computer Engineering, Kalinga Institute of Industrial Technology, India ]
  • Adya Singh [ Student, School of Computer Engineering, Kalinga Institute of Industrial Technology, India ]
  • Akashika Anshum [ Student, School of Computer Engineering, Kalinga Institute of Industrial Technology, India ]
  • Pradeep Kumar Mallick [ Senior Associate Professor, Kalinga Institute of Industrial Technology, India ] Corresponding Author

참고문헌

자료제공 : 네이버학술정보

간행물 정보

발행기관

  • 발행기관명
    중소기업융합학회 [Convergence Society for SMB]
  • 설립연도
    2011
  • 분야
    공학>공학일반
  • 소개
    본 회는 정보기술을 다양한 산업 분야에 융합하는 정책 및 관련 기술들을 개발하고 보급함으로써 중소기업 발전은 물론 이를 통한 국가발전과 국제협력 증진에 기여하고자 한다.

간행물

  • 간행물명
    산업과 과학 [Advanced Industrial SCIence]
  • 간기
    격월간
  • eISSN
    2951-2476
  • 수록기간
    2022~2026
  • 등재여부
    KCI 등재후보
  • 십진분류
    KDC 004 DDC 004

이 권호 내 다른 논문 / 산업과 과학 제3권 제2호

    피인용수 : 0(자료제공 : 네이버학술정보)

    함께 이용한 논문 이 논문을 다운로드한 분들이 이용한 다른 논문입니다.

      페이지 저장