데이터증강 썸네일형 리스트형 [Applications] Large Language Models for Healthcare Data Augmentation: An Example onPatient-Trial Matching Abstract환자를 적절한 임상시험과 매칭하는 과정은 의학 연구의 발전과 최적의 치료 제공에 있어 필수적이다. 그러나 현재의 접근 방식은 데이터 표준화, 윤리적 고려사항, 전자의무기록(EHR)과 임상시험 기준 간의 상호운용성 부족과 같은 여러 도전에 직면해 있다. 본 논문에서는 대형 언어 모델(LLM)이 지닌 고급 자연어 생성 능력을 활용하여, EHR과 임상시험 설명 간의 호환성을 개선함으로써 이러한 문제를 해결할 수 있는 가능성을 탐구한다. 우리는 LLM 기반 환자-임상시험 매칭(LLM-PTM)을 위한 혁신적인 개인정보 보호 중심 데이터 증강 기법을 제안하며, 이는 LLM의 이점을 유지하면서 민감한 환자 데이터의 보안성과 기밀성을 보장한다. 실험 결과, 제안한 LLM-PTM 방법은 평균 7.32%의 .. 더보기 [Industry] Synthetic Data Augmentation Using Large Language Models (LLM): A Case-Study of the Kamyr Digester Abstract전통적인 머신러닝 접근법은 데이터의 부족 및 희소성이라는 문제에 시달리며, 이는 알고리즘의 정교함과 무관하게 전반적인 성능을 저하시킨다. 연구자들은 다양한 데이터 증강 기법을 활용해 왔지만, 이러한 외삽은 초기 데이터셋의 제한된 지식 공간에 본질적으로 제약을 받는다. 따라서 머신러닝 분야에서는 균형 잡히고 강건하며 방대한 데이터셋의 수집이 매우 중요하며, 이는 수집 과정의 어려움에도 불구하고 핵심적인 요소로 간주된다. 본 연구는 대형 언어 모델(Large Language Models, LLMs)을 활용하여 합성 데이터를 생성함으로써 데이터 부족 문제를 완화하기 위한 새로운 증강 기법을 제안한다. 이를 입증하기 위해 제지 산업에서 사용되는 "Kamyr Digester"를 사례로 삼아, LLM.. 더보기 이전 1 다음