제목 의료로 확대되는 LLM···미소정보기술 ‘데이터 스캔’
날짜 2024.02.17

생성형 AI 기술 일상화로 학습 데이터 수집에 관심도 상승

‘데이터 스캔’, LLM·sLLM 구축 시 양질 데이터 확보 지원

“소견서 작성, 진료기록 요약, 처방전, 상담 등 활용 기대”

 

대규모언어모델(LLM)이 의료 분야로 확대되는 가운데 미소정보기술의 ‘데이터 스캔’이 데이터 표준화 솔루션으로 이목을 끌고 있다.

17일 업계에 따르면 생성형 AI 기술이 우리 일상에 빠르게 스며들면서 텍스트를 넘어 음성, 이미지, 영상 등 데이터 형태의 구분 없이 처리하는 멀티모달(Multi-Modal)로 혁신을 거듭하고 있다.

 

생성형 AI 개발 트렌드 역시 챗GPT를 비롯한 대규모언어모델(LLM)과 작지만 강한 소형화·최적화(파인튜닝)로 양분되는 분위기다. 정부도 올해를 초거대AI 도입 원년으로 계획을 잡고 국가 차원에서 AI 산업 육성을 위해 각종 지원을 아끼지 않는 분위기다. 특히 생성형 AI의 중요한 경쟁력인 AI 학습 데이터를 모으는 데 주력한다.

 

LLM은 의료 분야로도 확대될 조짐이 나타난다. 패브릭 기반 멀티모달 데이터 플랫폼 전문기업 미소정보기술이 의료·산업 분야 대규모언어모델(LLM) AI 구축과 소규모언어모델(sLLM) AI 구축 시 양질의 빅데이터 확보에 꼭 필요한 비(非)라벨링 데이터 표준화 솔루션 ‘데이터스캔(Data Scan)’을 출시하면서다.

 

‘데이터스캔’은 의료·산업 분야에서 사람의 손으로 가공된 라벨링 데이터(지도학습)가 아닌 챗GPT 등 초거대 AI 개발에 필수인 양질의 빅데이터를 확보할 수 있는 비라벨링 데이터 표준화 솔루션이다.

 

초거대 AI 사전학습에 필요한 빅데이터 구축(텍스트)을 위해 데이터 등록부터 분류체계, 단어사전 구축을 통한 자연어 처리, 분류·분석, 텍스트 분석, 산업별 적용 도메인에 따른 데이터 후처리 등을 실시간 분석하며 기업·공공기관의 내부 문서 보안이 강화된 패브릭 기반 멀티모달 데이터 플랫폼 ‘스마트빅(smart BIG)’을 통해 LLM, sLLM 구축 시 고도화된 언어처리 기술을 원스톱으로 제공한다.

 

‘데이터스캔’의 생성형 AI 분야는 일상생활과 직결되는 의료에서 의료영상 판독을 통한 건강검진·진료 소견서 작성, 과거 진료기록 요약, 치료 방법·처방전, 개인건강관리, 반려동물 질병 상담 등에 활용될 전망이다.

 

[이뉴스투데이 이승준 기자]

https://www.enewstoday.co.kr/news/articleView.html?idxno=2091153​