한의학 및 보완대체의학에서의 의학 온톨로지 개발

본 발표는 의학영역에서의 지식에 대한 구조화, 지능적인 처리에 대한 내용을 다루는 것으로 발표는 1) 우리 세대에게 요구되는 미해결의 응용분야에 대한 해결방안으로서 온톨로지 공학의 이용을 예를 들어 설명, 2)온톨로지의 개요, 구성, 구현, 이용, 배경 등에 대한 설명, 3) 의학영역에서의 온톨로지, 4) 한의학에서의 온톨로지 구축의 순으로 진행된다.

배경
최근의 정보처리에 있어서 중요한 진전은 그리드(Grid)와 시맨틱웹(Semantic web)이다. 이것들은 모두 '연결의 지능화'라고 요약할 수 있으며 모든 분야에 영향력을 강화해 나갈 것이며, 응용분야로서 가장 중요한 분야가 의료산업과 의학연구 분야이다. 이 중 시맨틱 웹은 차세대 웹 기술이자 최근 지능적인 지식처리에 관한 연구의 화두가 되고 있는데, 시맨틱 웹의 구현을 위한 핵심 기술은 온톨로지(Ontology)와 관계된 것들이다.

온톨로지
온톨로지('O'ntology)는 철학의 한 분과학문으로서 '존재론'으로 번역되며, 원래 '존재들과 존재들의 속성에 대한 설명들'이란 의미로 사용되었다. 그런데, 정보과학에서 온톨로지('o'ntologies)는 "특정 영역의 용어들과 그들간의 관계를 명시적이고 정형화한 명세(Explicit formal specifications of the terms in the domain and relations among them)"로 정의된다. 의료영역에서 보면, 온톨로지는 넓은 의미에서 의료지식을 기록하고 있는 데이터베이스라고 간주할 수 있으며, 지식과 관련된 데이터라는 의미에서는 지식베이스(Knowledge-base)이다. 그러나, 온톨로지는 그 자신이 담고자 하는 영역의 지식을 좀 더 그대로 표현하기 위해서 표현력이 높은 언어를 이용하여 만들어진 것으로 전통적인 데이터베이스와 그 구별이 된다. 온톨로지는 개념(Concepts), 관계(Relations), 개념의 계층(Concept Hierarchy), 관계를 통한 개념과 개념의 연결로서의 함수(Function), 공리(Axioms) 등 다섯 개의 구성물로 되어 있음, 용도에 따라 상위온톨로지(Top-level ontologies), 영역온톨로지(Domain ontologies), 과업온톨로지(Task ontologies), 응용온톨로지(Application ontologies)가 있다. 현재 의료영역에서의 온톨로지 연구는 세 가지 다른 전통에서 뿌리를 두고 있다. 첫째, 온톨로지는 인공지능의 지식표현(Knowledge Representation) 방법에서 출발하였으며, 온톨로지를 즉, 의료지식을 표현하기 위한 언어로 주목받고 있는 기술논리(Description Logic)는 지식표현의 논리적 접근방식의 엄격성과 구조적 접근방식의 직관성을 통합시킨 방법이다. 둘째, 의학 영역은 표준화된 용어시스템을 통해서 병원의 의료정보, 문헌정보의 공유, 정리, 조직화를 효율적으로 처리하고자 하였다. 이러한 의학영역에서의 자발적인 요구는 자연스럽게 의학영역에서 온톨로지 관련 연구가 활성화 되도록 이끌었다. 셋째, 웹 상의 자원(source)을 지능적으로 통합, 검색, 추출하기 위해서 시맨틱 웹 연구가 활성화되었으며 이것이 정보과학을 온톨로지 연구로 이끌고 있다.

온톨로지의 활용
온톨로지는 비즈니스 절차의 모델링, 디지털 도서관, WordNet에서의 정보 검색, 정보통합, 지능적인 에이전트, 기계 학습, 자연어 처리, 데이터 마이닝, HCI 등에서의 지식처리를 위해서 사용되고 있다.

의학 영역의 온톨로지와 활용
현재까지 개발된 진료영역에서의 온톨로지 중 주목할 만한 것은 GALEN, Med, SNOMED CT, Foundational Model of Anatomy, UMLS 등이 있다. GALEN은 기술논리 기반의 GRAIL(GALEN Representation and Integration Language)에 의해서 표현된 온톨로지로서 멘체스터 대학을 중심으로 하는 유럽 연합에서 개발되었다. MED는 미국 콜롬비아 대학에서 개발되어 병원에서 실제 사용되고 있는 시스템이며, Foundational Model of Anatomy는 해부학 정보에 대한 프레임 기반의 온톨로지로서 워싱턴 대학에서 개발되고 있으며, SNOMED CT는 전자의무기록을 위한 용어시스템으로 CAP(American College of Pathologist)에서 개발 판매되고 있으며, UMLS는 NLM(National Library of Medicine)에서 개발되어 있으며 많은 응용이 시도되고 있다. 각각의 시스템은 온톨로지라고 말할 수 있는 것부터 좀 복잡한 용어시스템이라고 말할 수 있는 것까지 다양한 표현력을 가지고 있다. 예를 들어 UMLS나 SNOMED CT를 포함한 기존의 용어 시스템은 아직까지 지식표현을 위한 언어들이 가지고 있는 속성(property)의 이행성(transitivity), 카디넬러티(Cardinality), 인스턴스의 표현, 속성의 상속(Inheritance) 등을 비롯한 개념들을 처리하기 위한 논리적 추론 기능을 가지고 있지 못하다. 그러나, 이러한 시스템들은 급속하게 온톨로지라고 불릴 수 있는 형태로 발전하고 있다.

한의학 영역에서의 온톨로지 개발
한의학 영역에서의 온톨로지 연구는 두 가지의 의미를 가지고 있다. 첫째, 의학 일반에서 기술한 온톨로지의 필요성이 한의학 분야에서도 동일하게 적용된다. 즉, 전자진료부 시스템, 문서 검색시스템, 학술문헌 관리 등에서 새로운 기능들을 요구하고 있다. 그 요구에 필요한 새로운 기술이 한의학의 지식을 의미 기반으로 다룰 수 있는 표준화된 방법들로 기술(記述)하는 온톨로지 기술(技術)이며, 이것을 통해서 지식표현이 가능할 수 있게 된다. 둘째는 한의학의 고유 지식은 서구자연과학의 지식구조와는 다른 특성을 함유하고 있다. 그것은 유사성(Similarity)과 유비추론(Analogical Reasoning)이라고 요약할 수 있으며 이에 대한 온톨로지로서의 표현은 한의학 지식의 적절한 표현에 필요할 뿐 아니라, 인지과학, 지식공학 등에도 기여할 것으로 믿는다. 그러나 현재는 한의학과 관련된 온톨로지는 전세계적으로 아직 개발된 바가 없으며, 이에 대한 일부의 연구가 한국, 일본, 영구 등지에서 이루어지고 있으며, 표준화된 방법에 의해서 개발된 온톨로지는 지적 재산권으로서도 가치를 지닐 것으로 생각된다.

참고 문헌
1. 김홍기, 김명기, 의료정보학에서의 온톨로지 기술, 대한의료정보학회지 2003:9(3):213-219
2. 박경모, 박종현, Protege를 이용한 한의학의 구조화된 증상 입력을 위한 온톨로지 개발, 제 20차 대한의료정보학회 춘계학술대회 논문집.충청남도 아산. 2003. 5.30-31.
3. Alexander Maedche. Ontology Learning for the Semantic Web, Kluwer Academic Publishers, 2002
4. Dieter Fensel et al ed. Spinning the Semantic Web, MIT Press, 2003
5. Sean Bechhofer, Ian Horrocks and Peter F. Patel-Schneider, Tutorial on OWL, ISWC, Sanibel Island, Florida, USA, 20th October, 2003


2003년 12월

경희대 동서의료공학과, 박경모