산업 /
“국가 차원 양질의 바이오 빅데이터 구축 절실”
바이오 빅데이터를 활용하기 위해선 우선 활용 가능한 양질의 바이오 빅데이터 확보가 절실하다는 지적이다. 또한 개인정보보호와 함께 바이오 빅데이터의 표준화도 해결해야 할 중요과제로 꼽혔다.
울산과학기술원 생명과학부 이세민 교수는 최근 생명공학정책연구센터 BioINpro에 발표한 ‘국내외 바이오 빅데이터 현황 및 활용 방안’에서 이같이 밝혔다.
이세민 교수는 “바이오 분야에서의 빅데이터는 생활 습관 데이터, 임상정보, 건강보험정보, 약물반응성 데이터, 유전체 정보 등 매우 다양한 형태로 나뉘며 이렇듯 복잡한 이질성을 갖는 바이오 빅데이터를 어떻게 생산, 수집, 관리, 통합 분석해 새로운 가치를 창출할 것인가가 4차 산업혁명 시대를 맞이한 바이오 분야의 숙제라고 짚었다.
특히, 빅데이터 분석기술이 보건의료에 접목되면서 보건의료 정책, 보건의료기술 개발, 보건의료 비용 절감 등 다양한 보건의료 영역에서의 혁신이 기대되고 있는 만큼 산·학·연·병은 물론이고 국가 차원의 대응 역시 절실한 상황이라고 언급했다.
이 교수는 바이오 빅데이터의 핵심이라고 할 수 있는 유전체 데이터의 경우 그동안 다양한 정부 과제 등을 통해 생산된 양은 많으나 데이터가 파편화돼 있고 임상 정보 등과 연계된 자료가 많지 않아 그 활용성에 아쉬운 부분이 있다고 지적했다.
또한, 데이터가 확보됐다고 하더라고 개인정보 제공 동의가 돼 있지 않으면 그 활용에 많은 제약이 있는 것이 현실이라며 데이터 생산 전부터 빅데이터 구축 및 활용을 미리 염두에 두고 유전체 데이터뿐만 아니라 각종 생활 습관, 임상정보, 건강검진 정보 등을 함께 확보할 수 있어야 하며 그러한 데이터들이 개인정보 보호법에 따라 개인정보 주체의 동의를 통해 다양하게 활용될 수 있도록 해야 할 것이라고 주장했다.
이 교수는 “데이터 생산의 규모 역시 빅데이터라는 표현에 걸맞게 충분히 확보돼야 한다”고 밝혔다. 인공지능에 기반의 빅데이터 분석에 있어 바이오 데이터는 아직까지 데이터의 차원은 매우 높으나 N수는 부족한(high dimemsion, low sample size) 데이터로 취급되는 것이 현실이라는 것이다.
그는 “이를 극복하기 위해서는 충분한 데이터 확보 이외에 다른 방법이 없다”며 “이러한 이유로 각 선진국 및 대형 제약회사들이 엄청난 규모의 예산을 들여 대형 게놈 사업을 추진하고 있으며 우리나라도 국가 차원의 게놈 사업을 통한 양질의 바이오 빅데이터 구축이 절실하다”고고 볼 수 있다.
이 교수는 현행 법제는 바이오 빅데이터, 특히 보건의료 빅데이터의 활용을 예상하고 만들어진 것이 아니어서 지속적인 개선의 필요성이 제기되고 있다고 설명했다.
그는 바이오 빅데이터 수집과 공유 및 배포에 있어 개인을 식별할 수 있는 정보는 제거되는 개인정보 비식별화가 이뤄지지만, 정확히 어느 정도 수준으로 비식별화가 돼야 하는지에 대한 명확한 가이드라인이 부족한 실정이라고 지적했다.
다만 각종 개인정보 유출 사고로 개인정보 활용에 대한 불안감이 높은 상황에서 이는 매우 민감한 문제일 수밖에 없으며 바이오 빅데이터 이용을 통해 공공의 이익실현이 가능할 것으로 예상하더라도 정보공개에 따른 부작용 역시 심각하게 고려돼야 한다고 강조했다.
헌법상의 자기결정권에 근거한 개인정보보호제도의 의미를 생각해볼 때 정보의 주체인 개인이 자신의 바이오 데이터가 언제 누구에게 어느 범위까지 알려지고 이용되도록 할 것인지 충분한 이해를 통해 결정할 수 있도록 하는 것이 무엇보다 중요하다는 것.
이 교수는 개인정보보호 이외에도 바이오 빅데이터의 표준화 역시 해결돼야 할 중요한 문제라고 밝혔다.
의료 정보의 경우 국제표준화기구에서 전자건강기록에 대해 의료기관 수준의 의무기록, 공유 가능한 의무기록, 소비자 의무기록, 연구와 질병 등록 등의 관련된 다양한 정보들을 분류하여 공공의무기록의 관점에서 가이드라인을 제시하고 있으며, 국제표준화기구 외에도 의료정보 관련 용어 표준, 의료 데이터의 전달 및 통합을 위한 표준, 임상의사결정지원시스템에 대한 다양한 표준들이 개발되고 있다.
이 교수는 “실제 의료기관에서 표준화된 임상의료정보 외에도 다양한 부가 정보들을 자체적인 시스템을 통해 관리하고 있는 실정이어서 보다 구체적인 표준화 노력이 필요한 상황”이라며 “의료정보 외에도 생활 습관, 각종 표현형, 유전체 데이터에도 표준화의 필요성이 절실하다”고 말했다.
이세민 교수는 “국내는 물론 국제적인 협력을 통해 복잡하고 다양한 각종 바이오 데이터들이 연계되어 활용될 수 있도록 표준화 노력이 계속돼야 하며 이 역시 국가 차원의 관심과 지원이 절실하다”고 덧붙였다.
김정일
2019.02.01