

디지털 헬스케어와 의료 인공지능(AI) 육성이 새로운 전기를 맞이했다. 보건의료 핵심 과제 중 하나로 강력하게 추진되고 있는 데이터 기반 정밀의료 및 신약 개발의 핵심 인프라, '국가통합바이오빅데이터(BBP)'가 하반기에 연구 생태계 전면 개방을 앞두고 있기 때문이다.
29일 서울 코엑스에서 바이오코리아 2026의 오픈 세션으로 '2026 국가통합바이오빅데이터구축사업 컨퍼런스: 바이오빅데이터의 개방과 활용'이 성황리에 개최됐다. 이번 컨퍼런스는 국가통합바이오빅데이터구축사업단이 주최하고, 보건복지부를 비롯해 과학기술정보통신부, 산업통상자원부, 질병관리청 등 4개 부처가 공동 주관했다.
백롱민 국가통합바이오빅데이터구축사업단장은 AI 시대의 핵심 원료인 '데이터'의 중요성을 강조하며, 2024년부터 2032년까지 이어지는 BBP 사업의 청사진을 제시했다.
백 단장은 “유전체 등 생물학적 데이터, 혈액 검사 등 임상 데이터, 그리고 식습관과 수면 등 생활습관을 포함하는 라이프로그 데이터를 모두 연계하여 누적하는 것이 핵심”이라고 밝혔다.
BBP 사업은 생명윤리 및 안전에 관한 법률을 바탕으로 국민 100만 명의 동의를 얻어 건강 데이터와 20cc의 혈액을 기증받는 초대형 프로젝트다.
백 단장은 "과거 '금모으기 운동'과 똑같다"고 비유하며, “국민들의 소중한 혈액과 건강 데이터를 담을 튼튼한 그릇을 만들고 향후 10년간 차곡차곡 쌓아나가는 범국가적 과제”라고 역설했다.
이어 ”올해 연말 1차적인 인프라와 시스템이 완비되며, 정제와 표준화를 거친 초기 데이터셋을 우선 개방해 연구자들이 분석할 수 있도록 할 계획"이라며, 사전 설문조사로 선정된 53가지의 분석 툴을 폐쇄망 내에 기본 제공할 예정이라고 밝혔다.
첫 발제를 맡은 한국과학기술정보연구원(KISTI) 이준학 단장은 "데이터 인프라는 모든 바이오 혁신의 보이지 않는 척추"라며 BBP 플랫폼의 아키텍처와 개방 로드맵을 상세히 공개했다.
현재 BBP 플랫폼에는 전국 48개 모집기관을 통해 수집된 13만 1471명 규모의 가명 임상 기록이 축적되어 있다. 이와 함께 4만 3976건에 달하는 전장유전체(WGS) 데이터와 혈액·조직 등 240만 6521건의 방대한 인체자원까지 확보를 마친 상태다.
가장 큰 특징은 철저한 보안을 전제로 한 '폐쇄형 엔클레이브(Enclave)' 아키텍처다.
이 단장은 ”데이터는 플랫폼을 떠나지 않으며 떠나는 것은 인사이트뿐"이라는 대원칙하에, 5개 포털과 4단 망분리가 적용된 단일 보안 경계를 구축했다. 연구자는 심의를 거쳐 가상데스크톱(VDI) 내 격리된 워크스페이스에 접근해 데이터를 분석하며, 원시 데이터 다운로드 없이 오직 분석된 통계 및 집계 결과만 반출 심사를 거쳐 외부로 공개할 수 있다.
데이터 개방은 2026년 4월부터 6월까지 데이터 동결 및 구조 검수를 마치고, 7월 베타 테스트를 거쳐 10월에 일반 연구자 대상 본 개방이 이루어진다. 이를 뒷받침하기 위해 KISTI는 3만 1488코어의 CPU와 124장의 가속 GPU, 57.6PB의 통합 스토리지를 구축했다.
2027년부터 시작될 2단계 사업에서는 외부 상용 API 호출을 차단하고 내부망에서 오픈소스 LLM을 운영하는 '계층형 AI 플랫폼'으로 진화해 자율 연구 에이전트 및 연합학습을 지원할 계획이다.
두 번째 발제자로 나선 표준희 한국제약바이오협회 AI신약연구원 원장은 BBP와 같은 빅데이터 인프라가 신약 개발 전 주기에 미치는 영향을 역설했다. 2024년 노벨 화학상과 물리학상이 단백질 구조 예측 등 AI 분야에 수여된 것은 AI가 과학적 발견의 새로운 게임체인저임을 방증한다.
표 원장은 신약 개발 영역에서 AI가 단순한 프로세스 보조 도구를 넘어, 가설 설정부터 실험 설계와 결과 분석까지 주도하는 독립적 주체로 진화하고 있다고 설명했다. 실제로 글로벌 임상 파이프라인을 살펴보면 55%가 약물 디자인에, 21%가 표적 발굴에 AI를 활용 중이며, 14%는 환자 오믹스와 임상 데이터를 결합한 정밀의료 시뮬레이션에 사용되고 있다.
특히 FDA가 단일클론항체 등 신약 허가 시 동물실험 의무를 단계적으로 폐지함에 따라, 인공지능 및 인간 장기 유사 구조물 기반의 동물대체시험(NAMs)이 크게 활성화될 전망이다. 표 원장은 고품질 데이터 공급의 중요성을 강조하며, 제약사와 기술기업 간의 사일로를 허물고 BBP와 같은 공공 데이터와 자체 데이터를 연계하는 전략적 파트너십이 필수적이라고 덧붙였다.
세 번째 발제자인 정규환 교수는 의료 현장에서 AI의 최신 동향과 패러다임 전환을 조명했다. 현재 임상 의사들은 폭증하는 데이터와 과도한 업무량으로 인해 진단 지연 및 전문의 간 진단 불일치 문제에 노출되어 있어, 일관되고 확장 가능한 AI 어시스턴트의 도입이 시급한 상황이다.
정 교수는 의료 AI가 과거의 단일 태스크 수행 모델을 넘어, 대규모 자율학습을 기반으로 한 '파운데이션 모델(Foundation Models, FMs)'로 급격한 진화를 이뤄내고 있다고 강조했다.
실제로 임상 현장 곳곳에서는 진료과를 가리지 않고 혁신적인 범용 모델들이 등장하고 있다. 의료 영상 분야에서는 11개 모달리티에 걸쳐 20만 개 이상의 마스크를 학습한 메디컬 이미지 분할 범용 도구인 'MedSAM'이 개발되어 뛰어난 분할 성능을 입증했다.
안과 및 피부과 영역의 발전도 매섭다. 무라벨 망막 이미지를 자체적으로 학습해 다양한 질환을 예측해 내는 'RETFound' 모델을 비롯해, 방대한 피부 질환 이미지를 바탕으로 흑색종 등을 스크리닝하는 'PanDerm' 모델이 그 위력을 과시하고 있다.
방대한 데이터 처리가 요구되는 병리 영역에서도 놀라운 성과가 이어졌다. 무려 77TB 규모에 달하는 10만 개 이상의 H&E 슬라이드를 학습한 병리 범용 모델 'UNI'와 시각-언어 기반의 AI 모델 'PathChat'이 연이어 개발되며, 이제 AI가 인간 전문의에 필적하는 수준의 객관식 및 주관식 진단 능력을 보여주는 시대에 진입했음을 알렸다.
또한 거대언어모델(LLM)을 기반으로 한 의료 에이전트의 상용화도 눈앞에 다가왔다. 환자의 증상과 의료 기록을 바탕으로 감별 진단(DDx)을 돕는 구글의 'AMIE' 모델은 단독 진단에서 인간 의사를 상회하는 성과를 냈으며, MCP(Model Context Protocol)를 활용해 외부 의료 데이터를 안전하게 호출하고 순차적 진단을 수행하는 시스템이 구축되고 있다. 가상 병원 환경(Agent Hospital)에서 AI 의사 에이전트들이 스스로 환자를 진료하며 능력을 진화시키는 연구도 활발히 진행 중이다.
마지막 발제를 맡은 채종희 교수는 희귀질환 극복을 위한 BBP의 구체적인 임상적 가치와 전략을 제시했다. 희귀질환은 개별 환자 수는 적지만 종류가 7~8천 종에 달해 전 세계 인구의 약 10%가 앓고 있으며, 이 중 80%가 유전자 이상에 기인한다. 환자들은 병명을 알기 위해 여러 병원을 전전하는 '진단 방랑'을 겪는데, 국내 평균 소요 기간만 2.5년에 달한다.
임상 현장에 차세대 염기서열 분석(NGS)과 전장유전체(WGS)가 도입되었음에도 진단율이 40~50% 수준에 머물고 있는 상황에서, 채 교수는 미진단 환자들을 위해 BBP와 같은 대규모 데이터 공유가 필수적이라고 역설했다.
실제로 시범사업 데이터를 바탕으로 국제 희귀질환 네트워크(UDNI) 및 UK 바이오뱅크와 협력한 결과, 기존 기술로는 찾기 어려웠던 NOTCH2NLC 유전자의 반복서열 변이나 RNU4-2 등 비암호화 RNA 영역의 돌연변이를 밝혀내어 수년간 진단받지 못했던 환자들의 병명을 규명하는 쾌거를 이루었다.
더 나아가 진단을 넘어선 '맞춤형 치료'로의 패러다임 전환도 예고했다. 척수성 근위축증(SMA) 치료제 혁신에서 보듯, 최근의 유전자 치료는 ASO(안티센스 올리고뉴클레오타이드) 등 백본 플랫폼에 타깃만 변경하여 장착하는 방식으로 진화 중이다.
채 교수는 "수많은 희귀질환 환자의 전장유전체 데이터를 모으면 ASO 치료제가 작용할 수 있는 교정 가능 부위를 시스템적으로 발굴해 신약 개발 플랫폼으로 활용할 수 있다"고 강조했다. 이를 위해서는 유전체 데이터뿐만 아니라 시간이 지나며 변하는 환자의 증상을 임상 의사가 꼼꼼히 기록한 '피놈(Phenome)' 데이터의 정교한 큐레이션 및 연계가 동반되어야 한다고 덧붙였다.
디지털 헬스케어 육성이라는 국가적 기조에 발맞춰, 연말부터 순차적으로 이루어질 BBP의 전면 개방은 국내 제약바이오 및 의료 AI 생태계에 막대한 파급효과를 낳을 것이다. 특히 BBP 기반의 한국인 맞춤형 코호트 데이터는 글로벌 빅테크 모델의 한계를 극복하고, 국내 제약사들이 독자적인 AI 신약 파이프라인과 맞춤형 치료제(ASO) 플랫폼을 구축하는 핵심 자양분이 될 전망이다.
의료 AI의 고도화는 진단 정확도를 높여 불필요한 의료비 지출을 막고 건강보험 재정 건전성에도 기여한다.
다만, 이와 같은 혁신 기술이 임상 현장에 성공적으로 안착하려면 신속한 인허가 트랙을 비룻해, 임상 의사들의 적극적인 데이터 큐레이션 참여 유도, 새로운 의료 AI 행위에 대한 합리적인 건강보험 수가 보상 체계 등 전폭적인 정책적 뒷받침이 병행되어야 하는 과제도 남아있다. 글로벌 바이오헬스 산업의 패권을 쥐기 위한 본격적인 출발선에 섰다.
| 인기기사 | 더보기 + |
| 1 | “조건부 허가 아니다” 큐로셀 CAR-T ‘림카토주’ 3상 없이 정식 허가된 이유 |
| 2 | “2029년, 매출 10억 달러” SK바이오팜, 엑스코프리 성공과 미래 전략 제시 |
| 3 | 아이오니스 "RNA 치료제, 마지막 퍼즐 ‘독성’ 해법 찾았다…RNA 신약 새 시대" |
| 4 | 100만 바이오 빅데이터 문 열린다… '의료 AI·신약' 대도약 시대 개막 |
| 5 | 유통업계, 대웅 압박 국회로…5월 국회 릴레이 1인 시위 돌입 |
| 6 | 릴리, AI 설계 재조합 효소 개발 전략적 제휴 |
| 7 | FDA, 암젠 희귀질환 치료제 허가 취소 압박…‘데이터 조작’ 직접 언급 |
| 8 | "비만, GLP-1 이후를 본다” 한국투자파트너스, 스웨덴 바이오텍에 베팅한 이유 |
| 9 | 캐나다 온타리오, K-바이오 북미 진출 전략적 거점 부각 |
| 10 | 이모코그, ‘코그테라’ 출시 6개월 만 처방 1000건 돌파 |
| 인터뷰 | 더보기 + |
| PEOPLE | 더보기 + |
| 컬쳐/클래시그널 | 더보기 + |


디지털 헬스케어와 의료 인공지능(AI) 육성이 새로운 전기를 맞이했다. 보건의료 핵심 과제 중 하나로 강력하게 추진되고 있는 데이터 기반 정밀의료 및 신약 개발의 핵심 인프라, '국가통합바이오빅데이터(BBP)'가 하반기에 연구 생태계 전면 개방을 앞두고 있기 때문이다.
29일 서울 코엑스에서 바이오코리아 2026의 오픈 세션으로 '2026 국가통합바이오빅데이터구축사업 컨퍼런스: 바이오빅데이터의 개방과 활용'이 성황리에 개최됐다. 이번 컨퍼런스는 국가통합바이오빅데이터구축사업단이 주최하고, 보건복지부를 비롯해 과학기술정보통신부, 산업통상자원부, 질병관리청 등 4개 부처가 공동 주관했다.
백롱민 국가통합바이오빅데이터구축사업단장은 AI 시대의 핵심 원료인 '데이터'의 중요성을 강조하며, 2024년부터 2032년까지 이어지는 BBP 사업의 청사진을 제시했다.
백 단장은 “유전체 등 생물학적 데이터, 혈액 검사 등 임상 데이터, 그리고 식습관과 수면 등 생활습관을 포함하는 라이프로그 데이터를 모두 연계하여 누적하는 것이 핵심”이라고 밝혔다.
BBP 사업은 생명윤리 및 안전에 관한 법률을 바탕으로 국민 100만 명의 동의를 얻어 건강 데이터와 20cc의 혈액을 기증받는 초대형 프로젝트다.
백 단장은 "과거 '금모으기 운동'과 똑같다"고 비유하며, “국민들의 소중한 혈액과 건강 데이터를 담을 튼튼한 그릇을 만들고 향후 10년간 차곡차곡 쌓아나가는 범국가적 과제”라고 역설했다.
이어 ”올해 연말 1차적인 인프라와 시스템이 완비되며, 정제와 표준화를 거친 초기 데이터셋을 우선 개방해 연구자들이 분석할 수 있도록 할 계획"이라며, 사전 설문조사로 선정된 53가지의 분석 툴을 폐쇄망 내에 기본 제공할 예정이라고 밝혔다.
첫 발제를 맡은 한국과학기술정보연구원(KISTI) 이준학 단장은 "데이터 인프라는 모든 바이오 혁신의 보이지 않는 척추"라며 BBP 플랫폼의 아키텍처와 개방 로드맵을 상세히 공개했다.
현재 BBP 플랫폼에는 전국 48개 모집기관을 통해 수집된 13만 1471명 규모의 가명 임상 기록이 축적되어 있다. 이와 함께 4만 3976건에 달하는 전장유전체(WGS) 데이터와 혈액·조직 등 240만 6521건의 방대한 인체자원까지 확보를 마친 상태다.
가장 큰 특징은 철저한 보안을 전제로 한 '폐쇄형 엔클레이브(Enclave)' 아키텍처다.
이 단장은 ”데이터는 플랫폼을 떠나지 않으며 떠나는 것은 인사이트뿐"이라는 대원칙하에, 5개 포털과 4단 망분리가 적용된 단일 보안 경계를 구축했다. 연구자는 심의를 거쳐 가상데스크톱(VDI) 내 격리된 워크스페이스에 접근해 데이터를 분석하며, 원시 데이터 다운로드 없이 오직 분석된 통계 및 집계 결과만 반출 심사를 거쳐 외부로 공개할 수 있다.
데이터 개방은 2026년 4월부터 6월까지 데이터 동결 및 구조 검수를 마치고, 7월 베타 테스트를 거쳐 10월에 일반 연구자 대상 본 개방이 이루어진다. 이를 뒷받침하기 위해 KISTI는 3만 1488코어의 CPU와 124장의 가속 GPU, 57.6PB의 통합 스토리지를 구축했다.
2027년부터 시작될 2단계 사업에서는 외부 상용 API 호출을 차단하고 내부망에서 오픈소스 LLM을 운영하는 '계층형 AI 플랫폼'으로 진화해 자율 연구 에이전트 및 연합학습을 지원할 계획이다.
두 번째 발제자로 나선 표준희 한국제약바이오협회 AI신약연구원 원장은 BBP와 같은 빅데이터 인프라가 신약 개발 전 주기에 미치는 영향을 역설했다. 2024년 노벨 화학상과 물리학상이 단백질 구조 예측 등 AI 분야에 수여된 것은 AI가 과학적 발견의 새로운 게임체인저임을 방증한다.
표 원장은 신약 개발 영역에서 AI가 단순한 프로세스 보조 도구를 넘어, 가설 설정부터 실험 설계와 결과 분석까지 주도하는 독립적 주체로 진화하고 있다고 설명했다. 실제로 글로벌 임상 파이프라인을 살펴보면 55%가 약물 디자인에, 21%가 표적 발굴에 AI를 활용 중이며, 14%는 환자 오믹스와 임상 데이터를 결합한 정밀의료 시뮬레이션에 사용되고 있다.
특히 FDA가 단일클론항체 등 신약 허가 시 동물실험 의무를 단계적으로 폐지함에 따라, 인공지능 및 인간 장기 유사 구조물 기반의 동물대체시험(NAMs)이 크게 활성화될 전망이다. 표 원장은 고품질 데이터 공급의 중요성을 강조하며, 제약사와 기술기업 간의 사일로를 허물고 BBP와 같은 공공 데이터와 자체 데이터를 연계하는 전략적 파트너십이 필수적이라고 덧붙였다.
세 번째 발제자인 정규환 교수는 의료 현장에서 AI의 최신 동향과 패러다임 전환을 조명했다. 현재 임상 의사들은 폭증하는 데이터와 과도한 업무량으로 인해 진단 지연 및 전문의 간 진단 불일치 문제에 노출되어 있어, 일관되고 확장 가능한 AI 어시스턴트의 도입이 시급한 상황이다.
정 교수는 의료 AI가 과거의 단일 태스크 수행 모델을 넘어, 대규모 자율학습을 기반으로 한 '파운데이션 모델(Foundation Models, FMs)'로 급격한 진화를 이뤄내고 있다고 강조했다.
실제로 임상 현장 곳곳에서는 진료과를 가리지 않고 혁신적인 범용 모델들이 등장하고 있다. 의료 영상 분야에서는 11개 모달리티에 걸쳐 20만 개 이상의 마스크를 학습한 메디컬 이미지 분할 범용 도구인 'MedSAM'이 개발되어 뛰어난 분할 성능을 입증했다.
안과 및 피부과 영역의 발전도 매섭다. 무라벨 망막 이미지를 자체적으로 학습해 다양한 질환을 예측해 내는 'RETFound' 모델을 비롯해, 방대한 피부 질환 이미지를 바탕으로 흑색종 등을 스크리닝하는 'PanDerm' 모델이 그 위력을 과시하고 있다.
방대한 데이터 처리가 요구되는 병리 영역에서도 놀라운 성과가 이어졌다. 무려 77TB 규모에 달하는 10만 개 이상의 H&E 슬라이드를 학습한 병리 범용 모델 'UNI'와 시각-언어 기반의 AI 모델 'PathChat'이 연이어 개발되며, 이제 AI가 인간 전문의에 필적하는 수준의 객관식 및 주관식 진단 능력을 보여주는 시대에 진입했음을 알렸다.
또한 거대언어모델(LLM)을 기반으로 한 의료 에이전트의 상용화도 눈앞에 다가왔다. 환자의 증상과 의료 기록을 바탕으로 감별 진단(DDx)을 돕는 구글의 'AMIE' 모델은 단독 진단에서 인간 의사를 상회하는 성과를 냈으며, MCP(Model Context Protocol)를 활용해 외부 의료 데이터를 안전하게 호출하고 순차적 진단을 수행하는 시스템이 구축되고 있다. 가상 병원 환경(Agent Hospital)에서 AI 의사 에이전트들이 스스로 환자를 진료하며 능력을 진화시키는 연구도 활발히 진행 중이다.
마지막 발제를 맡은 채종희 교수는 희귀질환 극복을 위한 BBP의 구체적인 임상적 가치와 전략을 제시했다. 희귀질환은 개별 환자 수는 적지만 종류가 7~8천 종에 달해 전 세계 인구의 약 10%가 앓고 있으며, 이 중 80%가 유전자 이상에 기인한다. 환자들은 병명을 알기 위해 여러 병원을 전전하는 '진단 방랑'을 겪는데, 국내 평균 소요 기간만 2.5년에 달한다.
임상 현장에 차세대 염기서열 분석(NGS)과 전장유전체(WGS)가 도입되었음에도 진단율이 40~50% 수준에 머물고 있는 상황에서, 채 교수는 미진단 환자들을 위해 BBP와 같은 대규모 데이터 공유가 필수적이라고 역설했다.
실제로 시범사업 데이터를 바탕으로 국제 희귀질환 네트워크(UDNI) 및 UK 바이오뱅크와 협력한 결과, 기존 기술로는 찾기 어려웠던 NOTCH2NLC 유전자의 반복서열 변이나 RNU4-2 등 비암호화 RNA 영역의 돌연변이를 밝혀내어 수년간 진단받지 못했던 환자들의 병명을 규명하는 쾌거를 이루었다.
더 나아가 진단을 넘어선 '맞춤형 치료'로의 패러다임 전환도 예고했다. 척수성 근위축증(SMA) 치료제 혁신에서 보듯, 최근의 유전자 치료는 ASO(안티센스 올리고뉴클레오타이드) 등 백본 플랫폼에 타깃만 변경하여 장착하는 방식으로 진화 중이다.
채 교수는 "수많은 희귀질환 환자의 전장유전체 데이터를 모으면 ASO 치료제가 작용할 수 있는 교정 가능 부위를 시스템적으로 발굴해 신약 개발 플랫폼으로 활용할 수 있다"고 강조했다. 이를 위해서는 유전체 데이터뿐만 아니라 시간이 지나며 변하는 환자의 증상을 임상 의사가 꼼꼼히 기록한 '피놈(Phenome)' 데이터의 정교한 큐레이션 및 연계가 동반되어야 한다고 덧붙였다.
디지털 헬스케어 육성이라는 국가적 기조에 발맞춰, 연말부터 순차적으로 이루어질 BBP의 전면 개방은 국내 제약바이오 및 의료 AI 생태계에 막대한 파급효과를 낳을 것이다. 특히 BBP 기반의 한국인 맞춤형 코호트 데이터는 글로벌 빅테크 모델의 한계를 극복하고, 국내 제약사들이 독자적인 AI 신약 파이프라인과 맞춤형 치료제(ASO) 플랫폼을 구축하는 핵심 자양분이 될 전망이다.
의료 AI의 고도화는 진단 정확도를 높여 불필요한 의료비 지출을 막고 건강보험 재정 건전성에도 기여한다.
다만, 이와 같은 혁신 기술이 임상 현장에 성공적으로 안착하려면 신속한 인허가 트랙을 비룻해, 임상 의사들의 적극적인 데이터 큐레이션 참여 유도, 새로운 의료 AI 행위에 대한 합리적인 건강보험 수가 보상 체계 등 전폭적인 정책적 뒷받침이 병행되어야 하는 과제도 남아있다. 글로벌 바이오헬스 산업의 패권을 쥐기 위한 본격적인 출발선에 섰다.