바이오마커가 임상의 시작이자 끝…“초기 판단이 신약 성패 결정”
측정 가능성·임상 연계성·Assay 검증이 ‘진짜 바이오마커’ 조건
전임상·1상에서 얻는 제한적 정보가 전체 개발 전략에 미치는 파급력
EU·미국 서로 다른 승인 기준으로 본 규제 해석의 현실
MRD·AI 진단 확산으로 정밀 의학 기반의 환자군 정의 더욱 정교해져
입력 2025.11.25 06:00 수정 2025.11.25 06:01
인쇄하기 메일로 보내기 스크랩하기
작게보기 크게보기
길리어드 사이언스의 윤오규 디렉터가 2025 FDDF BD 포럼에서 발표를 진행하고 있다. © 약업신문 = 최윤수 기자

신약 개발의 복잡성이 높아지고 임상 단계별 의사결정 속도가 빨라지면서 바이오마커는 임상 성공 가능성을 좌우하는 핵심 요소로 자리 잡고 있다. 특히 환자 반응의 이질성이 커진 항암 분야에서는 어떤 환자에게 약물이 효과를 나타내는지 예측하는 능력이 실제 임상 3상 진입 여부뿐 아니라 허가 가능성, 시장 접근성까지 결정하는 중요한 기준이 되고 있다. 이러한 흐름 속에서 길리어드 사이언스는 임상 현장에서 바이오마커 전략이 어떻게 수립되고 실패와 성공이 어떻게 갈리는지를 구체적 사례 중심으로 공유했다.

2025년 국가신약개발사업단이 주최한 ‘KDDF BD Forum(글로벌 라이센싱 전략 사업개발 포럼)’에서 강연을 진행한 길리어드 사이언스의 윤오규 디렉터는 암세포생물학과 바이오인포매틱스를 기반으로 초기 1상부터 3상 후기 개발까지 전주기를 경험한 전문가로, 실제 개발 과정에서 마주하는 실전적 고민과 전략적 판단을 중심으로 바이오마커 활용의 중요성을 설명했다.

그는 “바이오마커는 단순한 연구 도구가 아니라 임상 개발의 방향성을 결정하는 축”이라며, “제한된 초기 데이터를 바탕으로 신속하게 결정을 내려야 하는 만큼 전략적 중요성이 과거보다 훨씬 커지고 있다”고 강조했다.

“좋은 바이오마커 조건 명확해야… 측정 가능성과 임상적 의사결정 연계가 핵심”

윤 디렉터는 바이오마커를 정의하는 가장 중요한 조건으로 측정의 용이성과 임상적 정보성을 언급했다. 환자의 조직을 절제해야만 확인할 수 있는 지표는 실제 임상에서 활용하기 어렵기 때문에, 혈액 등 비교적 비침습적인 방식으로 채취 가능한 샘플에서 얻어지는 정보가 유리하다. 또한 이를 검출하고 정량화할 수 있는 Assay가 정확성과 재현성을 갖추고 있어야 하며, 해당 지표가 단순한 연관성에 머물지 않고 치료 결정과 직접적으로 연결돼야 임상에서 활용할 수 있다.

바이오마커는 진단적 역할을 수행하거나 질병의 진행 가능성·악화 위험을 예측하는 예후 바이오마커로 쓰일 수 있지만, 제약사가 가장 중점적으로 다루는 것은 특정 치료제의 반응성을 구분하는 예측 바이오마커다.

윤 디렉터는 “대부분의 항암제는 모든 환자에게 동일한 효과를 보이지 않기 때문에, 약물이 잘 듣는 환자를 초기에 규명하는 것이 임상 효율성의 핵심”이라고 설명했다. 이러한 관점에서 바이오마커는 임상 설계, 환자군 설정, 허가 전략 등을 동시에 결정하는 의사결정 도구가 된다.

환자군 범위 결정이 ‘승패’ 좌우

키트루다(Keytruda)와 옵디보(Opdivo)의 임상 전략 차이는 바이오마커 컷오프 설정이 어떻게 임상 성공 여부를 가르는지 보여주는 대표 사례로 소개됐다. 두 약물 모두 PD-1을 타깃하는 면역항암제로 출시 시점과 개발 전략이 유사했지만, 각 회사의 PD-L1 발현 기준 설정은 크게 달랐다. 키트루다는 PD-L1 50% 이상이라는 높은 컷오프를 적용해 반응성이 강한 환자군을 중심으로 임상을 설계했고, 이는 통계적 효과를 명확히 보여주는 결과로 이어졌다. 반면 옵디보는 PD-L1 1% 또는 5% 이상으로 컷오프를 낮게 잡아 더 넓은 환자군을 포함했지만, 결과적으로 효과가 충분히 구분되지 않아 허가 획득에 실패했다.

윤 디렉터는 이러한 차이를 설명하며 “대부분의 회사는 1상과 2상에서 확보한 매우 제한된 데이터를 기반으로 컷오프를 결정해야 하며, 이 ‘작은 판단’이 3상 전체의 향방을 결정한다”고 말했다. 즉, 초기 데이터가 충분하지 않은 상황에서도 전략적 판단을 내려야 하고, 이 과정에서 과도한 확장이나 지나친 축소가 모두 위험 요소가 될 수 있다는 것이다.

30명 데이터로 결정했던 ADC… 위험 부담 속에서도 가속승인으로 이어진 전략
길리어드가 사례로 소개한 ADC(항체약물접합체) ‘Teliso-V(텔리소-V)’의 초기 바이오마커 전략은 극도로 제한된 데이터 기반에서 이뤄진 대담한 결정의 대표 사례다. 텔리소-V는 1상 단계에서 약 30명의 환자 데이터를 바탕으로 PD-L1 발현 25% 및 50%를 기준으로 환자군을 나누는 전략을 택했다. 이 결정은 데이터 규모만 놓고 보면 상당한 위험이 따랐지만, 임상 2상과 후속 연구에서 효과가 꾸준히 재현되며 결국 FDA 가속승인을 받는 성과를 냈다.

윤 디렉터는 “ADC의 특성상 전임상 데이터 해석이 어렵고, 1상 환자 수가 적어 임상적 확신을 얻기 어려운 상황이 반복된다”며 “그럼에도 불구하고 임상을 진행하기 위해서는 컷오프와 환자군 정의를 반드시 결정해야 한다는 현실적 고민이 반영된 사례”라고 설명했다. 이 사례는 초기 데이터의 불확실성이 크더라도 전략적 판단이 일관되게 이어질 때 긍정적 허가 결과로 연결될 수 있음을 보여준다.

동일 결과도 규제기관마다 해석 달라

PD-L1 발현에 따른 반응성을 다룬 Keynote-042 연구는 미국 FDA와 유럽 EMA의 상이한 허가 결정의 배경을 설명하는 사례로 제시됐다. 연구에서는 PD-L1 1% 이상 전체 환자군에서 통계적으로 유의한 효과가 나타났으나, 실제 이득의 대부분은 PD-L1 50% 이상군에서 발생했다. 동일한 데이터를 두고도 FDA는 1% 이상 전체 환자를 대상으로 승인한 반면, EMA는 효과 집중성을 이유로 50% 이상군으로 승인 대상을 좁혔다.

이 사례는 바이오마커 해석의 방식과 규제기관의 기준에 따라 허가 범위가 달라질 수 있다는 점을 보여주는 대표적 예로서, 글로벌 임상 전략 수립 시 각 규제기관의 해석 기준을 사전에 고려해야 하는 이유를 설명하는 근거가 된다.

윤오규 디렉터. © 약업신문 = 최윤수 기자

데이터 해석 오류 위험… “서브그룹 불균형이 효과 저하처럼 보일 수 있다”

윤 디렉터는 PACIFIC-3 연구를 예로 들어 서브그룹 분석의 해석 오류가 임상 결과를 왜곡할 수 있음을 설명했다. 해당 연구에서 PD-L1 1% 미만 환자군은 오히려 약물 치료보다 위약군이 더 좋아 보이는 결과가 나타났다.

처음에는 약물의 유효성 문제로 보였지만, 후속 분석에서 서브그룹 내 환자의 연령, 병기, 과거 병력 등에서 위약군이 더 유리한 특성을 가지고 있었음이 확인됐다. 이는 통계적 현상 중 하나인 Simpson’s paradox(심슨의 역설)의 전형적인 예로, 표면적으로는 약물 효과가 낮아 보이나 실제로는 서브그룹 구성이 결과를 왜곡한 상황이었다.

후속 분석이 축적되면서 유럽 규제당국은 초기의 PD-L1 제한을 해제했고, 이는 데이터 해석 과정에서 ‘보정되지 않은 서브그룹 분석’이 얼마나 큰 오류를 가져올 수 있는지를 보여준다.

윤 디렉터는 “서브그룹 분석은 임상 설계 단계에서부터 고려된 상태에서 수행돼야 하며, 그렇지 않으면 잘못된 결론을 초래할 수 있다”고 설명했다.

Assay 개발이 바이오마커 성공의 절대 조건
임상에서 바이오마커가 실제로 활용되기 위해서는 Assay 개발이 필수적인데, 윤 디렉터는 이를 바이오마커 전략의 사실상 가장 중요한 단계로 꼽았다. 프로토타입 Assay를 연구용(RUO)으로 만들고, 이후 임상용 Assay로 발전시키기 위해서는 수년간의 검증과 수많은 기술적 조정이 필요하다. 특히 동반진단이 필요한 경우, Assay 개발이 늦어지면 임상 3상 종료 이후에도 약물 승인 절차가 지연될 수 있다.

윤 디렉터는 “바이오마커 전략은 단순히 환자를 나누는 문제가 아니라, 진단법 개발과 규제 승인까지 연결된 긴 시간을 요구한다”며 “Assay 개발이 후순위로 밀리는 순간 임상 개발 일정 전체가 흔들릴 수 있다”고 설명했다.

ctDNA 기반 MRD가 임상 설계 바꾸는 시대

최근 항암 분야에서 기술적 가치를 인정받는 영역은 순환 종양 DNA(ctDNA)를 이용한 MRD(Minimal Residual Disease) 분석이다. 수술이나 치료 이후 눈에 보이지 않는 잔존 암세포를 탐지해 재발 가능성을 예측하는 기술로, 재발률 예측 정확도가 높아 환자군 분류의 새로운 기준으로 자리 잡고 있다.

특히 IMvigor010 연구는 전체적으로는 음성 결과였지만, MRD 양성 환자에서는 의미 있는 치료 이득이 확인되며 후속 연구의 방향성을 이끌었다. 이후 MRD 양성 환자만을 대상으로 설계한 IMvigor011 연구에서는 확실한 유의성이 관찰됐고, 이는 ctDNA 기반 MRD 전략이 임상 디자인 자체를 변화시키는 계기가 됐다.

윤 디렉터는 “ctDNA는 치료 반응을 실시간으로 추적할 수 있어 재발 예측과 환자 맞춤 치료 설계에서 빠르게 확산되고 있다”고 설명했다. 이러한 기술은 임상 개발 초기에 환자군을 정교하게 정의할 수 있게 해 신약 개발 전략의 중요한 요소로 자리 잡고 있다.

AI 기반 병리 이미지 분석, 미래 동반진단 핵심 부상

윤 디렉터는 AI 기반 분석이 바이오마커 개발의 패러다임을 바꾸고 있다고 설명했다. 그는 특정 항암제 임상에서 AI 알고리즘을 이용해 병리 슬라이드 이미지에서 세포 단위의 단백질 발현 정보를 정량화한 사례를 소개했다. 사람의 눈으로는 불가능한 수준의 정밀 분석을 AI가 수행해 바이오마커를 구분하고, 그 결과 치료 반응성과 높은 상관성을 보이는 환자군을 정확히 추려낼 수 있었다.

이러한 기술은 2024~2025년 FDA로부터 혁신의료기기(Breakthrough Device) 지정을 받으며 제도적 검증 체계를 빠르게 통과하고 있다. 윤 디렉터는 “향후 CDx 중 상당수가 AI 기반으로 개발될 가능성이 높으며, 임상에서의 적용 범위도 빠르게 늘어날 것”이라고 전망했다.

윤 디렉터는 “바이오마커 전략은 임상 개발에서 가장 복잡하면서도 가장 결정적인 요소로, 초기 데이터가 제한적이더라도 환자군과 Assay 전략을 반드시 정해야 한다”고 설명했다.

또한 “잘못된 컷오프 설정, 부정확한 데이터 해석, 준비되지 않은 Assay는 임상 실패로 직결되며, 성공 사례 역시 대부분 초기 판단의 정확도에서 비롯된다”고 덧붙였다.

윤 디렉터는 기술 발전 속도가 빠르게 증가하고 있지만 실제 임상에서 활용 가능한 바이오마커는 여전히 제한적이며, 전임상 단계에서 제시되는 수많은 후보 중 임상에서 살아남는 비율은 극히 낮다고 분석했다. 그럼에도 그는 “전략적 판단이 일관적으로 유지되고 정확한 데이터 해석이 동반될 때 비로소 신약 개발의 성공 가능성이 열린다”고 결론지었다.

전체댓글 0
    등록된 댓글이 없습니다.
인기기사 더보기 +
인터뷰 더보기 +
“건선 치료 핵심, '면역 조절 정확성'… IL-17A·17F 동시 억제가 새로운 표준 될 것”
“LDL-C는 가능한 낮게, 가능한 빠르게…심혈관질환 예방 핵심”
[첨생법 날개달다] 차바이오텍 “준비는 끝났다…이제 세계 무대서 승부할 것”
약업신문 타이틀 이미지
[산업]바이오마커가 임상의 시작이자 끝…“초기 판단이 신약 성패 결정”
아이콘 개인정보 수집 · 이용에 관한 사항 (필수)
  - 개인정보 이용 목적 : 콘텐츠 발송
- 개인정보 수집 항목 : 받는분 이메일, 보내는 분 이름, 이메일 정보
- 개인정보 보유 및 이용 기간 : 이메일 발송 후 1일내 파기
받는 사람 이메일
* 받는 사람이 여러사람일 경우 Enter를 사용하시면 됩니다.
* (최대 5명까지 가능)
보낼 메세지
(선택사항)
보내는 사람 이름
보내는 사람 이메일
@
Copyright © Yakup.com All rights reserved.
약업신문 의 모든 컨텐츠(기사)는 저작권법의 보호를 받습니다.
무단 전재·복사·배포 등을 금지합니다.
약업신문 타이틀 이미지
[산업]바이오마커가 임상의 시작이자 끝…“초기 판단이 신약 성패 결정”
이 정보를 스크랩 하시겠습니까?
스크랩한 정보는 마이페이지에서 확인 하실 수 있습니다.
Copyright © Yakup.com All rights reserved.
약업신문 의 모든 컨텐츠(기사)는 저작권법의 보호를 받습니다.
무단 전재·복사·배포 등을 금지합니다.