UNIST 남덕우 교수 연구팀, 단일세포 데이터 통합 분석 연구
폐암·COVID-19 등 질병유전자 예측력 입증… Nature Commun. 게재
단일세포 데이터 통합을 통한 질병유전자 발굴에 토대를 제공해줄 수 있을 것으로 기대

전 세계적으로 단일세포 데이터의 생산과 활용이 바이오·의료분야에 널리 확산되고 있다.

단일세포 데이터 분석은 암에서 유전자의 이상 발현을 보다 정확하게 분석할 수 있을 것으로 기대되고 있지만, 실제로 높은 잡음과 결측률을 나타내 벌크 샘플 데이터 분석보다 더 정확한 선별을 할 수 있다는 것을 체계적으로 입증한 연구가 없었다.

단일세포 시퀀싱(scRNA-seq)은 통상적인 벌크샘플 시퀀싱(RNA-seq)과는 달리 개별 세포 수준에서 유전자 발현을 분석할 수 있는 기술로, 각종 질병, 발생, 분화 등 생물학적 과정을 분석하는데 널리 활용되고 있다.

UNIST 남덕우 교수 연구팀, 단일세포 빅데이터 분석으로 질병유전자 발굴

이번 연구를 진행한 연구진의 모습. 윗줄부터 남덕우 교수, 아랫줄 왼쪽부터 제 1저자 Hai Nguyen 연구원, 제 1저자 백부경 연구원 /UNIST 제공

13일 울산과학기술원(UNIST) 생명과학과 남덕유 교수 연구팀이 단일세포 시퀀싱 데이터의 통합분석을 통해 폐암, 감염병 등의 질병과 관련된 유전자들을 효과적으로 선별해 낼 수 있음을 밝혔다. 이 연구 결과는 세계적인 학술지 네이처 커뮤니케이션즈(Nature Communications)에 논문명 'Benchmarking integration of single-cell differential expression'으로 2023년 3월 21일 자 게재됐다.

벌크샘플은 상피세포와 각종 면역세포들이 섞여있어서 세포 유형의 차이를 고려하지 못하는 단점이 있는 반면, 단일세포 시퀀싱은 세포 유형별로 순일한 유전자 발현의 변화를 측정할 수 있어 질병의 발생 기작을 보다 정확하게 분석할 수 있다. 그러나 단일세포 데이터의 높은 잡음과 결측률, 데이터 간의 측정값의 차이(배치효과)로 인해 실제로 질병유전자의 분석에 얼마나 효과적인지 확인되지 않았다.

단일세포 데이터 통합분석을 통한 폐암유전자 예측 정확도 비교. 초록색선들이 수백명의 대규모 벌크샘플을 이용한 예측으로서 단일세포 데이터 통합분석보다 예측정확도가 떨어지는 것을 알 수 있다 (Epithelial). Myeloid와 T/NK 세포 데이터에서는 폐암유전자에 대한 예측력이 거의 없다는 것을 보여준다. /UNIST 제공

연구팀은 다양한 시뮬레이션 실험과 단일세포 데이터 분석을 통해 46가지 통합분석 방법을 비교했으며, 국내에서 생산한 1기 폐암환자들의 단일세포(상피세포) 데이터를 세포유형별로 통합분석했다.

이를 통해 기존에 폐암 관련 유전자로 보고된 90여 개 유전자들이 통계적으로 높은 순위를 가짐을 확인할 수 있었다. 이는 아직 밝혀지지 않은 폐암유전자들 또한 높은 순위로 선별할 수 있음을 시사한다. 이러한 결과는 기존에 진행됐던 수백 명의 벌크샘플 폐암환자의 데이터 분석에서도 달성하지 못한 결과로써 단일세포 통합분석이 폐암유전자 발굴에 매우 효과적이라는 것을 보여주고 있다는 것이다.

단일세포와 벌크샘플 데이터 분석을 통한 주요 폐암유전자들 랭크 비교. /UNIST 제공

또한 연구팀은 신빙성을 높이기 위해 대규모의 코로나19 환자 샘플에서 단핵구 세포 10만 개의 데이터를 추가로 분석했는데, 통합분석으로 유전자 발현 데이터를 분석한 결과, COVID-19 바이러스의 침입에 대응하는 것으로 알려진 130여 개의 유전자가 통계적으로 높은 순위를 차지하는 것을 재차 확인할 수 있었다. 연구팀은 추가 실험을 통해 서로 다른 유형의 질병에서 단일세포 데이터의 통합분석이 질병유전자를 효과적으로 선별해 줄 수 있다는 것을 확인했다.

10만개의 COVID-19 단핵구 데이터를 이용한 바이러스 반응 유전자 예측 정확도 비교. 대부분의 단일세포 분석 방법들이 통계적으로 유의한 질병유전자 예측력을 보여준다. /UNIST 제공

남덕우 생명과학과 교수는 “이번 연구 결과는 공개된 단일세포 데이터의 대규모 통합분석을 통해 새로운 질병유전자들과 작용 경로를 발굴할 수 있음을 제시해주고 있다”며 “암, COVID-19 등 다양한 질병의 기작 연구에 단일세포 데이터를 세포 수준을 넘어 유전자 수준에서 더 적극적으로 활용할 필요가 있다”라고 강조했다.

포인트경제 김민철 기자

관련기사
저작권자 © 포인트경제 무단전재 및 재배포 금지