7번째 크리스퍼 유형 발견…어떻게 활용될까?
크리스퍼 유전자가위로 활용되는 세균 면역체계의 새로운 유형
3세대 유전자 가위로 활용되는 크리스퍼(CRISPR)는 지금까지 6가지 유형이 발견됐다. 수십억 개의 유전자 염기서열을 분석할 수 있는 알고리즘 개발을 통해 자연계에 존재하는 7번째 유형이 새로 발견됐다. 최근 《사이언스》에 발표된 미국 MIT 연구진의 논문을 토대로 《네이처》가 보도한 내용이다.
크리스퍼는 원래 단세포 세균의 면역체계의 일부를 형성하는 규칙적인 염기서열을 말한다. 박테리아파지로 불리는 바이러스에 감염될 경우 그 유전자를 인식하고 달라붙어 복제를 차단한다. 이 면역체계는 일반적으로 바이러스의 DNA 또는 RNA를 인식하고 결합하는 '가이드 RNA'와 가이드 RNA가 지정한 부위의 유전물질을 자르거나 방해하는 효소, 이렇게 두 부분으로 구성된다.
크리스퍼 면역체계는 지금까지 6가지 유형이 발견됐다. 이들 유형은 사용하는 효소의 유형과 RNA 또는 DNA를 인식하고 결합하고 절단하는 방법을 포함하여 서로 다른 특성을 가지고 있다. 유전자 가위로 주로 사용되는 크리스퍼-카스9(Cas9)는 제2형에 해당한다. 크리스퍼 부위 주변에 존재하는 유전자에서 발현되는 카스(Cas) 단백질은 크리스퍼의 RNA와 결합해 박테리오파지의 유전물질을 기억하고 파괴하는 것을 활용한 유형이다.
MIT의 펭 장 교수(생화학)가 이끄는 연구진은 미국 공공데이터베이스에 저장된 유전자 염기서열을 분석하는 FLSHclust라는 알고리즘을 개발했다. 이들 데이터베이스에는 박테리아와 고세균의 수십만 개의 게놈, 특정 종과 연결되지 않은 수억 개의 서열, 단백질을 암호화하는 수십억 개의 유전자가 포함돼 있다. FLSHclust는 유전자 서열 간의 유사성을 찾아 약 5억 개의 그룹으로 나눠 크리스퍼와 관련한 유전자를 선별했다.
연구진은 클러스터의 예측된 기능을 살펴본 결과 어떤 식이든 크리스퍼와 연관된 유전자가 약 13만 개나 된다는 것을 발견했다. 이 중 188개는 이전에 발견된 적이 없는 유전자였는데 연구진은 실험실에서 몇 가지를 검사를 거쳐 그 기능까지 확인했다.
연구진은 또 실험을 통해 DNA 이중나선을 풀고 유전자를 삽입하거나 삭제할 수 있는 방식으로 DNA를 자르는 등 CRISPR 면역체계가 박테리오파지를 공격하는 데 사용하는 다양한 전략을 밝혀냈다. 또한 박테리오파지가 박테리아의 방어를 피하는 데 도움이 될 수 있는 '안티 크리스퍼' DNA 조각을 확인했다.
새로운 유전자 중에는 RNA를 표적으로 하는 완전히 알려지지 않은 CRISPR 체계의 코드가 포함돼 있었다. 연구진은 이를 제7형으로 명명했다. 연구진의 일원인 미국 국립생명공학정보센터(NCBI)의 유진 쿠닌 연구원(생물학)은 제7형과 아직 확인되지 않은 다른 유형들이 자연계에서 극히 드물다면서 “다음 유형을 찾으려면 아마도 엄청난 노력이 필요할 것”이라고 말했다.
펭 장 교수는 “CRISPR 면역체계의 다양성에 놀라움을 금치 못했다“면서 "이러한 분석을 통해 생물학을 연구하고 잠재적으로 유용한 것을 발견하는 일석이조의 효과를 얻을 수 있을 것“이라고 밝혔다. 논문을 검토한 뉴질랜드 오타고대의 크리스 브라운 교수(생화학)은 이 알고리즘 자체가 연구자들이 종에 걸쳐 다른 유형의 단백질을 찾을 수 있게 해준다는 점에서 큰 진전이라고 밝혔다. 독일 마부르크대의 레나르트 란다우 교수(미생물학)는 "생화학자들에게는 보물창고와 같다“며 동의했다.
란다우 교수는 다음 단계는 효소와 면역체계가 작동하는 메커니즘과 이를 생명공학에 어떻게 적용할 수 있는지 알아내는 것이라고 말했다. 브라운 교수는 일부 크리스퍼 단백질은 DNA를 무작위로 자르기 때문에 유전공학에 쓸모가 없지만 DNA나 RNA 염기서열을 매우 정밀하게 검출하기 때문에 진단이나 연구도구로 활용될 수 있다고 설명했다.
연구진은 제7형 크리스퍼 또는 새롭게 발견된 유전자들이 유전공학에 도움이 될지 말하기는 아직 이르지만, 유용할 수 있는 몇 가지 특성이 있다고 밝혔다. 예를 들어 제7형은 바이러스 벡터에 쉽게 들어가 세포에 전달될 수 있는 유전자가 매우 적다. 반면 연구진이 발견한 다른 면역체계 중 일부는 매우 긴 가이드RNA를 포함하고 있어 전례 없는 정확도로 특정 유전자 서열을 표적으로 삼을 수 있다.
해당 논문은 다음 링크(https://www.science.org/doi/10.1126/science.adi1910)에서 확인할 수 있다.