최대 크기의 메가 단백질 유전자 발견
미생물인 박테리아 세포에 역설적으로 흔하게 존재
단백질 중에서 3만 개 이상의 아미노산으로 구성된 대형 단백질을 메가 단백질이라 한다. 지금까지 가장 큰 메가 단백질은 4만개의 아미노산으로 구성된 것이었는데 그보다 2배 이상 많은 8만5000개 이상의 아미노산으로 구성되는 단백질을 암호화하는 유전자가 발견됐다.
하지만 이론상 존재 가능성만 확인됐을 뿐 그 실체는 확인되지 않았다. 이 메가 단백질은 다른 미생물 세포를 먹이로 삼는데 도움을 주지만 형성된 직후 여러 조각으로 나뉘기 때문에 실체 확인이 어려운 것으로 추정됐다. 생물학논문 사전공개 사이트 《바이오아카이브(bioRxiv)》에 지난달 발표된 미국 캐나다 일본 연구진의 논문을 토대로 과학전문지 《네이처》가 지난주 보도한 내용이다.
미국 캘리포니아대 버클리캠퍼스(UC버클리)의 제이콥 웨스트-로버츠 박사과정 연구원(컴퓨터생물학)은 거대 유전자를 찾기 위해 미생물 DNA 서열을 조사하던 중 놀라운 것을 발견했다. 1800개의 아미노산으로 구성된 단백질을 암호화하는 유전자였다. 단백질은 일반적으로 수백 개의 아미노산으로 구성된다. 그의 박사과정 지도교수인 UC버클리 질리안 밴필드 교수(환경미생물)는 DNA 서열 분석을 통해 3만개 이상의 아미노산으로 구성된 메가 단백질도 보고된 바가 있음을 알려주면서 더 큰 메가 단백질을 찾아보라고 격려했다.
그 결과 사상 최대인 8만5000개의 아미노산으로 이루어진 단백질을 필두로 수십 개의 메가 단백질이 더 발견됐다. 이 거대 분자는 수수께끼 같은 환경 미생물군이 다른 미생물 세포를 먹이로 삼도록 해준다는 것이 연구진의 추론이다.
논문을 검토한 미국 네바다대의 브라이언 헤드룬드 교수(미생물학) “지금까지 알려진 가장 큰 예측 단백질의 크기를 4만개에서 8만5000개로 두 배로 늘린 좋은 연구”라고 평가했다. 세계 최대의 단백질이란 타이틀은 수십 년간 근육에서 발견되는 약 3만5000개의 아미노산으로 이루어진 ‘티틴(Titin)’이라는 이름의 메가 단백질이 차지해왔다.
하지만 세계 기록 갱신은 조금 더 기다려 볼 필요가 있다. 웨스트-로버츠와 그의 동료들은 구글 딥마인드의 단백질 구조 예측 인공지능(AI)인 알파폴드(AlphaFold)를 이용해 유전자 서열로부터 거대한 단백질의 존재를 추론하고 분자 모양의 일부를 예측했다. 그 결과 더 큰 메가 단백질이 일단 세포에서 만들어진 뒤 다른 기능을 가진 조각으로 잘려 나갈 가능성이 있음을 발견했다.
메가 단백질은 특히 1990년대 미국 북부의 옐로스톤 국립공원에서 처음 발견된 뒤 현재 환경 샘플에서 흔히 발견되는 박테리아군인 옴니트로포타(Omnitrophota)에서 많이 발견된다. 연구진은 폐수에서 3만 개 이상의 아미노산으로 구성되는 단백질을 암호화하는 46개의 옴니트로포타 유전자를 새로 발견했다. 그 중에는 최대 8민5804개의 아미노산으로 구성된 거대 단백질을 암호화하는 유전자도 포함돼 있다.
웨스트-로버츠 연구원은 “그것들은 어디에나 있었다”고 말했다. 메가 단백질의 이런 편재성에도 불구하고 연구진은 옴니트로포타의 염기서열만 알 뿐 거의 아는 게 없다고 밝혔다. 실험실에서 옴니트포타를 배양한 사례가 거의 없기 때문이다.
하지만 지난해 독일 막스 플랑크 해양 미생물학 연구소의 옌스 하르더 교수(미생물학) 이끄는 연구진은 획기적인 발견을 보고했다. 1990년대부터 실험실에서 느리게 성장하는 배양액으로 배양해 온 폐수 샘플에서 옴니트로포타 유전 물질을 함유한 세포를 발견한 것.
하르더 교수 연구진은 이 세포로 샘플을 농축하는 방법을 개발한 뒤 이를 분석했다. 유전자 서열분석을 통해 거의 4만 개의 아미노산 길이의 메가 단백질을 암호화하는 것으로 예측되는 유전자를 확인했고, 생화학 분석에서 일치하는 단백질 조각도 발견했다. 하르더 연구진은 옴니트로포타 세포의 전자현미경 사진에서 이 메가 단백질이 고세균이라고 불리는 다른 박테리아와 미생물을 공격하고 잡아먹는 모습까지 포착했다.
웨스트-로버츠 연구진은 그들이 발견한 메가 단백질이 유사한 포식활동에 관여하는지 확인하기 위해 염기서열 분석을 시도했다. 많은 단백질이 세포막을 수십 번 이상 통과하는 것으로 나타났다. 거대 단백질에는 세포벽에서 발견되는 당과 기타 생체 분자를 부착하고 분해하는 효소의 서열과 유사한 서열을 가진 단백질이 다수 포함되어 있다. 이러한 단백질이 먹잇감의 세포벽에 결합하고 소화하는 데 사용될 수 있음을 시사한다고 연구진은 추론했다.
웨스트-로버츠 연구진은 메가 단백질이 어떻게 생겼는지 알아내기 위해 알파폴드에 단백질 서열의 일부를 연결했다. 알파폴드는 아미노산이 2000개 이상인 단백질 분석에는 적합하지 않다. 그래서 연구진은 메가 단백질을 1000개의 아미노산이 겹치는 부분으로 나눴다. 웨스트-로버츠 연구원은 “너무 길게 만들면 알파폴드는 어느 순간 포기하고 스파게티 한 덩어리를 만들어낸다”고 말했다.
알파폴드가 단백질 구조를 예측한 결과, 더 많은 세포벽 결합 영역이 밝혀졌을 뿐만 아니라 연구자들이 지금까지 본 적 없는 매우 긴 튜브 모양의 장치가 발견되어 큰 놀라움을 안겨줬다. 이 구조는 분자를 먹잇감으로 전달하는 데 관여하거나 숙주 미생물이 세포를 삼키기 전에 다른 세포에 부착할 수 있다.
서울대의 마틴 스타이네거 교수(컴퓨터생물학)는 알파폴드와 다른 첨단 도구를 사용해 거대 분자를 이해하는 방식에 깊은 인상을 받았다며 “기존 방법의 한계를 뛰어넘어 거대한 분자 기계에 주석을 달 수 있다는 것은 상당한 도약”이라고 평가했다. 남아프리카공화국 프리토리아대의 옹레그 레바 교수(생물정보학)는 메가 단백질이 아주 작은 미생물인 옴니트로포타에서 매우 흔하다는 사실이 특히 놀랍다면서 이번 연구가 “메가 단백질이 박테리아와 고생물을 먹잇감으로 쫓는 작은 미생물 사냥꾼들이 사용하는 정교한 무기”임을 보여줬다고 말했다.
단백질을 8만5000개 이상의 아미노산으로 코딩하는 유전자가 발견되었다고 해서 해당 분자가 세포 내에서 이러한 상태로 존재한다는 의미는 아니라고 과학자들은 말한다. 한 가지 가능성은 단백질이 만들어진 후 더 작은 조각으로 잘려지고, 이러한 부분이 세포에서 다양한 기능을 수행한다는 것이다. 이는 하르더 연구진이 거대한 단백질 조각만 찾을 수 있었던 이유를 설명할 수 있다. 하르더 교수는 “현재 나는 이러한 큰 단백질이 존재한다는 실험적 증거를 찾을 수 없었다”고 말했다.
많은 메가 단백질에 포함된 펩티다아제(peptidase)라는 단백질 분해효소가 큰 덩치를 작은 조각으로 나눠주게 해주는 열쇠 역할을 한다고 웨스트-로버츠 연구진은 추론했다. 확실한 답을 얻으려면 연구자들이 옴니트로포타 세포를 성장시켜야 하는데, 지금까지는 하르더 연구진만이 이를 성공시켰다. 하르더 교수는 “다른 모든 것은 상상에 불과하다”며 “풀어야 할 미스터리가 많다."고 말했다.
박사학위 취득을 눈앞에 둔 웨스트-로버츠 연구원은 극저온 전자 현미경이나 세포 내 단백질을 지도화할 수 있는 관련 실험 기술을 사용해 거대 단백질 실제 모습을 밝혀내는 것을 목표로 삼고 있다. 그는 “정말로 그것을 보고 그것이 실제로 무엇인지에 대한 실체적 진실을 얻고 싶다”고 말했다.
해당 논문은 다음 링크(https://www.biorxiv.org/content/10.1101/2023.11.21.568195v1)에서 확인할 수 있다.