오늘날 생물학과 생명공학의 발전이 증가함에 따라 과학자들은 단백질의 기능과 진화 역사를 밝히는 데 있어 단백질 구조의 중요성을 점점 더 인식하고 있습니다. 서열 유사성은 전통적으로 단백질 상동성을 추론하는 주요 방법으로 간주되어 왔지만 구조적 유사성의 지표는 특히 단백질 수퍼패밀리 분류와 관련하여 더 큰 신뢰성을 보여주었습니다.
단백질 슈퍼패밀리는 공통 조상을 추론하기 위한 가장 큰 그룹이며, 이 관계는 서열에 있어서 명백한 유사성이 없더라도 종종 구조적 정렬을 통해 추론됩니다.
단백질 슈퍼패밀리의 식별은 다양한 방법에 의존합니다. 구조적 유사성을 통해 진화적으로 유사한 많은 단백질 구성원을 식별할 수 있으며, 순서가 완전히 다르더라도 이러한 단백질의 기능과 촉매 메커니즘은 여전히 보존될 수 있습니다.
구조는 순서보다 진화적으로 더 보존됩니다. 이는 오랜 진화 과정을 거쳐 매우 유사한 구조를 가진 단백질이라도 완전히 다른 아미노산 서열을 가질 수 있음을 의미합니다. 많은 생물학적 연구가 단백질의 기능과 기원을 추론하기 위해 서열 분석을 기반으로 하기 때문에 이는 생물학에서 큰 관심을 끌고 있습니다.
단백질의 2차 구조 요소와 3차 구조적 특징은 흔히 고도로 보존되어 있으며, 기질 특이성이 크게 다를 수 있음에도 불구하고 많은 촉매 메커니즘은 단백질 수퍼패밀리 전반에 걸쳐 보존됩니다.
진핵생물 단백질의 약 66%~80%가 다중 도메인을 갖고 있는 것으로 추정되며, 이러한 도메인은 흔히 함께 혼합되어 소위 "도메인 구조"를 형성합니다. 이는 단순한 서열 비교로는 이들 단백질이 어떻게 관련되어 있는지 밝혀낼 수 없지만, 구조적 비교에서는 이들 사이의 암묵적인 연결을 드러낸다는 것을 의미합니다.
단백질 수퍼패밀리는 공통 조상에 대한 과학자들의 이해와 연구의 최신 발전을 나타냅니다. 이러한 상위과(superfamily)는 직접적인 증거를 기반으로 식별할 수 있는 가장 큰 진화 그룹을 나타내며, 일부 구성원은 생명의 모든 왕국에서 발생하며, 이러한 상위과의 조상은 모든 생명의 마지막 공통 조상(LUCA)에 거주함을 시사합니다.
유전자 복제(병렬성)는 같은 종 내의 단백질보다 상과 구성원 사이에서 더 흔하므로 구조적 상관 관계를 통해 유전자의 기원을 연구하는 것이 더 가능합니다.
물론 구조적 유사성은 많은 통찰력을 제공하지만 어떤 경우에는 구조적으로 유사한 단백질이 명백한 서열 유사성을 나타내지 않으므로 분석 도구의 한 층에서 단백질 구조가 더 높은 우선 순위를 갖습니다.
단백질 구조 연구 기술의 발전으로 과학계에서는 단백질의 기능, 진화, 상호작용을 설명하는데 있어서 구조의 중요성이 점차 인식되고 있으며, 이는 유전체학에 중요한 보충 정보를 제공합니다. 앞으로 전 세계 수천 가지의 다양한 단백질을 연구할 때 서열보다는 구조에 더 초점을 맞춰야 할까요?