분자생물학유전학에서 GC 함량(구아닌-사이토신 함량, GC-content)은 DNA 또는 RNA에서의 구아닌사이토신의 백분율이다.[1] GC 함량은 DNA아데닌티민, RNA아데닌유라실을 포함하여 암시 된 4개의 전체 염기 중 구아닌과 사이토신의 비율을 나타낸다.

아데닌-티민, 구아닌-사이토신 결합을 나타내는 뉴클레오타이드 결합. 파란 화살표는 수소 결합을 의미한다.

GC 함량은 DNA 또는 RNA의 특정 단편 또는 전체 게놈에 대해 주어진다. 이것이 단편을 지칭할 때, 이는 개별 유전자 또는 유전자의 도메인, 유전자군, 비암호화 영역, 프라이머와 같은 합성 올리고뉴클레오타이드의 GC 함량을 나타낸다.

구조 편집

정량적으로, 구아닌과 사이토신은 서로 특정한 수소 결합을 한다. 반면, 아데닌은 DNA에서 티민과, RNA에서 유라실과 특이적으로 결합한다. 각 GC 염기쌍은 3개의 수소 결합에 의해 함께 유지되고, AT 및 AU 염기쌍은 2개의 수소 결합에 의해 함께 유지된다. 이 차이를 강조하기 위해 수소 결합 쌍을 G≡C 대 A=T 또는 A=U로 표시한다.

GC 함량이 높을수록 DNA는 안정적이다. 그러나 수소 결합 자체는 분자 안정성에 유의미한 영향을 미치지 않으며, 이는 주로 염기 스태킹의 분자 상호 작용에 의해 야기된다.[2] 높은 GC 함량을 갖는 핵산은 높은 내열성을 가졌음에도 불구하고, 세균에서의 일부 종에서는 높은 GC함량은 오토파지되어 세포의 수명을 감소하는 것으로 나타났다.[3][4]

측정 편집

GC 함량은 일반적으로 백분율 값으로 표현되지만, GC 비율(GC ratio)로도 표시된다. GC 함량 백분율은 다음과 같이 계산한다.[5]

 

A-T/G-C 비율은 다음과 같이 계산한다.[6]

  .

GC 비율뿐만 아니라 GC 함량은 분광광도법을 사용하여 측정할 수 있다. DNA 이중 나선의 용융 온도를 측정함으로써 알 수 있다. 260nm파장에서 DNA의 흡광도는 이중 가닥이 단일 가닥으로 분리될 때 급격히 증가한다.[7] GC 비율을 결정하기 위해 가장 일반적으로 사용되는 프로토콜은 유세포 분석을 사용한다.[8]

게놈 내용 편집

게놈 내 변이 편집

게놈 내 GC 비율은 가변적인 것으로 밝혀졌다. 복잡한 유기체의 게놈 내에서 GC 비율의 변화는 isochores라는 작은 섬(islet) 영역을 갖는 모자이크와 같은 것을 형성한다.[9] 이것은 염색체의 염색 강도의 변화를 초래한다.[10] GC 풍부 isochores는 전형적으로 그 안에 많은 단백질 암호화 유전자를 포함한다. 따라서 이들 특정 영역의 GC 비율의 결정은 게놈의 유전자 풍부 영역을 맵핑하는데 기여한다.[11][12]

암호화 서열 편집

게놈 서열의 긴 영역 내에서, 유전자는 종종 전체 게놈에 대한 배경 GC 함량과 대조적으로 더 높은 GC 함량을 갖는 것을 특징으로 한다. 유전자의 암호화 영역의 길이와 GC 비율간의 증거는 암호화 서열의 길이가 더 긴 GC 함량에 비례한다는 것을 보여주었다.[13] 이는 종결 코돈이 아데닌과 티민에 대한 편향을 가지며, 서열이 짧을수록 AT 편향이 높다는 사실이 밝혀졌다.[14]

포유 동물에서 1,000개 이상의 이종상 동성 유전자의 비교는 30% 미만 혹은 80% 이상의 범위로, 제 3 코돈 위치 GC 함량의 게놈 내 변이가 현저하게 나타났다.[15]

게놈 간 변이 편집

GC 함량은 상이한 유기체에 따라 가변적인 것으로 밝혀졌으며,이 과정은 선택, 돌연변이 편향 및 편향된 재조합 관련 DNA 수선의 변화에 의해 기여되는 것으로 예상된다.[16]

인간 게놈의 평균 GC 함량은 100Kb 단편에 걸쳐 35%~60%이며, 평균 41%이다.[17] 효모(Saccharomyces cerevisiae)의 GC 함량은 38%이며[18], 애기장대의 GC 함량은 36%이다.[19] 유전 부호의 특성으로 인해 유기체의 GC 함량이 0% 또는 100%에 가까운 게놈을 갖는 것은 사실상 불가능하다. 그러나 GC 함량이 매우 낮은 종은 Plasmodium falciparum이 존재하며(GC % = ~ 20 %)이며[20], 일반적으로 GC가 아니라 AT가 풍부한 것으로 언급한다.[21]

응용 편집

분자생물학 편집

중합효소 연쇄 반응(PCR)에서, 프라이머로 알려진 짧은 올리고뉴클레오티드의 GC 함량은 종종 주형 DNA에 대한 용융 온도(annealing temperature)를 예측하는 데 사용한다. GC 함량이 더 높으면, 용융 온도도 더 높다.

계통분류학 편집

비진핵 생물 분류법에서 종 문제(species problem)는 세균 분류에 대한 다양한 제안을 가져왔으며, '세균 체계의 접근 조정에 대한 임시위원회'는 상위 계층적 분류에서 GC 비율의 사용을 권장했다.[22] 예를 들어, 방선균은 GC 함량이 높은 세균이다.[23] 또한 Streptomyces coelicolor A3(2)에서의 GC 함량은 72%이다.[24]

소프트웨어 도구 편집

GCSpeciesSorter[25] 및 TopSort[26]는 GC 함량에 따라 종을 분류하기 위한 소프트웨어 도구이다.

각주 편집

  1. Definition of GC – content on CancerWeb of Newcastle University,UK
  2. “Base-stacking and base-pairing contributions into thermal stability of the DNA double helix”. 《Nucleic Acids Res.》 34 (2): 564–74. 2006. doi:10.1093/nar/gkj454. PMC 1360284. PMID 16449200. 
  3. “Autolysis of high-GC isolates of Pseudomonas putrefaciens”. 《Antonie van Leeuwenhoek》 42 (1–2): 145–55. 1976. doi:10.1007/BF00399459. PMID 7999. 
  4. “High guanine-cytosine content is not an adaptation to high temperature: a comparative analysis amongst prokaryotes”. 《Proc. Biol. Sci.》 268 (1466): 493–7. March 2001. doi:10.1098/rspb.2000.1397. PMC 1088632. PMID 11296861. 
  5. Madigan,MT. and Martinko JM. (2003). 《Brock biology of microorganisms》 10판. Pearson-Prentice Hall. ISBN 978-84-205-3679-8. 
  6. “Definition of GC-ratio on Northwestern University, IL, USA”. 2010년 6월 20일에 원본 문서에서 보존된 문서. 2020년 6월 29일에 확인함. 
  7. “Real-time PCR-based method for the estimation of genome sizes”. 《Nucleic Acids Res.》 31 (10): e56. May 2003. doi:10.1093/nar/gng056. PMC 156059. PMID 12736322. 
  8. Vinogradov AE (May 1994). “Measurement by flow cytometry of genomic AT/GC ratio and genome size”. 《Cytometry》 16 (1): 34–40. doi:10.1002/cyto.990160106. PMID 7518377. 
  9. Bernardi G (January 2000). “Isochores and the evolutionary genomics of vertebrates”. 《Gene》 241 (1): 3–17. doi:10.1016/S0378-1119(99)00485-0. PMID 10607893. 
  10. “Integration of the cytogenetic map with the draft human genome sequence”. 《Hum. Mol. Genet.》 12 (9): 1037–44. May 2003. doi:10.1093/hmg/ddg113. PMID 12700172. 
  11. “The distribution of genes on chromosomes: a cytological approach”. 《J. Mol. Evol.》 37 (2): 117–22. August 1993. Bibcode:1993JMolE..37..117S. doi:10.1007/BF02407346. PMID 8411200. 
  12. “CpG islands, genes and isochores in the genomes of vertebrates”. 《Gene》 106 (2): 185–95. October 1991. doi:10.1016/0378-1119(91)90198-K. PMID 1937049. 
  13. “Both selective and neutral processes drive GC content evolution in the human genome”. 《BMC Evol. Biol.》 8: 99. 2008. doi:10.1186/1471-2148-8-99. PMC 2292697. PMID 18371205. 
  14. “Analysis of genomic G + C content, codon usage, initiator codon context and translation termination sites in Tetrahymena thermophila”. 《J. Eukaryot. Microbiol.》 46 (3): 239–47. 1999. doi:10.1111/j.1550-7408.1999.tb05120.x. PMID 10377985. 
  15. Romiguier, Jonathan; Ranwez, Vincent; Douzery, Emmanuel J. P.; Galtier, Nicolas (2010년 8월 1일). “Contrasting GC-content dynamics across 33 mammalian genomes: Relationship with life-history traits and chromosome sizes”. 《Genome Research》 (영어) 20 (8): 1001–1009. doi:10.1101/gr.104372.109. ISSN 1088-9051. PMC 2909565. PMID 20530252. 
  16. Birdsell JA (2002년 7월 1일). “Integrating genomics, bioinformatics, and classical genetics to study the effects of recombination on genome evolution”. 《Mol. Biol. Evol.》 19 (7): 1181–97. doi:10.1093/oxfordjournals.molbev.a004176. PMID 12082137. 
  17. International Human Genome Sequencing Consortium (Feb 2001). “Initial sequencing and analysis of the human genome”. 《Nature》 409 (6822): 860–921. Bibcode:2001Natur.409..860L. doi:10.1038/35057062. PMID 11237011.  (page 876)
  18. Whole genome data of Saccharomyces cerevisiae on NCBI
  19. Whole genome data of Arabidopsis thaliana on NCBI
  20. Whole genome data of Plasmodium falciparum on NCBI
  21. “Compositional constraints in the extremely GC-poor genome of Plasmodium falciparum (PDF). 《Mem. Inst. Oswaldo Cruz》 92 (6): 835–41. 1997. doi:10.1590/S0074-02761997000600020. PMID 9566216. 
  22. Wayne LG; 외. (1987). “Report of the ad hoc committee on reconciliation of approaches to bacterial systematic”. 《International Journal of Systematic Bacteriology》 37 (4): 463–4. doi:10.1099/00207713-37-4-463. 
  23. Taxonomy browser on NCBI
  24. Whole genome data of Streptomyces coelicolor A3(2) on NCBI
  25. “Distinguishing Species Using GC Contents in Mixed DNA or RNA Sequences”. 《Evol Bioinform Online》 14 (January 1, 2018): 1176934318788866. 2018. doi:10.1177/1176934318788866. PMC 6052495. PMID 30038485. 
  26. “Extensive differences in gene expression between symbiotic and aposymbiotic cnidarians”. 《G3 (Bethesda)》 4 (2): 277–95. 2014. doi:10.1534/g3.113.009084. PMC 3931562. PMID 24368779.