본문 바로가기
바이오

지구 전체를 시퀀싱 하라! Earth BioGenome Project -1-

by MutaWo 2021. 3. 9.
반응형

1세대 sequencing 기술

 

현재 기술로 DNA 염기서열을 읽는 것(A,T,G,C의 순서를 알아내는 것으로 생각하면 됩니다.)은 매우 쉽습니다. 그리고 자동화가 되어 있으므로 사실상 DNA와 돈만 있으면 염기서열을 읽을 수 있습니다.

 

그림은 DNA 구조를 나타내는 모식도 입니다. 인간의 게놈은 30억개의 염기쌍을을 가지고 있으므로  30억개의  A,T,G,C  순서를 알아내면 됩니다.  참 쉽죠 ?

하지만 모든 일이 그렇듯이 처음 염기서열 분석을 성공한 사람은 많은 연구를 통해서 이루어 냈을 것입니다.

1970년에 Cornell 대학의 Ray Wu에 의해서 처음 염기서열 분석 방법이 만들어 졌습니다이방법은 DNA의 특정 부위에 상보적인 작은 DNA 조각인 프라이머로부터 DNA polymerase를 이용하여 특정 염기를 표지(labeling) 하는 것으로 염기서열 결정의 초석이 되었습니다. Cambridge 대학의 Frederick Sanger1977년에 이 방법을 토대로 "DNA sequencing with chain-terminating inhibitors" 라는 논문을 발표하며 지금까지도 사용되고 있는 그 유명한 Sanger sequencing을 고안했고 이 논문으로 1980년에 노벨 화학상을 수상했습니다.

 

Frederick Sanger 교수님 입니다. 이분은 sequencing으로  1958 년에 이미 노벨 화학상을 받으셨는데 DNA sequencing으로 또 노벨상을 받았습니다. 일생에 노벨상  2개라니 ..

Sanger sequencing 방법은 아래 유튜브에 보시면 확인하실 수 있습니다. 

https://www.youtube.com/watch?v=FvHRio1yyhQ&t=35s

 

이후 이 방법을 약간 보완하고(방사성 동위원소로 표지된 염기 대신에 형광표지된 염기를 사용합니다.) 자동화 기계를 만들어서 대량의 샘플에서 염기서열을 읽을 수 있게 되었습니다. 이때부터 2000년대 초반까지 약 20여년 동안 DNA sequencing은 전부 이 방법을 사용했습니다. 하지만 이 Sanger sequencing 방법에는 한번에 읽을 수 있는 염기서열의 개수가 약 1000개 정도로 속도가 빠르지 않다는 것이 었습니다. 인류는 휴먼 게놈 프로젝트등으로 대량 sequencing의 수요가 크게 증가했지만 Sanger sequencing으로는 비용과 속도를 감당하지 못하게 되었습니다. 

 

대량 염기서열 분석 방법 NGS(next generation sequencing)

2000년대에는 1세대 sequencing의 단점인 속도와 비용의 문제를 극복하고자 2세대 sequencing이 발명됩니다.

1세대인 Sanger sequencingDNA polymerase를 기반으로 하는 것이 특징이라면 2세대 sequencing은 DNA 혹은 RNA library를 제작해서 다양한 방법으로 염기서열을 결정한다는 것이 특징입니다. 

2세대 sequencing은 여러 회사의 여러 플렛폼이 있는데

  • 최초는 2007년에 상용화된 Roche의 454 pyrosequencing입니다. 
  • 다음은 역기 2007년에 상용화된 Illumina의 HiSeq 입니다. 
  • 2008년에는 Applled Biosystem Instruments의 SOLiD가 개발되었습니다. 

아래 각각을 소개하는 유뷰브 링크를 걸어 놓았습니다. 관심있으시면 들어가서 보세요.

 

Roche의 454 pyrosequencing

Illumina의 HiSeq

 

Applled Biosystem Instruments의 SOLiD

 

2세대 sequencing은 한 번에 많은 양의 DNA를 읽을 수 있지만 한 번에 읽는 길이는 Sanger sequencing 보다 짧습니다. 한 번에 긴 염기서열을 읽고자 수요도 많은 염기서열을 읽고자 하는 수요만큼이나 많은데 이것은 염색체에 반복되는 염기서열이나 여기저기에 비슷한 염기서열이 많이 존재하기 때문에 작은 조각을 이어 붙일 때 순서나 위치 등을 찾기가 매우 어렵기 때문입니다. 매우 긴 DNA 조각을 한 번에 차례로 읽게 된다면 순서에 맞게 이어 붙이는 노력이 필요 없기 때문에 이러한 기술의 출현은 어쩌면 필수적인 것이었습니다. 

 

DOI: 10.5772/61964; 각 플렛폼별로 한번에 읽을 수 있는 염기서열 길이, 한번에 읽을 수 있는 염기서열의 양, 걸기는 시간, 비용 등이 정리된 표입니다. 비용이 어마어마하게 싸졌습니다. 

3세대 sequencingPacBio로 대표되는 sequencing기술입니다. 이것은 아주 작은 양의, 작은 크기의 형광물질도 검출할 수 있는 이미지 장비의 발달로 가능하게 되었습니다. 위의 표에서 볼수 있듯이 한번에 엄청 긴 염기서열을 읽을 수 있고 한번에 읽는 양도 엄청 많고(10,000개 이상의 염기서열을 끊어지지 않고 한번에..) 비용도 매우 쌉니다. 

 

PacBio의 SMRT

 

자 이렇게 현재까지 개발된 DNA sequencing 기술에 대하여 알아보았습니다. 

이게 제목인 '지구 전체를 시퀀싱 하라!'와 무슨 관계냐고요?

 

궁금하면 다음편에!!

 

유전자가위에 대한 책에 대한 소개를 포스팅 한 것이 있습니다. 관심있으면 들어가 보세요^^ 

 

[책소개]유전자조작에 대한 이해는 이책으로 시작하세요!-DNA 혁명 크리스퍼 유전자가위-

오늘은 유전자가위(크리스퍼)에 대한 좋은 책이 있어서 소개를 해드릴려고 합니다. 생명공학이나 미래 SF에 관심이 있으신 분들, 생명공학을 연구하거나 꿈을 가지신 학생들, 그리고 관련 정책

plbiol22.tistory.com

 

 

반응형

댓글