Tổng quan về Tin sinh học

by ERA Capital
0 comment

Trong bài viết này, LOBI Việt Nam sẽ cung cấp một cái nhìn tổng quan về lĩnh vực tin sinh học, một lĩnh vực khoa học sử dụng các công nghệ của ngành toán học ứng dụng, tin học, thống kê, khoa học máy tính và toán sinh học (biomathematics) để giải quyết các vấn đề trong lĩnh vực sinh học.

Sinh học tích hợp công nghệ thông tin (bioinformatics) là một lĩnh vực nghiên cứu sử dụng các phương pháp từ ngành toán học ứng dụng, tin học, thống kê, khoa học máy tính và toán sinh học (biomathematics) để giải quyết các thách thức trong lĩnh vực sinh học.

Tổng quan về Tin sinh học

Các nghiên cứu trong lĩnh vực tin sinh học, cũng được gọi là sinh học tính toán hoặc sinh học hệ thống, thường có những điểm chung. Các lĩnh vực nghiên cứu chính của nó bao gồm:

  • So khớp trình tự (sequence alignment).
  • Ghép cặp cấu trúc protein (ghép cấu trúc protein)
  • Dự đoán cấu trúc protein (dự đoán cấu trúc protein)
  • Dự đoán hiện tượng biểu hiện gen (gene expression).
  • Giao tiếp protein-protein (protein-protein interaction).
  • Mô phỏng quá trình tiến hóa.
  • Thuật ngữ tin sinh học và sinh học tính toán thường được sử dụng thay thế cho nhau, tuy nhiên, thực tế là tin sinh học là một phần của sinh học tính toán. Sự quan tâm chính của cả hai lĩnh vực này là việc sử dụng các công cụ toán học để phân tích thông tin hữu ích từ các dữ liệu rối rắm được thu thập thông qua các kỹ thuật sinh học, với lượng dữ liệu và mức độ phức tạp lớn.

    Về phương diện này, lĩnh vực khai phá dữ liệu (data mining) có sự liên quan đến sinh học tính toán. Trong sinh học tính toán, bài toán đặc trưng bao gồm việc tổ chức những đoạn ngắn ADN chất lượng cao thành các trình tự ADN thông qua quá trình lắp ráp (assembly). Ngoài ra, cũng cần dự đoán quy luật điều hoà gen (gene regulation) dựa trên dữ liệu từ các mARN, microarray hoặc khối phổ (mass-spectrometry).

    Các lĩnh vực nghiên cứu của sinh học gồm:

  • Hệ gen học phân tích trình tự ADN.
  • Tìm kiếm gen.
  • Tìm kiếm các biến đổi.
  • Phân loại học phân tử.
  • Bảo tồn sự đa dạng sinh học.
  • Chức năng của gen hoặc biểu hiện gen là nhận diện chuỗi polypeptid và dự đoán cấu trúc protein trong các hệ thống sinh học kiểu mẫu.
  • Phân tích hình ảnh mức độ cao.
  • Ứng dụng máy tính.
  • Phân tích trình tự của axit nucleic và axit amin trong protein

    Vào năm 1977, Sanger và đồng nghiệp đã thành công trong việc xác định trình tự ADN của virut jx-174. Từ đó đến nay, rất nhiều loài sinh vật đã được phân tích và lưu trữ trình tự ADN của chúng trong các ngân hàng dữ liệu gene. Phân tích trình tự này giúp tìm ra cấu trúc gen, những gen mã hoá protein cũng như quy luật tương đồng của các trình tự protein.

    So sánh các gen cùng một loài hoặc giữa các loài có thể cho thấy sự tương đồng về chức năng của các protein hoặc mối quan hệ phát sinh chủng loài giữa chúng trên cây phát sinh chủng loài. Với sự gia tăng đáng kể của dữ liệu, việc phân tích trình tự ADN bằng cách thủ công trở nên không thể thực hiện được. Do đó, ngày nay, các chương trình máy tính được sử dụng để tìm các trình tự tương đồng trong bản đồ gen của hàng loạt sinh vật, dù số lượng nucleotide trong trình tự có lên đến hàng tỷ. Chính từ những chương trình này cũng có thể tìm kiếm những trình tự ADN không hoàn toàn giống nhau do các đột biến nucleotide.

    Các giải thuật bắt cặp trình tự (sequence aligenment) cũng được áp dụng trong quá trình xác định ADN (DNA sequencing), kỹ thuật xác định trình tự nhỏ (shotgun sequencing). Vì không thể xác định trình tự trên toàn bộ một phân tử ADN lớn, việc xác định trình tự nhỏ có kích thước khoảng 600-800 nucleotide là hợp lý. Công ty Celera Genomics đã sử dụng kỹ thuật này để xác định gen của vi khuẩn Heamophilus influenza. Các đoạn trình tự nhỏ này được sắp xếp và nối lại bằng cách bắt cặp trình tự của các đầu gối lên nhau (overlap), tạo ra một trình tự genome hoàn chỉnh. Mặc dù kỹ thuật xác định chuỗi trình tự nhỏ đã tạo ra dữ liệu nhanh chóng, việc sắp xếp các chuỗi trình tự ADN nhỏ là phức tạp. Do đó, trong việc phân tích bản đồ gen người, các nhà sinh học phải làm việc hàng tháng với các siêu máy tính (như máy DEC Alpha ra đời năm 2000) để xếp đúng trình tự những đoạn ADN ngắn lại với nhau.

    Hiện nay, ưu tiên trong kỹ thuật xác định trình tự nhỏ đã được đặt để giải mã genome và giải thuật lắp ráp genome (genome assembly algorithms) đang là một trong những lĩnh vực đang nổi trong lĩnh vực sinh học. Các gen và trình tự điều khiển bên trong gen cũng được tìm kiếm tự động trong lĩnh vực sinh học. Không phải tất cả các nucleotides trong genome đều là gen, phần lớn ADN trong genome của sinh vật cao cấp là các đoạn ADN không phục vụ cho một nhiệm vụ cụ thể, được gọi là đoạn intron. Sinh học còn giúp kết nối giữa genomics và proteomics bằng cách sử dụng trình tự ADN để nhận dạng protein.

    Bản đồ gen và đánh dấu gen

    Từ năm 1957, Wallman và Jacob đã áp dụng kỹ thuật giao nạp ngẫu nhiên để xây dựng bản đồ gen giao nạp của vi khuẩn Escherichia coli. Hiện nay, với sự tiến bộ của khoa học công nghệ, đã có nhiều phương pháp khác nhau được sử dụng trong việc nghiên cứu bộ gen và xây dựng bản đồ di truyền của các loài sinh vật. Các phương pháp này bao gồm bản đồ lai phóng xạ, bản đồ lai tại chỗ huỳnh quang và bản đồ tạo dòng định vị.

    Bản đồ trình tự gen (sequence map) là một loại bản đồ được sử dụng rộng rãi hiện nay với độ chính xác cao. Nó giúp xác định vị trí chính xác của từng nucleotid trong bộ gen và có vai trò quan trọng trong việc xác định nguồn gốc phân loại và quá trình tiến hoá của các quần thể hoặc các loài sinh vật. Ngoài ra, bản đồ trình tự gen cũng giúp con người xác định các gen liên quan đến các tính trạng quý hiếm ở vật nuôi và cây trồng, cũng như những gen đột biến hoặc gen bị sai lệch do rối loạn di truyền ở con người. Việc giải trình tự bộ gen người vào năm 2003 và bộ gen cây lúa vào năm 2005 đã đánh dấu một bước tiến vĩ đại trong lĩnh vực công nghệ sinh học phân tử. Nghiên cứu bộ gen người cung cấp cơ sở cho các nhà khoa học để tìm hiểu về quá trình tiến hoá của loài người cũng như xác định nguyên nhân của một số bệnh di truyền và bệnh truyền nhiễm. Từ đó, chúng ta có thể phát triển các loại thuốc mới và các phương pháp điều trị hiệu quả. Các bản đồ gen được xây dựng và sử dụng tùy theo mục đích nghiên cứu.

  • Bản đồ liên kết di truyền (genetic linkage),.
  • Bản đồ di truyền tế bào (bản đồ cytogenetic),.
  • Bản đồ lai phóng xạ (bản đồ hỗn hợp phóng xạ)
  • Bản đồ hạn chế di truyền (restriction map),.
  • Bản đồ trình tự gen (sequence map)…
  • Từ đó, diễn ra việc đánh dấu các gen và các đặc tính sinh học khác trong một chuỗi ADN. Hệ thống phần mềm genome annotation đầu tiên được thiết kế vào năm 1995 bởi Owen White, nhóm này phân tích giải mã bản đồ gen của vi khuẩn Hemophilus influenza. Phần mềm này đã xác định các gen giải mã protein, ARN vận chuyển và các chức năng khác. Các hệ thống genome annotation hiện nay hoạt động tương tự nhưng có các chương trình cải tiến thường xuyên. Ví dụ, hệ thống Ensembl là một pipeline genome annotation cho bản đồ gen người, được phát triển bởi Ewan Birney tại Viện Sanger gần Cambridge, Anh.

    Dò tìm đột biến

    Hiện nay, có nhiều nghiên cứu về việc xác định trình tự ADN và nhân bản gen (polymerase chain reaction-PCR) nhằm phát hiện các đột biến, đặc biệt là đột biến điểm (point mutation) trên các gen khác nhau trong ung thư. Kỹ thuật PCR là một trong những phương pháp được sử dụng để nhanh chóng phát hiện các gen đặc hiệu, gen kháng nguyên của nhiều loại virus gây ung thư. Trong chẩn đoán sớm ung thư, kỹ thuật gen đã được áp dụng rộng rãi tại các bệnh viện ở Mỹ, Anh, Đức, Thái Lan, Nhật Bản, Đài Loan và nhiều quốc gia khác.

    Các bệnh ung thư vòm họng, ung thư gan, ung thư dạ dày do virus đã được chẩn đoán nhanh, chẩn đoán sớm bằng kỹ thuật PCR hoặc kỹ thuật lai phân tử đánh dấu huỳnh quang. Theo Saito và cộng sự (1989) ung thư vòm họng phần lớn do virus Eptein-Barr (EBV) gây nên có thể chẩn đoán chính xác trên 90%. Đây là virus thuộc họ Herpes, có ADN kép (dsDNA) bộ gen có khoảng 184kb. Ở đây, tập dữ liệu sơ khởi được tạo ra đòi hỏi các hệ thống tự động đọc từ đó so sánh các trình tự đã biết trên genome người, bao gồm cả những điểm đa hình trên tế bào dòng tính (germline) đã biết, hoặc sử dụng hệ thống để phát hiện điểm đa hình đơn nucleotide (single nucleotide microarray) hoặc khảo sát tính dị biệt so sánh genome cho phép nghiên cứu hàng trăm ngàn vị trí trên bản đồ gen đang dược sử dụng để xác định những đột biến nhiễm sắc thể liên quan tới ung thư. Và, mô hình chuỗi Markov ẩn (Hidden Markov Model), phương pháp phân tích điểm thay đổi đang được phát triển để có thể suy ra số lượng thực cuả những thay đổi từ các dữ liệu hỗn độn (noisy data).

    Các nhà nghiên cứu đang phát triển các phương pháp tiếp cận thông tin để phát hiện thương tổn ADN trên nhiều loại ung thư và đưa ra giải pháp xử lý. Gần đây, trên tờ Nature (13/9/2001), các nhà nghiên cứu đại học California (Beckley) đã phát hiện 2 họ protein H60 và Rael có khả năng kích thích tế bào diệt u NK (natural killer) thông qua thụ thể NKG 2D1. Nhờ đó, tế bào NK có khả năng tiêu diệt nhiều dòng ung thư và sản xuất g-interferon, một chất hoạt hoá hệ miễn dịch. Các nhà nghiên cứu đã xác định gen mã hóa protein này và thực nghiệm trên chuột đã thành công trong việc loại bỏ nhiều dòng tế bào ung thư khác nhau. Hiện tại, gen này đang được nghiên cứu để sử dụng trong sản xuất vaccin chống một số loại ung thư.

    GS Allison tại Đại học California và Viện Y khoa Howard Hughes (Mỹ, 2001) đã phát hiện gen SPAS-1, có khả năng kích thích tế bào T đặc hiệu của adenocarcinom. Nghiên cứu này đã tạo ra tiền đề để sử dụng gen này trong sản xuất vacxin phòng ung thư tuyến tiền liệt. Các công ty công nghệ sinh học hàng đầu thế giới như Millenium Pharmaceutical, tập đoàn Roche, Eli Lilly, Bayer AG đã tìm kiếm các đột biến và phát hiện hàng trăm gen liên quan đến bệnh lý. Nhờ đó, họ đã được cấp bằng độc quyền sử dụng các gen này để phát triển các loại dược phẩm phân tử và sinh học nhằm phòng ngừa bệnh tật.

    Phân loại học phân tử.

    Phân loại học phân tử. là một lĩnh vực trong lĩnh vực hóa học nghiên cứu về cấu trúc, tính chất và tương tác giữa các phân tử, giúp chúng ta hiểu rõ hơn về sự tổ chức và hoạt động của các hợp chất hóa học trong tự nhiên và trong phòng thí nghiệm.Sự tiến hoá của các loài sinh vật trong tự nhiên là kết quả của quá trình biến đổi cấu trúc di truyền trong một thời gian lịch sử lâu dài ở những điều kiện nhất định. Nghiên cứu sự thay đổi cấu trúc ADN trình tự sắp xếp các nucleotid trong bộ gen hoặc sự thay đổi trình tự các axit amin trong protein của các quần thể, các loài cho thấy sự tiến hoá của chúng. Phân tích dữ liệu gen, bộ gen và xây dựng cây phân loại không chỉ cho thấy chiều hướng tiến hoá của các loài trong sinh giới mà còn chỉ rõ mức độ quan hệ trong loài và sự tiến hoá trong nội bộ loài. Bởi thế, việc xây dựng cây phân loại phân tử có vị trí hết sức quan trọng. Cây phân loại (phylogeny, dendregram) được nghiên cứu có hệ thống và khoa học từ những năm đầu thế kỷ 20. Năm 1909, từ các số liệu phân tích tần số các allen trong locus hemoglobin, Reichert và Brown đã xây dựng cây phân loại đầu tiên của một số loài cá. Hiện nay sự phát triển trong lĩnh vực xác định trình tự gen, trình tự axit amin và sự phổ biến các máy tính tốc độ cao cho phép các nhà nghiên cứu theo dõi sự tiến hoá của các loài dựa trên sự thay đổi trong trình tự ADN. Và tiến hoá học máy tính (computational evolutionary- CE) ra đời trước kỷ nguyên gen học, nghiên cứu, xây dựng các mô hình tính toán quần thể và sự biến thiên của chúng theo thời gian. Tiếp cận vấn đề theo chiều hướng ngược lại với CE, thay vì sử dụng các chương trình máy tính để điều tra quá trình tiến hoá, lĩnh vực giải thuật di truyền (genetic algorithm) tìm cách tối ưu hoá những chương trình này thông qua các nguyên lý tiến hoá (evolutionary principles). Mặt khác cây phân loại còn góp phần giúp các nhà khoa học thực hiện các phép lai có hiệu quả kinh tế cao, chẩn đoán ưu thế lai sớm hoặc tìm kiếm nguồn gốc phát sinh của các loài sinh vật.

    Bảo tồn sự đa dạng sinh học.

    Công nghệ sinh học thường được áp dụng trong lĩnh vực bảo tồn đa dạng sinh học (biodiversity). Thông tin quan trọng nhất được thu thập là tên, các đặc điểm hình thái, sinh lý, sinh hoá, di truyền, sự phân bố, tập tính… Được truy xuất bởi các chương trình phần mềm để tìm kiếm, hiển thị, phân tích tự động. Chuỗi ADN của các loài có nguy cơ tuyệt chủng có thể được bảo quản. Xác định trình tự ADN ở các loài động vật, thực vật, vi sinh vật… Là căn cứ để từ đó xác định hệ số di truyền của các loài.

    Dựa trên lý thuyết ma trận, ta có thể tính toán và xây dựng cây phân loại để tìm ra quan hệ giữa các loài và thế hệ trong loài. Công nghệ phần mềm trong tin sinh học đã phát triển, cho phép phân loại các loài sinh vật và xác định cây phân loại. Điều này giúp chúng ta có thể biết được quan hệ họ hàng và các “hậu duệ” của chúng. Trong quá trình phát triển, con người đã áp dụng nhiều biện pháp kỹ thuật vào cây trồng và vật nuôi để tăng năng suất và chống lại nghèo đói. Tuy nhiên, điều này đã làm thay đổi tính di truyền của chúng, đặc biệt là mất đi những đặc tính quý giá của tổ tiên hoang dại như phẩm chất và tính chống chịu với môi trường khắc nghiệt và các loại sâu bệnh. Hiện tượng này dẫn đến sự xói mòn di truyền và mất đi tính đa dạng di truyền của các cây trồng trên diện tích lớn (Albert Sasson, 1993).

    Ví dụ, ở Hy Lạp vào năm 1983, họ đã loại bỏ 95% các loại lúa mì địa phương. Tương tự, ở Tây Ban Nha từ năm 1970 đến năm 1973, họ đã mất đi 70% giống dưa địa phương. Ở Pháp, dù có 2000 loại táo, nhưng vào năm 1970 chỉ còn vài chục loại. Tại Mỹ, mặc dù là nguồn xuất khẩu ngô lớn nhất thế giới, vào năm 1970 hơn một nửa diện tích ngô bị bệnh tiêm lửa (Helminthos porium maydis) nòi Texas tàn phá, gây thiệt hại hàng tỷ đô la. Trước đó, ở Ailen, nạn đói đã giết chết 500.000 người và 2 triệu người đã phải di cư sang Mỹ do trồng giống khoai tây mẫn cảm với mốc sương (Phytophtora infectans). Giống này ban đầu có nguồn gốc từ giống khoai tây dại ở Mehico (Solanum demissum) và có khả năng chống chịu bệnh đó rất cao. Vì vậy, bảo vệ đa dạng sinh vật là bảo vệ cho chính chúng ta và đó là trách nhiệm của tất cả mọi người, không chỉ riêng các chuyên gia trong lĩnh vực nông-lâm-ngư nghiệp.

    Bảo vệ đa dạng sinh học không chỉ giữ gìn sự đa dạng di truyền của các vật nuôi cây trồng mà còn quan tâm đến sự đa dạng loài và cá thể của sinh vật hoang dã. Trong lĩnh vực này, tin sinh học sẽ đóng vai trò quan trọng trong việc tìm hiểu mối quan hệ họ hàng giữa chúng, cũng như tìm ra những gen quan trọng từ tổ tiên để cải thiện sức khỏe của các vật nuôi và cây trồng, nhằm ngăn chặn sự suy thoái di truyền mà chúng đang đối diện.

    Phân tích biểu hiện gen

    Phân tích biểu hiện gen giúp xác định cách mà gen được biểu hiện trong một tế bào hoặc một hệ thống cụ thể, thông qua quá trình chuyển đổi thông tin gen thành sản phẩm protein hoặc RNA.Những nghiên cứu của sinh học phân tử (molecular biology) có thể đánh giá mức độ biểu hiện gen (gene expression) thông qua việc xác định ARN thông tin (mARN) được tạo ra từ gen đó thông qua các kỹ thuật như microarray, EST (expressed sequence tag), SAGE (serial analisis of gene expression), MPSS (massively parallel signature sequencing) hay khối phổ (mass-spectrometry). Tất cả những kỹ thuật trên tạo ra những dữ liệu chứa thông tin nhiễu (noise-prone) làm việc tính toán, phân tích trở nên phức tạp. Yêu cầu thực tế đó đã cho ra đời một lĩnh vực mới trong sinh học tính toán là phát triển các công cụ thống kê để lọc tín hiệu xác đáng khỏi thông tin nhiễu trong những nghiên cứu biểu hiện gen đa lượng. Các nghiên cứu này dùng để xác định các gen liên quan đến một bệnh lý nhất định. Người ta có thể so sánh dữ liệu microarray từ những tế bào bị ung thư với tế bào bình thường để xác định những protein nào được tăng cường hay giảm thiểu do ung thư. Dữ liệu biểu hiện gen cũng được dùng để nghiên cứu điều hoà gen.

    Có thể so sánh dữ liệu microarray của sinh vật ở các trạng thái sinh lý khác nhau để tìm hiểu vai trò của từng gen trong mỗi trạng thái. Sử dụng giải thuật phân nhóm, ta có thể xác định các nhóm gen cùng biểu hiện, hay regulon, và áp dụng phân nhóm để so sánh các giai đoạn khác nhau của chu kỳ tế bào hoặc phản ứng của cơ thể trong điều kiện stress. Các phân tích tiếp theo có thể tập trung vào việc phân tích promotor của các nhóm gen để xác định nhân tố điều hoà chung hoặc sử dụng các công cụ máy tính để dự đoán promotor liên quan đến cơ chế điều hoà từng nhóm gen.

    Việc xác định trình tự axit amin trong chuỗi polypeptide là một phương pháp quan trọng để phân tích cấu trúc gen tương ứng. Hiện nay, protein microarray và công nghệ khối phổ cao năng (high throughput mass spectrometry) có thể cung cấp thông tin tổng thể về các protein có mặt trong mẫu sinh học. Việc phân tích dữ liệu từ các hệ thống này đóng vai trò quan trọng trong các ứng dụng sinh học. Đối với protein microarray, nhà nghiên cứu cần kiểm tra dữ liệu mRNA gắn trên chip, trong khi các vấn đề sinh học liên quan đến so khớp dữ liệu khối phổ với cơ sở dữ liệu về trình tự axit amin trong polypeptide hay protein. Ví dụ, vi rút lở mồm long móng (Foot Mouth Disease Virus – FMDV) có thể nhận diện trình tự axit amin ở “điểm quyết định kháng nguyên” trên protein vỏ VP1, từ đó đã phát triển thành công nghệ sinh học hiện đại để sản xuất vaccine phân tử.

    Dự đoán cấu trúc protein

    Protein có cấu trúc ảnh hưởng chặt chẽ đến chức năng của chúng. Ví dụ như hemoglobin, Catalaza, Glutamatdehydrogenaza, ARN pilymeraza có cấu trúc bậc IV, và Ribonucleaza có cấu trúc bậc III. Điểm quyết định kháng nguyên trên protein VP1 ở virus lở mồm long móng có cấu trúc bậc I. Thay đổi cấu trúc sẽ dẫn đến thay đổi hoặc mất hoạt tính của những protein này. Dự đoán cấu trúc là một ứng dụng quan trọng trong tin sinh học. Cấu trúc bậc I là trình tự sắp xếp các axit amin trong protein hay polipeptide. Từ cấu trúc đó, phân tử protein cuộn xoắn lại tạo nên cấu trúc bậc II, và từ cấu trúc bậc II, protein cuộn xoắn để tạo ra cấu trúc bậc III. Những bán đơn vị này kết hợp lại với nhau tạo nên cấu trúc bậc IV (hình dưới).

    Xác định cấu trúc là một nhiệm vụ đầy khó khăn. Trước đây, khi thiết bị còn hạn chế, việc xác định cấu trúc bậc I của insulin mất nhiều năm để tổng hợp chất này để điều trị cho bệnh nhân tiểu đường. Nhưng hiện nay, nhờ vào các phương pháp dự đoán cấu trúc bằng máy tính đang phát triển, các nhà khoa học đã thoát khỏi những khó khăn đó. Trong lĩnh vực sinh học, sự tương đồng cấu trúc của gen cũng được quan tâm khi dự đoán. Ví dụ, nếu có thông tin về trình tự và chức năng của gen X và nhận thấy rằng trình tự này tương đồng với gen Y, ta có thể suy ra chức năng của gen Y. Kỹ thuật mô phỏng tính tương đồng (homology modelling) được sử dụng để dự đoán cấu trúc protein dựa trên cấu trúc của một protein khác có sự tương đồng với nó. Hiện nay, đây là một phương pháp dự đoán cấu trúc đáng tin cậy.

    Phân tích hình ảnh mức độ cao.

    Để nâng cao tốc độ và tự động hóa quá trình xử lý, định lượng và phân tích số lượng lớn hình ảnh sinh học chứa thông tin cao, chúng ta cũng sử dụng các kỹ thuật tính toán. Các hệ thống xử lý hình ảnh hiện đại đã được cải tiến để tăng khả năng quan sát, giúp tính toán một tập hợp lớn và phức tạp một cách chính xác và khách quan hơn.

    Có thể sử dụng một hệ thống phân tích hoàn thiện để quan sát và ứng dụng vào các vấn đề sinh học nghiên cứu. Ví dụ, hệ thống này có thể được áp dụng để định lượng tốc độ cao và xác định vị trí các tế bào trong nghiên cứu bệnh lý học mô-tế bào. Ngoài ra, nó cũng có thể được sử dụng để phân tích các hình ảnh về quá trình phát triển của phôi để theo dõi và dự đoán số phận của từng nhóm tế bào trong quá trình phát triển hình thái. Đối với các nghiên cứu về thời gian tổn thương động mạch, hệ thống này cũng có thể được sử dụng để định lượng mức độ lưu giữ trong các hình ảnh thời gian thực từ quá trình phát triển và hồi phục. Ngoài ra, nó còn có thể được sử dụng để đo đạc hoạt động trao đổi chất thông qua việc sử dụng tia hồng ngoại. Điều này thể hiện sự tiếp tục tìm kiếm giải pháp để đưa nhiều ứng dụng xử lý ảnh vào cùng một lĩnh vực của sinh học.

    Mạng điều khiển sinh học

    Các mạng điều khiển sinh học (biological regulatory network) là những mạng tương tác giữa các gene và protein, có chức năng điều khiển một quá trình sinh học cụ thể trong tế bào. Ví dụ, chúng có thể điều khiển quá trình trao đổi chất (metabolism), chu kỳ tế bào (cell cycle), nhịp sinh học (circadian rhythm), và nhiều quá trình khác.

    Các bài toán đặc trưng thường xây dựng mạng tương tác điều khiển một quá trình sinh học cụ thể với sự tham gia của gene và protein quan trọng trong quá trình đó, sử dụng mô hình toán học (như nhị phân, hệ vi phân, hệ ngẫu nhiên, …) Để phân tích các đặc điểm, quy luật của quá trình sinh học. Từ đó, có thể dự đoán được các điểm bất thường như bệnh, tật, đặc biệt là ung thư.

    Tổng quan về Tin Sinh học ở Việt Nam

    Sinh học hiện đang là một lĩnh vực mới nhưng không còn xa lạ. Trong những năm gần đây, đã có một số nghiên cứu về phân tích gen, xác định trình tự ADN của một số loài quan trọng tại Việt Nam. Những nghiên cứu này nhằm đánh giá di truyền, phát hiện biến dị và xác định hệ số di truyền để tìm ra các họ hàng thân thích. Ngoài ra, cũng có nghiên cứu về mức độ biến đổi tính di truyền và đa dạng sinh học, cùng việc xây dựng ngân hàng gen (gen bank).

    Theo hướng đó, trong những năm gần đây, Khoa Sinh trường Đại học Vinh đã thực hiện các hoạt động nghiên cứu về tài nguyên sinh vật và đa dạng sinh học tại các tỉnh vùng Bắc Trung Bộ. Cụ thể, họ đã sử dụng phương pháp nhân bản gen (polimerase chain reaction-PCR) và giải trình tự ADN (DNA sequencing) để nghiên cứu một số loài vi khuẩn lam. Đây là những loài vi khuẩn quan trọng trong việc cố định nitơ không khí và tổng hợp hữu cơ mạnh để làm giàu dinh dưỡng cho đất. Ngoài ra, họ cũng đã sử dụng phương pháp nhân bản gen và kỹ thuật phân tích tính đa hình của ADN được khuếch đại ngẫu nhiên (random amplified polimorphism DNA, RAPD) đối với các cây ăn quả quan trọng như cam Xã Đoài, bưởi Phúc Trạch để đánh giá mức độ biến đổi di truyền của chúng và liên quan đến chất lượng quả. Họ cũng đã sử dụng phương pháp phân tích trình tự axit amin trên một số giống rắn thường được sử dụng trong y học để hiểu về chức năng và vai trò sinh học của protein. Ngoài ra, họ đã phân tích trình tự ADN của một số loài cá mới được phát hiện tại Nghệ An.

    Hiện nay, kỹ thuật RAPD được coi là một công cụ quan trọng trong việc phân loại và xác định tính đa dạng sinh học cũng như quan hệ họ hàng của các loài động vật và thực vật khác nhau. Một ví dụ điển hình là nghiên cứu gần đây của Henry Nguyễn từ Đại học Texas-Mỹ, sử dụng 43 cặp mồi ngẫu nhiên để phát hiện sự khác biệt di truyền của 13 giống lúa có nguồn gốc khác nhau tại châu Á, châu Âu và trung Á. Áp dụng tin sinh học trong nghiên cứu không chỉ giúp khám phá tài nguyên sinh vật, tìm kiếm gen quý hiếm mà còn đóng góp tích cực vào việc nghiên cứu đa dạng sinh học ở mức độ phân tử và chống xói mòn di truyền, điều mà trước đây chưa được khả thi.

    You may also like

    Leave a Comment

    You cannot copy content of this page