Khóa luận Xây dựng cơ sở dữ liệu hai gene 16s và 23s ribosom rna ở vi khuẩn – ứng dụng cơ sở dữ liệu hai gene 16s và 23s ribosom rna ở vi khuẩn để phát hiện các tác nhân gây bệnh viêm màng não

Khóa luận được thực hiện tại bộ môn Công Nghệ Sinh Học - Trường Đại Học Nông Lâm TP. Hồ Chí Minh, từ tháng 1/2006 đến 8/2006. Với sự phát triển của kỹ thuật sinh học phân tử, một số lượng lớn các gene 16S và 23S rRNA đã được giải trình tự. Những trình tự gene này được lưu trữ trong CSDL sinh học lớn như NCBI, EMBL, DDBj Vì các CSDL này quá lớn và chứa rất nhiều thông tin khác nhau, không tập trung cho một đối tượng cụ thể nên khó có thể thực hiện việc truy xuất các thông tin phục vụ trực tiếp cho một nghiên cứu chuyên biệt. Do vậy, mục tiêu của đề tài là tiến hành xây dựng cơ sở dữ liệu hai gene 16S và 23S rRNA ở vi khuẩn và ứng dụng CSDL này để phát hiện các loài vi khuẩn gây bệnh viêm màng não mủ. Để đạt được mục tiêu trên, khóa luận cần đảm bảo thực hiện những nội dung như sau: Dùng Perl script để thu nhận các mẫu tin của hai gene từ trang CSDL GenBank (CSDL nucleotide của NCBI). Tiếp tục sử dụng Perl script tách các mẫu tin thu nhận được thành từng phần riêng biệt như accession number (mã số truy cập), gi, definition, sequence (trình tự của gene) Thiết kế CSDL dựa vào mô hình dữ liệu quan hệ. Dùng Perl script để chuyển tự động các thông tin tách được ở bước trên vào CSDL. Sử dụng giao thức CGI kết hợp với ngôn ngữ lập trình Perl để thiết kế trang web CSDL về hai gene 16S và 23S rRNA ở các loài vi khuẩn. Sử dụng trình tự của hai gene 16S và 23S rRNA trong CSDL để thiết kế mồi cho phản ứng PCR phát hiện và phân biệt các tác nhân gây bệnh viêm màng não mủ. Đề tài đã đạt được những kết quả như sau: Đã thu thập được 2825 mẫu tin về gene 16S rRNA và 305 mẫu tin về gene 23S rRNA từ cơ sở dữ liệu GenBank (NCBI). Tạo được CSDL của hai gene 16S và 23S rRNA tích hợp với web. Trang web CSDL của hai gene và gồm có 5 trang chính: HOME, SEARCH, TOOL, LINK, ABOUT. Từ các trang web này, người sử dụng có thể truy xuất thông tin, tìm kiếm trình tự, so sánh một trình tự quan tâm với các trình tự trong CSDL (alignment, BLAST) Ngoài ra, những trang web chính này còn kết nối đến những trang phụ khác để cung cấp các tiện ích cho người dùng. Thiết kế mồi cho phản ứng PCR phát hiện các tác nhân gây bệnh viêm màng não mủ bằng chương trình thiết kế mồi Primrose. MỤC LỤC Nội dung Trang LỜI CẢM ƠN . iii TÓM TẮT KHÓA LUẬN iv MỤC LỤC . vi DANH SÁCH CÁC BẢNG VÀ SƠ ĐỒ x DANH SÁCH CÁC HÌNH . xi DANH SÁCH CÁC CHỮ VIẾT TẮT xiii PHẦN 1: MỞ ĐẦU .1 1.1. ĐẶT VẤN ĐỀ .1 1.2. MỤC ĐÍCH .2 1.3. YÊU CẦU 2 PHẦN 2: TỔNG QUAN TÀI LIỆU 3 2.1. SƠ LưỢC VỀ CƠ SỞ DỮ LIỆU 3 2.1.1. Định nghĩa 3 2.1.2. Hệ quản trị CSDL (Database Management System – DBMS) .3 2.1.3. Các mô hình dữ liệu .3 2.2. NGÔN NGỮ LẬP TRÌNH PERL, MẠNG INTERNET VÀ WEB .3 2.2.1. Perl .3 2.2.1.1. Tóm tắt lịch sử phát triển .3 2.2.1.2. Ứng dụng 4 2.2.1.3. Một số module của Perl thường được sử dụng 4 2.2.2. Giới thiệu về mạng Internet .5 2.2.3. Tích hợp CSDL với web dùng CGI 5 2.3. CƠ SỞ DỮ LIỆU SINH HỌC .6 2.3.1. NCBI (National Center for Bioinformatic Information) .6 2.3.1.1. Vài nét về NCBI 6 2.3.1.2. Một số cơ sở dữ liệu trong NCBI 7 2.3.1.3. Một số công cụ trong NCBI .7 2.3.2. EBI (European Bioinformatics Institute) .8 2.3.2.1. Vài nét về EBI .8 2.3.2.2. Một số cơ sở dữ liệu trong EBI .8 2.3.2.3. Một số công cụ hỗ trợ phân tích trình tự sinh học .9 2.3.3. SIB (Swiss Institute of Bioinformatics) .9 2.3.4. DDBJ (DNA Data Bank Japan) và PDBj (Protein Database Japan) . 10 2.4. BỆNH VIÊM MÀNG NÃO MỦ 12 2.4.1. Sơ lược về bệnh viêm màng não mủ . 12 2.4.1.1. Định nghĩa . 12 2.4.1.2. Bệnh theo lứa tuổi 12 2.4.1.3. Các con đường xâm nhiễm của vi khuẩn gây bệnh 13 2.4.2. Các triệu chứng biểu hiện lâm sàng của bệnh . 13 2.4.2.1. Những triệu chứng giai đoạn khởi phát 13 2.4.2.2. Biểu hiện lâm sàng của viêm màng não mủ . 13 2.4.3. Hậu quả của bệnh trên những đối tượng bị lây nhiễm 15 2.4.4. Tình hình bệnh viêm màng não mủ trên thế giới và Việt Nam . 15 2.5. VI KHUẨN GÂY BỆNH VIÊM MÀNG NÃO MỦ 16 2.6. CÁC PHưƠNG PHÁP XÉT NGHIỆM BỆNH VIÊM MÀNG NÃO MỦ 18 2.6.1. Phương pháp chẩn đoán lâm sàng . 18 2.6.2. Phương pháp xét nghiệm vi khuẩn học . 18 2.6.3. Phương pháp miễn dịch học 19 2.6.4. Phương pháp tế bào học . 19 2.6.5. Phương pháp sinh hoá . 19 2.6.5.1. Đường trong dịch não tủy 19 2.6.5.2. Đạm trong dịch não tủy 19 2.6.5.3. Phương pháp khảo sát nồng độ lactate .20 2.6.6. Phương pháp chụp cắt lớp – CT (computer tomography) .20 2.6.7. Phương pháp xét nghiệm dựa vào kỹ thuật PCR .20 2.7. KỸ THUẬT PCR VÀ ỨNG DỤNG TRONG VIỆC PHÁT HIỆN TÁC NHÂN GÂY BỆNH VIÊM MÀNG NÃO MỦ .20 2.7.1. Nguyên tắc của kỹ thuật PCR .20 2.7.2. Quy trình của phản ứng PCR 21 2.7.3. Seminested PCR/ Multiplex PCR .22 2.7.3.1. Seminested PCR .22 2.7.3.2. Multiplex PCR 22 2.7.4. Ứng dụng kỹ thuật PCR trong việc phát hiện vi khuẩn gây bệnh viêm màng não mủ 22 2.8. GENE 16S rRNA VÀ 23S rRNA 24 2.8.1. RNA ribosome (rRNA) – Cấu trúc ribosome 24 2.8.2. Gene 16S rRNA thước đo tiến hóa 25 2.8.3. Gene 23S rRNA .28 2.9. ĐIỀU TRỊ BỆNH VIÊM MÀNG NÃO MỦ BẰNG KHÁNG SINH .28 PHẦN 3: PHưƠNG PHÁP VÀ CÁC CHưƠNG TRÌNH SỬ DỤNG 29 3.1. CÁC CHưƠNG TRÌNH VÀ NGÔN NGỮ LẬP TRÌNH ĐưỢC SỬ DỤNG 29 3.1.1. Hệ điều hành 29 3.1.2. Các chương trình phân tích trình tự .29 3.1.2.1. Chương trình so sánh trình tự ClustalW 29 3.1.2.2. Chương trình tìm kiếm các trình tự tương đồng – BLAST .30 3.1.3. Hệ quản trị CSDL quan hệ MySQL 30 3.1.4. Apache web server .31 3.1.5. Ngôn ngữ lập trình Perl và các gói sử dụng .31 3.1.6. Chương trình thiết kế mồi Primrose 2.17 .32 3.2. PHưƠNG PHÁP 33 3.2.1. Thu nhận các mẫu tin chứa trình tự và thông tin liên quan của hai gene 16S và 23S rRNA .33 3.2.3. Thiết kế CSDL gene 16S và 23S rRNA 38 3.2.3.1. Phân tích dữ liệu 38 3.2.3.2. Thiết kế CSDL dạng bảng 39 3.2.3.3. Lưu trữ các thông tin vào CSDL 41 3.2.4. Tích hợp CSDL gene 16S rRNA và 23S rRNA với trang web 42 3.3. Thiết kế mồi cho phản ứng PCR phát hiện vi khuẩn viêm màng não .42 3.3.1 Thiết kế mồi dựa trên trình tự gene 16S rRNA 43 3.3.2. Thiết kế mồi dựa trên trình gene 23S rRNA 47 3.3.3. Nhiệt độ nóng chảy của mồi .51 PHẦN 4: KẾT QUẢ VÀ THẢO LUẬN .52 4.1. Kết quả thu nhận các mẫu tin chứa trình tự và thông tin liên quan của hai gene 16S và 23S rRNA .52 4.2. CSDL gene 16S và 23S rRNA 52 4.3. Trang web thể hiện thông tin CSDL gene 16S và 23S rRNA 52 4.3.1. Trang thông tin chung về CSDL gene 16S và 23S rRNA (Home Page) .54 4.3.2. Trang tìm kiếm (Search Page) 55 4.3.3. Trang công cụ (Tool Page) .58 4.3.4. Trang Meningitidis 60 4.4. Kết quả thiết kế mồi phát hiện các tác nhân viêm màng màng não mủ .60 PHẦN 5: KẾT LUẬN VÀ ĐỀ NGHỊ 63 PHẦN 6: TÀI LIỆU THAM KHẢO .64 PHỤ LỤC

pdf83 trang | Chia sẻ: lvcdongnoi | Lượt xem: 3834 | Lượt tải: 2download
Bạn đang xem trước 20 trang tài liệu Khóa luận Xây dựng cơ sở dữ liệu hai gene 16s và 23s ribosom rna ở vi khuẩn – ứng dụng cơ sở dữ liệu hai gene 16s và 23s ribosom rna ở vi khuẩn để phát hiện các tác nhân gây bệnh viêm màng não, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƢỜNG ĐẠI HỌC NÔNG LÂM TP. HỒ CHÍ MINH BỘ MÔN CÔNG NGHỆ SINH HỌC ***000*** LÊ VĂN TÁM XÂY DỰNG CƠ SỞ DỮ LIỆU HAI GENE 16S VÀ 23S RIBOSOM RNA Ở VI KHUẨN – ỨNG DỤNG CƠ SỞ DỮ LIỆU HAI GENE 16S VÀ 23S RIBOSOM RNA Ở VI KHUẨN ĐỂ PHÁT HIỆN CÁC TÁC NHÂN GÂY BỆNH VIÊM MÀNG NÃO MỦ (Bacterial Meningitis) Luận văn kỹ sƣ Chuyên ngành: Công nghệ sinh học Thành phố Hồ Chí Minh -2006- BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƢỜNG ĐẠI HỌC NÔNG LÂM TP. HỒ CHÍ MINH BỘ MÔN CÔNG NGHỆ SINH HỌC ***000*** XÂY DỰNG CƠ SỞ DỮ LIỆU HAI GENE 16S VÀ 23S RIBOSOM RNA Ở VI KHUẨN – ỨNG DỤNG CƠ SỞ DỮ LIỆU HAI GENE 16S VÀ 23S RIBOSOM RNA Ở VI KHUẨN ĐỂ PHÁT HIỆN CÁC TÁC NHÂN GÂY BỆNH VIÊM MÀNG NÃO MỦ (Bacterial Meningitis) Luận văn Kỹ sƣ Chuyên ngành: Công nghệ sinh học Giáo viên hƣớng dẫn Sinh viên thực hiện TS. TRẦN THỊ DUNG LÊ VĂN TÁM LƢU PHÚC LỢI Thành phố Hồ Chí Minh -2006- MINISTRY OF EDUCATION AND TRAINING NONG LAM UNIVERSITY, HCMC DEPARTMENT OF BIOTECHNOLOGY ************ CONSTRUCT DATABASE OF 16S AND 23S RIBOSAMAL RNA GENE IN BACTERIA – APPLICATION THE DATABASE FOR DETECTION BACTERIAL MENINGITIS Graduation thesis Major: Biotechnology Professor Student Ph.D. TRAN THI DUNG LE VAN TAM LUU PHUC LOI Ho Chi Minh City -2006- iii LỜI CẢM ƠN Tôi xin bày tỏ lòng biết ơn sâu sắc đến: Ban Giám hiệu trƣờng Đại học Nông Lâm thành phố Hồ Chí Minh, Ban chủ nhiệm Bộ môn Công nghệ Sinh học, cùng tất cả quý thầy cô đã truyền đạt kiến thức cho tôi trong suốt quá trình học tại trƣờng. TS. Trần Thị Dung và Cử Nhân Lƣu Phúc Lợi đã tận tình hƣớng dẫn, giúp đỡ tôi trong thời gian làm khóa luận tốt nghiệp. Xin gởi lời cảm ơn đến tập thể lớp Công Nghệ Sinh Học K28 đã động viên, giúp đỡ và luôn ở bên cạnh tôi trong những lúc vui buồn. Cha mẹ kính yêu đã nuôi nấng, dạy dỗ và động viên để con có thể đạt đƣợc thành quả nhƣ ngày hôm nay. Thành phố Hồ Chí Minh, ngày…tháng…năm 2006 Sinh viên LÊ VĂN TÁM iv TÓM TẮT KHÓA LUẬN LÊ VĂN TÁM, Đại học Nông Lâm TP. Hồ Chí Minh. Tháng 8/2006. “XÂY DỰNG CƠ SỞ DỮ LIỆU HAI GENE 16S VÀ 23S RIBOSOM RNA Ở VI KHUẨN – ỨNG DỤNG CƠ SỞ DỮ LIỆU HAI GENE 16S VÀ 23S RIBOSOM RNA Ở VI KHUẨN ĐỂ PHÁT HIỆN CÁC TÁC NHÂN GÂY BỆNH VIÊM MÀNG NÃO MỦ (Bacterial Meningitidis)” Hội đồng hƣớng dẫn: – TS. Trần Thị Dung – Cử nhân Lƣu Phúc Lợi Khóa luận đƣợc thực hiện tại bộ môn Công Nghệ Sinh Học - Trƣờng Đại Học Nông Lâm TP. Hồ Chí Minh, từ tháng 1/2006 đến 8/2006. Với sự phát triển của kỹ thuật sinh học phân tử, một số lƣợng lớn các gene 16S và 23S rRNA đã đƣợc giải trình tự. Những trình tự gene này đƣợc lƣu trữ trong CSDL sinh học lớn nhƣ NCBI, EMBL, DDBj…Vì các CSDL này quá lớn và chứa rất nhiều thông tin khác nhau, không tập trung cho một đối tƣợng cụ thể nên khó có thể thực hiện việc truy xuất các thông tin phục vụ trực tiếp cho một nghiên cứu chuyên biệt. Do vậy, mục tiêu của đề tài là tiến hành xây dựng cơ sở dữ liệu hai gene 16S và 23S rRNA ở vi khuẩn và ứng dụng CSDL này để phát hiện các loài vi khuẩn gây bệnh viêm màng não mủ. Để đạt đƣợc mục tiêu trên, khóa luận cần đảm bảo thực hiện những nội dung nhƣ sau: Dùng Perl script để thu nhận các mẫu tin của hai gene từ trang CSDL GenBank (CSDL nucleotide của NCBI). Tiếp tục sử dụng Perl script tách các mẫu tin thu nhận đƣợc thành từng phần riêng biệt nhƣ accession number (mã số truy cập), gi, definition, sequence (trình tự của gene)… Thiết kế CSDL dựa vào mô hình dữ liệu quan hệ. Dùng Perl script để chuyển tự động các thông tin tách đƣợc ở bƣớc trên vào CSDL. Sử dụng giao thức CGI kết hợp với ngôn ngữ lập trình Perl để thiết kế trang web CSDL về hai gene 16S và 23S rRNA ở các loài vi khuẩn. v Sử dụng trình tự của hai gene 16S và 23S rRNA trong CSDL để thiết kế mồi cho phản ứng PCR phát hiện và phân biệt các tác nhân gây bệnh viêm màng não mủ. Đề tài đã đạt đƣợc những kết quả nhƣ sau: Đã thu thập đƣợc 2825 mẫu tin về gene 16S rRNA và 305 mẫu tin về gene 23S rRNA từ cơ sở dữ liệu GenBank (NCBI). Tạo đƣợc CSDL của hai gene 16S và 23S rRNA tích hợp với web. Trang web CSDL của hai gene và gồm có 5 trang chính: HOME, SEARCH, TOOL, LINK, ABOUT. Từ các trang web này, ngƣời sử dụng có thể truy xuất thông tin, tìm kiếm trình tự, so sánh một trình tự quan tâm với các trình tự trong CSDL (alignment, BLAST)… Ngoài ra, những trang web chính này còn kết nối đến những trang phụ khác để cung cấp các tiện ích cho ngƣời dùng. Thiết kế mồi cho phản ứng PCR phát hiện các tác nhân gây bệnh viêm màng não mủ bằng chƣơng trình thiết kế mồi Primrose. vi MỤC LỤC Nội dung Trang LỜI CẢM ƠN ............................................................................................................. iii TÓM TẮT KHÓA LUẬN .......................................................................................... iv MỤC LỤC ................................................................................................................... vi DANH SÁCH CÁC BẢNG VÀ SƠ ĐỒ ......................................................................x DANH SÁCH CÁC HÌNH ......................................................................................... xi DANH SÁCH CÁC CHỮ VIẾT TẮT .................................................................... xiii PHẦN 1: MỞ ĐẦU .......................................................................................................1 1.1. ĐẶT VẤN ĐỀ ......................................................................................................... 1 1.2. MỤC ĐÍCH ............................................................................................................. 2 1.3. YÊU CẦU ................................................................................................................ 2 PHẦN 2: TỔNG QUAN TÀI LIỆU ............................................................................3 2.1. SƠ LƢỢC VỀ CƠ SỞ DỮ LIỆU .......................................................................... 3 2.1.1. Định nghĩa .................................................................................................................. 3 2.1.2. Hệ quản trị CSDL (Database Management System – DBMS) ....................... 3 2.1.3. Các mô hình dữ liệu ................................................................................................. 3 2.2. NGÔN NGỮ LẬP TRÌNH PERL, MẠNG INTERNET VÀ WEB ................... 3 2.2.1. Perl ............................................................................................................................... 3 2.2.1.1. Tóm tắt lịch sử phát triển ................................................................................. 3 2.2.1.2. Ứng dụng .............................................................................................................. 4 2.2.1.3. Một số module của Perl thƣờng đƣợc sử dụng............................................ 4 2.2.2. Giới thiệu về mạng Internet ................................................................................... 5 2.2.3. Tích hợp CSDL với web dùng CGI ...................................................................... 5 2.3. CƠ SỞ DỮ LIỆU SINH HỌC ............................................................................... 6 2.3.1. NCBI (National Center for Bioinformatic Information) ................................. 6 2.3.1.1. Vài nét về NCBI .................................................................................................. 6 2.3.1.2. Một số cơ sở dữ liệu trong NCBI .................................................................... 7 2.3.1.3. Một số công cụ trong NCBI ............................................................................. 7 2.3.2. EBI (European Bioinformatics Institute) ........................................................... 8 vii 2.3.2.1. Vài nét về EBI ..................................................................................................... 8 2.3.2.2. Một số cơ sở dữ liệu trong EBI ....................................................................... 8 2.3.2.3. Một số công cụ hỗ trợ phân tích trình tự sinh học ..................................... 9 2.3.3. SIB (Swiss Institute of Bioinformatics) ............................................................... 9 2.3.4. DDBJ (DNA Data Bank Japan) và PDBj (Protein Database Japan) ......... 10 2.4. BỆNH VIÊM MÀNG NÃO MỦ .......................................................................... 12 2.4.1. Sơ lƣợc về bệnh viêm màng não mủ................................................................... 12 2.4.1.1. Định nghĩa ......................................................................................................... 12 2.4.1.2. Bệnh theo lứa tuổi ............................................................................................ 12 2.4.1.3. Các con đƣờng xâm nhiễm của vi khuẩn gây bệnh .................................. 13 2.4.2. Các triệu chứng biểu hiện lâm sàng của bệnh ................................................. 13 2.4.2.1. Những triệu chứng giai đoạn khởi phát ...................................................... 13 2.4.2.2. Biểu hiện lâm sàng của viêm màng não mủ ............................................... 13 2.4.3. Hậu quả của bệnh trên những đối tƣợng bị lây nhiễm .................................. 15 2.4.4. Tình hình bệnh viêm màng não mủ trên thế giới và Việt Nam ................... 15 2.5. VI KHUẨN GÂY BỆNH VIÊM MÀNG NÃO MỦ .......................................... 16 2.6. CÁC PHƢƠNG PHÁP XÉT NGHIỆM BỆNH VIÊM MÀNG NÃO MỦ ...... 18 2.6.1. Phƣơng pháp chẩn đoán lâm sàng ..................................................................... 18 2.6.2. Phƣơng pháp xét nghiệm vi khuẩn học ............................................................. 18 2.6.3. Phƣơng pháp miễn dịch học ................................................................................ 19 2.6.4. Phƣơng pháp tế bào học ....................................................................................... 19 2.6.5. Phƣơng pháp sinh hoá ........................................................................................... 19 2.6.5.1. Đƣờng trong dịch não tủy .............................................................................. 19 2.6.5.2. Đạm trong dịch não tủy .................................................................................. 19 2.6.5.3. Phƣơng pháp khảo sát nồng độ lactate ....................................................... 20 2.6.6. Phƣơng pháp chụp cắt lớp – CT (computer tomography) ........................... 20 2.6.7. Phƣơng pháp xét nghiệm dựa vào kỹ thuật PCR ........................................... 20 2.7. KỸ THUẬT PCR VÀ ỨNG DỤNG TRONG VIỆC PHÁT HIỆN TÁC NHÂN GÂY BỆNH VIÊM MÀNG NÃO MỦ ....................................................................... 20 2.7.1. Nguyên tắc của kỹ thuật PCR ............................................................................. 20 2.7.2. Quy trình của phản ứng PCR .............................................................................. 21 2.7.3. Seminested PCR/ Multiplex PCR ....................................................................... 22 viii 2.7.3.1. Seminested PCR ............................................................................................... 22 2.7.3.2. Multiplex PCR .................................................................................................. 22 2.7.4. Ứng dụng kỹ thuật PCR trong việc phát hiện vi khuẩn gây bệnh viêm màng não mủ. ..................................................................................................................... 22 2.8. GENE 16S rRNA VÀ 23S rRNA .......................................................................... 24 2.8.1. RNA ribosome (rRNA) – Cấu trúc ribosome .................................................. 24 2.8.2. Gene 16S rRNA thƣớc đo tiến hóa ...................................................................... 25 2.8.3. Gene 23S rRNA ....................................................................................................... 28 2.9. ĐIỀU TRỊ BỆNH VIÊM MÀNG NÃO MỦ BẰNG KHÁNG SINH ............... 28 PHẦN 3: PHƢƠNG PHÁP VÀ CÁC CHƢƠNG TRÌNH SỬ DỤNG ..................29 3.1. CÁC CHƢƠNG TRÌNH VÀ NGÔN NGỮ LẬP TRÌNH ĐƢỢC SỬ DỤNG 29 3.1.1. Hệ điều hành............................................................................................................ 29 3.1.2. Các chƣơng trình phân tích trình tự ................................................................. 29 3.1.2.1. Chƣơng trình so sánh trình tự ClustalW.................................................... 29 3.1.2.2. Chƣơng trình tìm kiếm các trình tự tƣơng đồng – BLAST ................... 30 3.1.3. Hệ quản trị CSDL quan hệ MySQL .................................................................. 30 3.1.4. Apache web server ................................................................................................. 31 3.1.5. Ngôn ngữ lập trình Perl và các gói sử dụng ..................................................... 31 3.1.6. Chƣơng trình thiết kế mồi Primrose 2.17 ......................................................... 32 3.2. PHƢƠNG PHÁP .................................................................................................. 33 3.2.1. Thu nhận các mẫu tin chứa trình tự và thông tin liên quan của hai gene 16S và 23S rRNA ............................................................................................................... 33 3.2.3. Thiết kế CSDL gene 16S và 23S rRNA .............................................................. 38 3.2.3.1. Phân tích dữ liệu .............................................................................................. 38 3.2.3.2. Thiết kế CSDL dạng bảng .............................................................................. 39 3.2.3.3. Lƣu trữ các thông tin vào CSDL .................................................................. 41 3.2.4. Tích hợp CSDL gene 16S rRNA và 23S rRNA với trang web ...................... 42 3.3. Thiết kế mồi cho phản ứng PCR phát hiện vi khuẩn viêm màng não ............. 42 3.3.1 Thiết kế mồi dựa trên trình tự gene 16S rRNA ................................................ 43 3.3.2. Thiết kế mồi dựa trên trình gene 23S rRNA .................................................... 47 3.3.3. Nhiệt độ nóng chảy của mồi ................................................................................. 51 PHẦN 4: KẾT QUẢ VÀ THẢO LUẬN ...................................................................52 ix 4.1. Kết quả thu nhận các mẫu tin chứa trình tự và thông tin liên quan của hai gene 16S và 23S rRNA ................................................................................................. 52 4.2. CSDL gene 16S và 23S rRNA .............................................................................. 52 4.3. Trang web thể hiện thông tin CSDL gene 16S và 23S rRNA ............................ 52 4.3.1. Trang thông tin chung về CSDL gene 16S và 23S rRNA (Home Page) ..... 54 4.3.2. Trang tìm kiếm (Search Page) ............................................................................ 55 4.3.3. Trang công cụ (Tool Page) ................................................................................... 58 4.3.4. Trang Meningitidis ................................................................................................ 60 4.4. Kết quả thiết kế mồi phát hiện các tác nhân viêm màng màng não mủ ......... 60 PHẦN 5: KẾT LUẬN VÀ ĐỀ NGHỊ ........................................................................63 PHẦN 6: TÀI LIỆU THAM KHẢO .........................................................................64 PHỤ LỤC x DANH SÁCH CÁC BẢNG VÀ SƠ ĐỒ Trang Bảng 2.1. Tóm tắt tác nhân gây bệnh theo lứa tuổi ...................................................... 12 Bảng 2.2. Dấu hiệu và triệu chứng của bệnh viêm màng não mủ ................................ 14 Bảng 2.3. Các nhóm kháng sinh đặc trị vi khuẩn viêm màng não mủ ......................... 28 Bảng 3.1. Các đối tƣợng phụ dựa trên đối tƣợng chính sinh vật .................................. 38 Bảng 3.2. Các đối tƣợng phụ dựa trên đối tƣợng chính trình tự .................................. 39 Sơ đồ tóm tắt quá trình thu nhận mẫu tin của hai gene 16S và 23S rRNA ................... 33 Sơ đồ các đối tƣợng chính trong CSDL hai gene 16S và 23S rRNA ............................ 38 Sơ đồ chi tiết các bảng quan hệ .................................................................................... 40 Sơ đồ cấu trúc các trang web thể hiện thông tin CSDL gene 16S và 23S rRNA .......... 53 xi DANH SÁCH CÁC HÌNH Trang Hình 2.1. Tƣơng tác giữa Perl script-DBI-DBD và RBDMS ........................................ 5 Hình 2.2. Tƣơng quan giữa NCBI, NLM (National Library of Medicine) và NIH ....... 6 Hình 2.3. Một số cơ sở dữ liệu trong EBI ..................................................................... 9 Hình 2.4. Ba cơ sở dữ liệu nucleotide (GenBank – EMBL – DDB) và công cụ tìm kiếm tƣơng ứng ............................................................................................................. 11 Hình 2.5. Sự hợp nhất của ba cơ sở dữ liệu MSD, PDBj, PDB ................................... 11 Hình 2.6. Quy trình phản ứng PCR .............................................................................. 21 Hình 2.7. Thành phần cấu tạo của ribosome ở prokaryote ........................................... 25 Hinh 2.8. Vị trí và kích thƣớc của 16S và 23S rRNA trong bộ gene vi khuẩn ............. 27 Hình 3.1. Tìm kiếm bằng từ khóa trong trang Home Page của NCBI ......................... 34 Hình 3.2. Trang kết quả tìm kiếm bằng từ khóa cho gene 16S rRNA .......................... 34 Hình 3.3. Kết quả tìm kiếm thể hiện ở dạng text ......................................................... 35 Hình 3.4. File text chứa mã số truy cập ........................................................................ 35 Hình 3.5. Tất cả mẫu tin của gene 16S rRNA ............................................................... 36 Hình 3.6. Một mẫu tin của gene 16S rRNA có mã số truy cập AB016268 .................. 37 Hình 3.7. Thiết kế CSDL ở mức vật lý ........................................................................ 41 Hình 3.8. Tiến trình lấy thông tin từ CSDL hai gene ở vi khuẩn ................................. 42 Hình 3.9. Tạo CSDL trình tự gene 16S rRNA ở các vi khuẩn viêm màng não mủ ...... 43 Hình 3.10. Chọn trình tự đích trong thiết kế mồi phát hiện Streptococcus pneumoniae dựa trên gene 16S rRNA. .............................................................................................. 43 Hình 3.11. Xác định các thông số cho mồi và số lƣợng mồi đƣợc tạo ra trên trình tự đích 16S rRNA .............................................................................................................. 44 Hinh 3.12. Danh sách các mồi thiết kế đƣợc trên 16S rRNA ....................................... 44 Hình 3.13. Vị trí bắt cặp của mồi xuôi trên trình tự đích 16S rRNA ............................ 45 Hình 3.14. Vị trí bắt cặp của mồi ngƣợc trên trình tự đích 16S rRNA ......................... 46 Hinh 3.15. Kiểm tra lại sự bắt cặp của mồi ngƣợc và mồi xuôi trên trình tự đích 16S rRNA ............................................................................................................................. 46 Hình 3.16. Kết quả kiểm tra sự bắt cặp mồi xuôi và mồi ngƣợc trên trình tự đích gene 16S rRNA ...................................................................................................................... 47 xii Hình 3.17. Danh sách các mồi thiết kế đƣợc cho trình tự gene 23S rRNA ở Streptococcus pneumoniae ........................................................................................... 48 Hình 3.18. Vị trí bắt cặp của mồi xuôi trên trình tự đích 23S rRNA ............................ 49 Hình 3.19. Vị trí bắt cặp của mồi ngƣợc trên trình tự đích 23S rRNA ......................... 49 Hình 3.20. Kiểm tra lại sự bắt cặp của mồi ngƣợc và mồi xuôi trên trình tự đích 23S rRNA ............................................................................................................................. 50 Hình 3.21. Kết quả kiểm tra sự bắt cặp mồi xuôi và mồi ngƣợc trên trình tự đích gene 23S rRNA ...................................................................................................................... 50 Hình 3.22. Tính nhiệt độ nóng chảy của mồi xuôi 16S ................................................ 51 Hình 4.1. Trang Home Page ......................................................................................... 54 Hình 4.2. Trang tìm kiếm theo mã số truy cập (accession number)............................. 55 Hình 4.3. Trang kết quả tìm kiếm bằng mã số truy cập ............................................... 56 Hình 4.4. Trang tìm kiếm theo tên loài (species name) ............................................... 57 Hình 4.5. Trang kết quả tìm kiếm theo tên loài (species name) ................................... 57 Hình 4.6. Trang công cụ sắp gióng cột (Alignment) .................................................... 58 Hình 4.7. Trang kết quả sắp gióng cột hai trình tự ....................................................... 59 Hình 4.8. Trang công cụ BLAST ................................................................................. 59 Hình 4.9. Trang Meningitidis ....................................................................................... 60 Hình 4.10. Sự bắt cặp của cặp mồi 16S rRNA trên trình tự đích và trình tự ngoài vùng đích ............................................................................................................................... 61 Hình 4.11. Sự bắt cặp của cặp mồi 23S rRNA trên trình tự đích và trình tự ngoài vùng đích ............................................................................................................................... 61 xiii DANH SÁCH CÁC CHỮ VIẾT TẮT CSDL Cơ Sở Dữ Liệu Perl Practical Extraction and Report Language CGI Common Gateway Interface DBI Database Interface DBD Database Driver WWW World Wide Web HTML Hypertext Markup Language HTTP Hypertext Transfer Protocol NCBI Center for Bioinformatic Information BLAST Basic Local Alignment Search Tool EBI European Bioinformatics Institute EMBL European Molecular Biology Laboratory SIB Swiss Institute of Bioiformatics DDBJ DNA Data Bank Japan PDBj Protein Database Japan PCR Polymerase Chain Reaction rRNA ribosomal RNA 1 PHẦN 1: MỞ ĐẦU 1.1. ĐẶT VẤN ĐỀ Sự phát triển của ngành công nghệ thông tin trong những thập kỷ qua đã góp phần cải thiện chất lƣợng cuộc sống con ngƣời. Máy tính đã có mặt trong hầu hết các ngành khoa học, hỗ trợ con ngƣời giải quyết những công việc khó khăn và nhiều thời gian. Công nghệ sinh học đƣợc xem là ngành khoa học mũi nhọn của thế kỷ XXI. Với sự ra đời của kỹ thuật giải trình tự, nhiều bộ gene của sinh vật đã đƣợc giải mã, tạo ra một lƣợng dữ liệu sinh học khổng lồ. Điều này đòi hỏi có sự lƣu trữ, quản lí và khai thác các dữ liệu một cách hiệu quả. Với khả năng xử lí và truy xuất lƣợng thông tin lớn và nhanh chóng, máy tính đã trở thành công cụ hữu ích trong nghiên cứu sinh học. Sự kết hợp giữa ngành sinh học và tin học đã cho ra đời một công cụ mới đó là Tin – Sinh học (Bioinformatics). Tin – Sinh học giúp giải quyết hàng loạt những nghiên cứu trong sinh học mà đòi hỏi thời gian dài hay khó có thể thực hiện bằng tay đƣợc. Cho đến nay, Tin – Sinh học đạt đƣợc nhiều thành tựu to lớn. Nhiều CSDL sinh học đã đƣợc thiết lập nhƣ NCBI, EMBL, DDBJ…Các CSDL này chứa lƣợng lớn thông tin phục vụ đắc lực cho các nhà nghiên cứu sinh học. Gene 16S và 23S rRNA là 2 gene có chức năng cần thiết cho sự sống của vi khuẩn, vừa có vùng bảo tồn và vừa có vùng biến động ở các cấp độ khác nhau, giúp cho việc định danh hay xác định mối quan hệ họ hàng giữa hai hay nhiều loài vi khuẩn. Các gene này đã đƣợc giải trình tự và lƣu trữ trong các CSDL sinh học trực tuyến. Tuy nhiên, việc tìm kiếm các thông tin trình tự của hai gene trong các CSDL lớn thƣờng tốn nhiều thời gian do thông tin không tập trung cho một đối tƣợng cụ thể. Hiện nay, rất nhiều bệnh nguy hiểm do vi khuẩn gây ra trong đó có bệnh viêm màng não mủ. Bệnh xảy ra thƣờng xuyên và để lại di chứng nặng nề nếu không điều trị kịp thời. Việc chẩn đoán bệnh bằng các phƣơng pháp truyền thống thƣờng hạn chế về mặt thời gian. Phƣơng pháp PCR hiện nay đƣợc sử dụng rộng rãi do tính đơn giản, nhanh và chính xác. Gene 16S và 23S rRNA là hai gene thích hợp cho việc thiết kế mồi đặc hiệu để phát hiện các vi khuẩn gây bệnh viêm màng não. Với các lý do trên cùng với sự đồng ý hƣớng dẫn của TS Trần Thị Dung và Cử nhân Lƣu Phúc Lợi, chúng tôi thực hiện đề tài “Xây dựng CSDL hai gene 16S và 23S rRNA ở vi khuẩn - Ứng dụng CSDL này để phát hiện các vi khuẩn gây bệnh viêm màng não mủ”. 2 1.2. MỤC ĐÍCH – Thu thập trình tự và thông tin liên quan về hai gene 16S và 23S rRNA ở vi khuẩn, tổ chức thành một CSDL riêng biệt. – Ứng dụng trình tự hai gene trong CSDL để thiết kế mồi cho phản ứng PCR phát hiện các vi khuẩn gây bệnh viêm màng não mủ. Từ đó chứng minh khả năng sử dụng của gene 23S rRNA có nhiều ƣu điểm hơn so với gene 16S rRNA. – Tìm hiểu khả năng ứng dụng trong phát hiện tác nhân gây bệnh của phần mềm Primrose 2.17 (trƣớc đó phần mềm này ra đời với mục đích phân loại phả hệ bằng gene 16S rRNA). 1.3. YÊU CẦU – CSDL phải chứa một lƣợng lớn trình tự của hai gene 16S và 23S rRNA ở các loài vi khuẩn khác nhau trong đó có vi khuẩn gây bệnh viêm màng não mủ. – CSDL phải đƣợc tích hợp với web, tạo giao diện thân thiện với ngƣời sử dụng. – Thông qua các trang web, ngƣời dùng có thể truy cập CSDL để tìm kiếm các thông tin về hai gene nhƣ tên của vi khuẩn, tên của trình tự, chiều dài trình tự, tác giả giải trình tự… – Tích hợp các công cụ phân tích trình tự vào trang web nhƣ BLAST, Alignment… – Thiết kế mồi đặc hiệu phân biệt đƣợc các vi khuẩn trong nhóm vi khuẩn viêm màng não mủ thông qua chƣơng trình thiết kế mồi Primrose 2.17. 3 PHẦN 2: TỔNG QUAN TÀI LIỆU 2.1. SƠ LƢỢC VỀ CƠ SỞ DỮ LIỆU 2.1.1. Định nghĩa Cơ sở dữ liệu (CSDL) là một tập hợp dữ liệu đƣợc tổ chức theo một cấu trúc chặt chẽ nhằm phục vụ cho nhiều mục tiêu khác nhau một cách có chọn lọc. Tập hợp dữ liệu sẽ đƣợc lƣu trữ trên các thiết bị lƣu trữ thông tin thứ cấp nhƣ băng từ, đĩa từ… để thỏa mãn nhu cầu khai thác thông tin đồng thời của nhiều ngƣời sử dụng hay nhiều chƣơng trình ứng dụng với nhiều mục đích khác nhau. 2.1.2. Hệ quản trị CSDL (Database Management System – DBMS) Là một hệ thống phần mềm cho phép các nhà phân tích và thiết kế CSDL cũng nhƣ ngƣời khai thác CSDL đƣợc thuận lợi trong quá trình thiết kế, thao tác, truy xuất và quản lý dữ liệu. Hiện nay, một số hệ quản trị CSDL mạnh đang đƣợc đƣa ra thị trƣờng nhƣ Visual FoxPro, SQL-Server, Oracle… 2.1.3. Các mô hình dữ liệu Mô hình dữ liệu là sự trừu tƣợng hóa thế giới thực, là sự biểu diễn dữ liệu ở mức quan niệm. Hiện nay, có năm loại mô hình dữ liệu chính. Đó là: Mô hình dữ liệu mạng Mô hình dữ liệu phân cấp Mô hình dữ liệu quan hệ Mô hình dữ liệu thực thể kết hợp Mô hình dữ liệu hƣớng đối tƣợng 2.2. NGÔN NGỮ LẬP TRÌNH PERL, MẠNG INTERNET VÀ WEB 2.2.1. Perl 2.2.1.1. Tóm tắt lịch sử phát triển Perl (Practical Extraction and Report Language) do Larry Wall tạo ra vào năm 1986 nhằm quản trị các mạng máy tính lớn. Ngôn ngữ này phát sinh từ ngôn ngữ lập trình C và bị ảnh hƣởng bởi ngôn ngữ khác nhƣ BASIC, Awk, Sed và UNIX shell. Năm 2000, phiên bản 5.6 xuất hiện. Phiên bản này đã chuyển sang định dạng tiêu chuẩn và có sự hỗ trợ cả Unicode và UTF-8. 4 Năm 2002, phiên bản Perl 5.8 ra đời cùng với nhiều cải tiến mới đƣợc bổ sung. 2.2.1.2. Ứng dụng Perl đƣợc dùng để xử lý tập tin, truy cập dữ liệu và đƣợc dùng cho giao diện cổng chung (Common Gateway Interface – CGI), tiến hành tạo script của Microsoft Windows, tạo giao diện ngƣời dùng đồ họa (Graphical User Interface – GUI). Ƣu điểm: là ngôn ngữ dễ nắm bắt, thích hợp cho xử lý chuỗi và văn bản thuần túy, đƣợc sự hỗ trợ của nhiều hệ điều hành. Vì vậy, Perl là ngôn ngữ lập trình thích hợp cho các nhà tin – sinh học vì nó có thể giúp cho việc thao tác trên các chuỗi trình tự sinh học, tạo CSDL sinh học dễ dàng hơn. Ngoài ra, Perl còn đƣợc hỗ trợ bởi các module (tập các hàm) giúp kết nối, truy xuất CSDL với trang web, tạo ra trang web động. Nhƣợc điểm: chỉ có thể dùng để viết các chƣơng trình, script nhỏ. 2.2.1.3. Một số module của Perl thƣờng đƣợc sử dụng Module CGI (Common Gateway Interface): Module này gồm các hàm giúp viết kịch bản Perl theo giao thức CGI. Các script này giúp lấy thông tin từ trình duyệt khách gởi đến máy chủ, đƣa vào chƣơng trình xử lý và trả thông tin kết quả đến máy khách. Module DBI (Database Interface): là tập các hàm, biến và những qui ƣớc cần thiết cho việc tƣơng tác với một CSDL nhất định thông qua Perl script, hoàn toàn độc lập với hệ quản trị CSDL (Tim Bunce). Những tƣơng tác có thể nhập, nâng cấp, xử lý, rút trích…dữ liệu vào hay ra khỏi CSDL. Module DBD (Database Driver): là một module phụ thuộc loại hệ quản trị CSDL và liên kết với module DBI để truy cập vào một loại hệ quản trị CSDL nhất định. Nhƣ vậy tƣơng ứng với một hệ quản trị CSDL có một loại DBD. Ví dụ nhƣ hệ quản trị MySQL có Database Driver là DBD::MySQL. 5 Hình 2.1. Tương tác giữa Perl script-DBI-DBD và RBDMS 2.2.2. Giới thiệu về mạng Internet Năm 1957, Bộ quốc phòng Mỹ thành lập cơ quan nghiên cứu các dự án kỹ thuật cao ARPA (Advanced Research Projects Agency), thuộc một bộ phận trong bộ quốc phòng. Chỉ một thập niên sau, năm 1969, ARPA thiết lập mạng ARPANET – tiền thân của Internet ngày nay. ARPANET là một mạng máy tính nối bốn máy chủ tại các trƣờng đại học California – Los Angeles, đại học California – Santa Barbara, viện nghiên cứu Standford và đại học Utah lại với nhau. Đến năm 1973, mạng xuyên quốc gia đầu tiên đƣợc thiết lập giữa hai nƣớc Anh và Na Uy. Năm 1982, giao thức TCP/IP ra đời và nhanh chóng trở thành giao thức chuẩn. Internet dần dần đƣợc phát triển và đột phá từ khi có sự ra đời của dịch vụ WWW (World Wide Web). Và từ đây, Internet đƣợc mở rộng sử dụng cho các ngành nghiên cứu khác và trở thành một công cụ có mục đích thƣơng mại. 2.2.3. Tích hợp CSDL với web dùng CGI Gồm ba bƣớc: Bƣớc 1: từ trình duyệt web (trên máy client) gởi đi những yêu cầu của ngƣời dùng đến máy server. Ở máy server, thông qua trình ứng dụng CGI chuyển những yêu cầu đó thành những câu truy vấn SQL. Bƣớc 2: kết nối CSDL, thực hiện những câu truy vấn đó. P E R L S C R I P T D B I S w i t c h DBD DBD DBD RDBMS RDBMS RDBMS 6 NLM NCBI NIH Bƣớc 3: thu lấy kết quả truy vấn, thông qua trình ứng dụng CGI chuyển kết quả thu đƣợc từ CSDL thành định dạng HTML, rồi trả về máy client. 2.3. CƠ SỞ DỮ LIỆU SINH HỌC Sự phát triển của kỹ thuật và thiết bị thí nghiệm nhƣ kỹ thuật DNA Microarray, kỹ thuật giải trình tự tự động cho phép tạo ra hàng ngàn dữ liệu sinh học trong chốc lát. Nhƣ vậy vấn đề đặt ra là cần phải có biện pháp lƣu trữ, quản lý, sử dụng và chia sẻ nguồn dữ liệu này. Do đó cần xây dựng các dữ liệu này thành một CSDL hoàn chỉnh để có thể thực hiện đƣợc mục đích trên. Hơn thế nữa, với việc hệ thống hóa toàn bộ dữ liệu trên, chúng ta dễ dàng thực hiện việc chia sẻ những thông tin ấy qua mạng Internet hay kết nối thêm vào những tập dữ liệu ở nơi khác. Một số CSDL lớn, trực tuyến đã đƣợc xây dựng để cung cấp thông tin cho các nhà nghiên cứu sinh học nhƣ NCBI, EBI, SIB, DDBJ… 2.3.1. NCBI (National Center for Bioinformatic Information) 2.3.1.1. Vài nét về NCBI NCBI là chữ viết tắt của “National Center for Bioinformatic Information”. Đây là trung tâm quốc gia về Công nghệ sinh học, thuộc viện sức khỏe quốc gia của Hoa Kỳ (NIH – National Institute of Health). NCBI chính thức đƣợc thành lập vào ngày 4/10/1988. Đến năm 1991, NCBI đảm nhiệm việc quản lý CSDL trình tự DNA và từ đó NCBI còn đƣợc gọi là GenBank. Hình 2.2. Tương quan giữa NCBI, NLM (National Library of Medicine) và NIH NCBI là nơi cung cấp, trao đổi thông tin về sinh học phân tử của Mỹ, thông qua những CSDL trực tuyến. Ngoài ra, NCBI còn tham gia những nghiên cứu về “sinh học tính toán” (computation biology), phát triển những công cụ phân tích dữ liệu bộ gene, protein… 7 2.3.1.2. Một số cơ sở dữ liệu trong NCBI Nucleotide (GenBank): là CSDL về trình tự nucleotide. Protein: là CSDL về trình tự amino acid. Genome: trình tự toàn bộ genome của một số sinh vật. Structure: hay còn có tên gọi là MMDB (Molecular Modeling Database) chứa cấu trúc ba chiều của những đại phân tử bao gồm cả protein lẫn những chuỗi nucleotide. Ngoài ra, NCBI còn một số CSDL khác. Chúng là các CSDL trung gian, đƣợc tạo thành từ sự kết hợp của hai hay nhiều CSDL trên, hay do liên kết đến các CSDL khác. 2.3.1.3. Một số công cụ trong NCBI – Công cụ khai thác dữ liệu Tìm kiếm thông tin sinh học dựa trên từ khóa có dạng văn bản: Entrez: chứa các phƣơng thức tìm kiếm nhƣ tìm kiếm dựa trên accession number hay dựa theo tên sinh vật, tên gene, tên protein… Tìm kiếm trình tự tƣơng đồng: có phần mềm điển hình nhƣ: BLAST (Basic Local Alignment Search Tool). Thông tin hƣớng dẫn về BLAST có ở trang BLAST Homepage. Stand-alone BLAST: là phần mềm có thể tải về từ NCBI. Phần mềm này thực hiện việc tìm kiếm các trình tự tƣơng đồng trên CSDL trình tự cục bộ. Phân loại sinh vật: Taxonomy Browser: công cụ thực hiện việc tìm kiếm trên CSDL Taxonomy. Taxonomy BLAST: nhóm lại những kết quả có tỉ lệ tƣơng đồng khi thực hiện BLAST, tùy thuộc vào sự phân loại của chúng trong CSDL Taxonomy. TaxTable: tóm tắt kết quả sau khi thực hiện BLAST với CSDL Taxonomy và hiển thị mối quan hệ giữa sinh vật này với sinh vật khác bằng các biểu đồ màu. – Công cụ phục vụ cho việc góp trình tự protein, DNA, EST, STS lên NCBI Sequin: phần mềm này có thể tải về từ NCBI, hỗ trợ cho việc tạo ra những file văn bản (chứa trình tự, tên tác giả, bài báo…) có cấu trúc theo khuôn mẫu. Trong phần mềm này còn kèm theo một số công cụ nhỏ nhƣ công cụ tìm khung đọc mở, công 8 cụ gióng cột trình tự… phần mềm này thích hợp cho việc góp nhiều trình tự cùng một lúc. – NCBI còn tích hợp khá nhiều những công cụ, phần mềm phân tích trình tự DNA, protein nhƣ: ORF Finder, Electronic-PCR (e-PCR), VecScreen, Homologene, COGs, COGnitor, GEO, MGC, Clone Registry, CDD, LocusLink… 2.3.2. EBI (European Bioinformatics Institute) 2.3.2.1. Vài nét về EBI EBI là viện Tin - sinh học của Cộng đồng chung Châu Âu, EBI đặt tại Welcome Trust Genome Campus nƣớc Anh, thành lập năm 1992. EBI bắt nguồn từ EMBL (European Molecular Biology Laboratory). EMBL đƣợc thành lập năm 1980 tại phòng thí nghiệm sinh học phân tử Heidelberg của Đức và đây là CSDL trình tự nucleotide đầu tiên của thế giới. EBI phục vụ cho việc nghiên cứu trong các lĩnh vực nhƣ sinh học phân tử, di truyền, y học, nông nghiệp… bằng cách xây dựng, duy trì những CSDL chia sẻ trực tuyến thông tin cần thiết. Bên cạnh đó, EBI còn thực hiện những nghiên cứu trong lĩnh vực Tin-sinh học và sinh học phân tử tính toán. 2.3.2.2. Một số cơ sở dữ liệu trong EBI EMBL (European Molecular Biology Laboratory): còn đƣợc gọi là EMBL- BANK chứa CSDL về trình tự DNA, RNA. MSD (Macromolecular Structure Database): chứa thông tin cấu trúc của các đại phân tử sinh học nhƣ protein, DNA, RNA… ArrayExpress: tích trữ nguồn dữ liệu về sự biểu hiện của gene dựa trên kỹ thuật Microarray. TrEMBL (Translate EMBL): là cơ sở dữ liệu về protein. Do lƣợng trình tự này ngày càng nhiều và để quản lý tốt hơn, TrEMBL đã kết hợp với Swiss-Prot (CSDL về trình tự protein của Thụy Sỹ), PIR (CSDL về protein của trƣờng đại học Y Georgetown, Hoa Kỳ) tạo thành CSDL UniProt. Ngoài ra, EBI còn một số CSDL khác. Chúng là các CSDL trung gian, đƣợc tạo thành từ sự kết hợp của hai hay nhiều CSDL trên hay do liên kết đến CSDL khác 9 Cơ sở dữ liệu về protein của Thụy Sỹ đặt tại Geneva Cơ sở dữ liệu về protein của trƣờng đại học Y Georgetown (Mỹ) 2.3.2.3. Một số công cụ hỗ trợ phân tích trình tự sinh học FASTA: Do Smith và Waterman tạo ra năm 1981, là chƣơng trình tìm kiếm những trình tự tƣơng đồng, có thể là trình tự DNA hay trình tự protein, trong CSDL đã chọn. Hình 2.3. Một số cơ sở dữ liệu trong EBI BLAST: chủ yếu là phần mềm WU-BLAST (Washington University Basic Local Alignment Tool version 2.0). Đặc điểm chính của công cụ này là tìm kiếm vùng trình tự tƣơng đồng nhanh chóng. ClustalW: là công cụ dành cho việc sắp gióng cột ở hai hay nhiều trình tự sinh học (cả protein và DNA), công cụ này cho ra kết quả có ý nghĩa sinh học cao. 2.3.3. SIB (Swiss Institute of Bioinformatics) Là viện Tin-sinh học của Thụy Sỹ đặt tại Geneva, nơi cung cấp dịch vụ trên web chất lƣợng cao cho cộng đồng khoa học thế giới qua trang ExPASy (Expert Protein Analysis System). 10 Một số CSDL trong ExPASy: SWISS-PROT: là CSDL protein, đƣợc thành lập năm 1986. Nhƣng kể từ năm 1987, SWISS-PROT liên kết với EBI. SWISS-2DPAGE (2-dimensional polyacrylamide gel electrophoresis database): chứa dữ liệu điện di hai chiều từ protein của ngƣời, chuột, E. coli… PROSITE: tích trữ về các họ protein có cùng chức năng. ENZYME (enzyme nomenclature): cung cấp thông tin về danh pháp của enzyme. SWISS-3DIMAGE: lƣu trữ hình ảnh chất lƣợng cao của các đại phân tử sinh học đã biết cấu trúc không gian ba chiều. 2.3.4. DDBJ (DNA Data Bank Japan) và PDBj (Protein Database Japan) DDBJ là CSDL về trình tự DNA của Nhật Bản, chính thức đi vào hoạt động năm 1986, đặt tại viện di truyền quốc gia (NIG). Đến năm 2001, trung tâm thông tin về sinh học ở NIG đƣợc tổ chức lại với cái tên là CIB (Center Information Biology) kết hợp với DDBJ, viết tắt CIB/DDBJ. PDBj là CSDL của Nhật Bản, tích trữ dữ liệu về cấu trúc, chức năng protein. DDBJ của Nhật Bản, EMBL của Châu Âu, NCBI của Hoa Kỳ là ba CSDL về trình tự nucleotide lớn, mang tính chất toàn cầu và ba cơ sở dữ liệu này có sự hợp tác, trao đổi qua lại dữ liệu. Từ đó càng làm cho dữ liệu về trình tự nucleotide trở nên phong phú hơn. Các tổ chức này đều xây dựng công cụ tìm kiếm trong CSDL của họ. Với NCBI là Entrez, EBI là SRS và CIB là getentry. Nhƣ vậy để có thể khai thác hiệu quả các CSDL này thì việc đầu tiên cần thực hiện là nắm vững các hoạt động của công cụ tìm kiếm “search engines” này. 11 Hình 2.4. Ba cơ sở dữ liệu nucleotide (GenBank – EMB – DDBJ) và công cụ tìm kiếm tương ứng Ngoài ra còn có sự kết hợp của các CSDL protein trên thế giới để tạo ra một CSDL thống nhất wwPDB (world wide Protein Database). Hình 2.5. Sự hợp nhất của ba cơ sở dữ liệu MSD, PDBj, PDB •Submissions •Updates Entrez NCBI NIH getentry NIG CIB •Submissions •Updates GenBank DDBJ EBI EMBL EMBL SRS •Submissions •Updates 12 2.4. BỆNH VIÊM MÀNG NÃO MỦ 2.4.1. Sơ lƣợc về bệnh viêm màng não mủ 2.4.1.1. Định nghĩa Viêm màng não mủ là hiện tƣợng viêm của màng não. Phản ứng viêm này là do sự xâm lấn của các loại vi khuẩn sinh mủ vào màng não, từ đó có thể đƣa đến những biến chứng thần kinh mãn tính hay gây tử vong cho bệnh nhân. 2.4.1.2. Bệnh theo tuổi Theo tổng kết hồi cứu của Viện Nhi TW từ năm 1996 – 1999 ở trẻ từ 1 tháng đến 15 tuổi, 3 căn nguyên gây bệnh chính vẫn là Haemophilus influenzae, Streptococcus pneumoniae, Neisseria meningitidis (88,7%) với tỷ lệ tử vong tƣơng ứng là 8,7%, 31,2%, 14,3% trong đó Haemophilus influenzae chiếm 56% tổng số và gặp ở trẻ dƣới 2 tuổi. Ở trẻ sơ sinh thì căn nguyên chính là Klebsiella pneumoniae và Escherichia coli. Bảng 2.1. Tóm tắt các tác nhân gây bệnh theo lứa tuổi Tuổi Tác nhân thông thƣờng 0 tuần đến 4 tuần Streptococcus agalactiae, Escherichia coli, Listeria monocytogenes, Klebsiella pneumoniae, Enterococcus spp 4 tuần đến 12 tuần Streptococcus agalactiae, Escherichia coli, Haemophilus influenzae 3 tháng đến 2 tuổi Haemophilus influenzae, Neisseria meningitidis 3 tuổi đến 15 tuổi Neisseria meningitidis, Streptococcus pneumoniae 15 tuổi đến 50 tuổi Neisseria meningitidis, Streptococcus pneumoniae Trên 50 tuổi Neisseria meningitidis, Streptococcus pneumoniae, trực khuẩn gram âm 13 2.4.1.3. Các con đƣờng xâm nhiễm của vi khuẩn gây bệnh Một số vi trùng ở trong máu đi vào màng não cũng có thể có nguồn gốc từ viêm nội tâm mạc, viêm phổi, viêm tắc tĩnh mạch hoặc cũng có thể xâm nhập trực tiếp từ các ổ viêm xoang, viêm tai giữa, viêm mũi. Ở các bệnh nhân bị chấn thƣơng sọ não hoặc có vết gãy ở xoang mũi hay bị gãy xƣơng sàng dễ bị viêm màng não. Ở những trƣờng hợp này, sự nhiễm trùng thƣờng do các vi khuẩn hiện diện ngoài da của bệnh nhân. Các phẫu thuật ngoại thần kinh cũng có thể gây viêm màng não nhất là các thủ thuật đụng chạm đến dịch não tủy hoặc do các trƣờng hợp viêm cốt tủy ở xƣơng sọ và cột sống. Viêm màng não còn có thể do nhiễm các vi khuẩn từ môi trƣờng bên ngoài nhƣ các bệnh nhân bị phỏng dễ bị nhiễm Staphylococcus aureus, Pseudomonas aeruginosa. Trẻ em nằm trong môi trƣờng ẩm ƣớt dễ bị nhiễm các loại vi khuẩn phát triển trong không khí ẩm. Trẻ sơ sinh dễ bị nhiễm các loại vi khuẩn có mặt thƣờng xuyên trong âm đạo hay trực tràng ngƣời mẹ (Escherichia coli) hoặc từ đƣờng tiết niệu của ngƣời mẹ (Listeria monocytogenes) khi màng ối bị vỡ. 2.4.2. Các triệu chứng biểu hiện lâm sàng của bệnh 2.4.2.1. Những triệu chứng giai đoạn khởi phát Một bệnh sử đƣợc khai thác tỉ mỉ có thể thấy bệnh nhân viêm màng não trƣớc đó có nhiễm trùng hô hấp, viêm xoang, viêm tai giữa hay chấn thƣơng sọ não mới hay cũ. Ở giai đoạn này, các triệu chứng tập trung ở hội chứng nhiễm trùng, một vài bệnh nhân có đau đầu hay ói mửa. Một vài triệu chứng gợi ý nhƣ sốt có tử ban, đốm xuất huyết rải rác trong cơ thể là nghĩ đến não mô cầu… 2.4.2.2. Biểu hiện lâm sàng của viêm màng não mủ – Hội chứng nhiễm trùng Sốt cao liên tục ở trẻ em. Ngƣợc lại, sốt có thể không điển hình ở ngƣời lớn hoặc bệnh nhân cao tuổi. Kèm theo sốt là thể trạng suy sụp, mất nƣớc, môi khô, tim đập nhanh. Ở trẻ em có thể bức rức, lăn lộn, bỏ ăn. Đau đầu là triệu chứng thƣờng gặp ở tất cả các trƣờng hợp. Nôn là triệu chứng xuất hiện muộn hơn đau đầu. Nôn vọt nhất thời không liên quan đến bữa ăn. 14 Rối loạn ý thức: ở giai đoạn đầu bệnh nhân rất tỉnh sau đó rơi vào trạng thái tâm lý hoảng sợ, sợ ánh sáng, sợ tiếng động; tiến nhanh đến mất ý thức và hôn mê. Rối loạn cơ vòng: bí tiểu, táo bón là triệu chứng thƣờng gặp trong viêm màng não mủ. – Hội chứng màng não Đau đầu, ói mửa, sợ ánh sáng, cứng tƣ thế do phản ứng, bệnh nhân nằm co, cứng gáy, tăng phản xạ gân cơ tứ chi. – Các dấu hiệu thần kinh khác Co giật, 20 – 30% các trƣờng hợp, xuất hiện sớm ở những ngày đầu. Liệt các dây thần kinh sọ (dây III, VI,VIII), phù gai thị. Liệt ½ ngƣời mức độ từ nhẹ đến nặng, trong một số ít trƣờng hợp có thể liệt một tay, một chân hay ½ mặt. Rối loạn ý thức và hôn mê. Hôn mê có thể xuất hiện sớm, mức độ khác nhau nhƣng khi rối loạn ý thức và hôn mê bệnh nhân thƣờng ở giai đoạn nặng. Một số trƣờng hợp với bệnh cảnh của triệu chứng tăng áp lực nội sọ: đau đầu, ói mửa và phù gai thị. Bảng 2.2. Dấu hiệu và triệu chứng của bệnh viêm màng não mủ Triệu chứng và dấu hiệu Tần số liên quan % Sốt 90 Đau đầu 90 Kích thích màng não 85 Tăng cảm giác 80 Kernig 50 Brundzinski 50 Co giật kiểu động kinh 30 Nôn 35 Dấu hiệu khu trú 10-20 Phù gai thị <1 15 2.4.3. Hậu quả của bệnh trên những đối tƣợng bị lây nhiễm Biến chứng nhiễm trùng máu do sự lan tỏa của vi khuẩn theo đƣờng máu. Vi khuẩn có thể khu trú lại gây viêm nội tâm mạc hay viêm mủ khớp. Biến chứng thần kinh nặng nề (20%). Ngoài ra còn có rối loạn thị giác, liệt nửa ngƣời (15%). Tuy nhiên, các biểu hiện liệt dây thần kinh này có thể biến mất sau khi lành bệnh. Biến chứng co giật: co giật toàn phần hay cục bộ, có thể kèm giãn đồng tử một bên, tăng phản xạ gân xƣơng không đồng đều do phù não, do viêm tắc tĩnh mạch vỏ não. Áp xe não do nhiễm trùng lan tỏa theo đƣờng máu từ các xoang bị viêm. Tràn dịch màng cứng nghi ngờ xảy ra ở những trẻ có vòng đầu lớn nhanh, ói, sốt kéo dài, đạm dịch não tủy tiếp tục tăng cao mặc dù tế bào giảm. Viêm màng não tái phát nhiều lần xảy ra ở những bệnh nhân có khuyết tật cơ thể học (rạn nứt hộp sọ trong những trƣờng hợp tiền căn chấn thƣơng sọ não, rò rỉ dịch não tủy…) do những ổ viêm kế cận tồn tại (viêm xoang, viêm tai…) hoặc do giảm miễn dịch cơ thể. 2.4.4. Tình hình bệnh viêm màng não mủ trên thế giới và Việt Nam – Tình hình nhiễm bệnh trên thế giới Bệnh viêm màng não nói chung (bao gồm cả viêm màng não mủ) xảy ra ở tất cả các nơi trên thế giới nhƣng những trận dịch lớn nhất và thƣờng xuyên lặp lại là ở vùng bán khô cằn của vùng cận sa mạc Sahara, châu Phi. Khu vực này còn đƣợc biết với tên “The meningitis belt” (tạm dịch là “vành đai bệnh viêm màng não”) trải dài từ Senegal đến Ethiopia gồm 15 nƣớc với dân số ƣớc đoán khoảng 300 triệu ngƣời. Trận dịch viêm màng não gần đây nhất xảy ra vào giữa thập niên 90 thế kỷ XX với 350 000 ca bệnh và hàng ngàn ngƣời chết. Năm 1996, hầu hết 190 000 ca bệnh ở Mali, Niger, Nigeria, Burkina và những nƣớc khác đã làm tê liệt hệ thống chăm sóc y tế và làm cạn kiệt nguồn dự trữ vaccine thế giới. Theo thống kê của Tổ chức Y Tế thế giới (WHO), hằng năm số ngƣời mắc bệnh viêm màng não mủ (không kể những đại dịch) là 1,2 triệu ca. Năm 1999, trên toàn thế giới có 88006 trƣờng hợp viêm màng não mủ đƣợc ghi nhận, trong đó có 6593 trƣờng hợp tử vong. Trong số này, các nƣớc châu Phi cũng chiếm một số lƣợng đáng kể, 16 52953 trƣờng hợp, 4129 trƣờng hợp tử vong. Và nếu tính từ ngày 1/1 đến 16/4/2000, trong một khoảng thời gian ngắn đã có hàng chục ngàn trƣờng hợp nhiễm bệnh viêm màng não mủ đƣợc ghi nhận, trong đó châu Phi có 18091 trƣờng hợp, 1897 trƣờng hợp tử vong. Đối với bệnh viêm màng não mủ, ngƣời ta có thể thống kê đƣợc một bức tranh toàn diện về dịch tễ của bệnh này. Tuy nhiên, theo các số liệu thống kê chính thức tại Mỹ, tỷ lệ mắc bệnh viêm màng não mủ là 3-5/100 000 dân và hơn 2000 trƣờng hợp tử vong trong một năm. Nếu chỉ tính riêng ở trẻ sơ sinh, theo điều tra của Thụy Điển, tỷ lệ mắc bệnh viêm màng não mủ là 2,8/100 000 trẻ mới sinh. Tại các quốc gia đang phát triển, bệnh có khuynh hƣớng trầm trọng hơn. Tại Brazil, trong giai đoạn 1973 – 1982, tỷ lệ mắc bệnh viêm màng não mủ là 45,8/100 000 dân và tử vong là 33%. Tại Gioudanni, tỷ lệ mắc bệnh viêm màng não mủ là 1,1/1000 trẻ mới sinh. – Tình hình viêm màng não mủ ở Việt Nam Tại Việt Nam, bệnh viêm màng não mủ tuy không bùng phát thành dịch nhƣng vẫn xảy ra liên tục ở các khoảng thời gian khác nhau trong năm. Theo thống kê của Trung tâm Y Tế Dự Phòng thành phố Hồ Chí Minh cho biết: Năm 1997 1998 1999 2000 Số ca bệnh 217 177 301 458 Trong đó chỉ có 8 ca tử vong từ năm 1997 đến năm 2000 (chiếm tỉ lệ 0,69%) Các số liệu thống kê trên cho thấy bệnh viêm màng não mủ đang có chiều hƣớng gia tăng. Tỷ lệ tử vong của những trƣờng hợp viêm màng não mủ thấp nhƣng di chứng của bệnh để lại rất nặng nề. Do đó, việc chẩn đoán nhanh và chính xác để điều trị bệnh một cách nhanh chóng là vô cùng cần thiết. 2.5. VI KHUẨN GÂY BỆNH VIÊM MÀNG NÃO MỦ Có ít nhất 15 loại vi khuẩn có thể là căn nguyên gây bệnh. Đƣợc thƣờng xuyên ghi nhận là Haemophilus influenzae, Neisseria meningitidis, Streptococcus pneumoniae cả 3 loại này chiếm tỷ lệ là 80% các trƣờng hợp viêm màng não mủ. Tuy nhiên, mức độ mắc phải từng loại vi khuẩn tuỳ thuộc vào lứa tuổi, giới tính và yếu tố 17 thuận lợi cũng nhƣ tuỳ thuộc vào khu vực địa lý. Ngoài ra, điều kiện khí hậu, vệ sinh, mùa… cũng ảnh hƣởng đến tần số mắc bệnh của các căn nguyên. – Haemophilus influenzae Viêm màng não mủ do H. influenzae chiếm khoảng 45 – 48% tổng số bệnh nhân với tỷ lệ tử vong là 3 – 6%. H. influenzae là căn nguyên quan trọng nhất ở trẻ dƣới 6 tuổi, đặc biệt ở trẻ 6 – 12 tháng. Các yếu tố nguy cơ là viêm xoang, viêm tai giữa, viêm nắp thanh quản, viêm phổi, bệnh tiểu đƣờng, suy giảm miễn dịch sau khi cắt lách, chấn thƣơng đầu có thoát dịch não tủy. – Neisseria meningitidis (não mô cầu) Viêm màng não mủ do não mô cầu chiếm 14 – 20% tổng số bệnh nhân với tỷ lệ tử vong là 10 – 13%. N. meningitidis là căn nguyên phổ biến ở trẻ em và thanh niên. Căn nguyên này gồm nhiều nhóm, tất cả các nhóm đều có khả năng gây dịch. Tuy nhiên nhóm B thƣờng gây dịch lẻ tẻ, nhóm A và C thƣờng gây các vụ dịch lớn. Nhóm Y có thể có viêm phổi kết hợp. Yếu tố nguy cơ là bệnh nhân suy giảm phần cuối của bổ thể (C5, C6, C7, C9). – Streptococcus pneumoniae (phế cầu) Viêm màng não mủ do phế cầu chiếm 13 – 17% tổng số bệnh nhân với tỷ lệ tử vong là 19 – 26%. Phế cầu là căn nguyên chính ở ngƣời trƣởng thành và là một trong ba căn nguyên chính ở trẻ em. – Listeria monocytogenes Viêm màng não mủ do Listeria chiếm khoảng 2% các trƣờng hợp viêm màng não mủ với tỷ lệ tử vong là 22 – 29%. 90% các trƣờng hợp viêm màng não mủ do Listeria là do các type Ia, Ib, VIb gây nên. Nhiễm Listeria monocytogenes hay gặp ở trẻ sơ sinh, trẻ bị ung thƣ, giảm miễn dịch, t

Các file đính kèm theo tài liệu này:

  • pdfLE VAN TAM - 02126088.pdf