TÓM TẮT
TRẦN NGỌC VIỆT, Đại Học Nông Lâm Thành phố Hồ Chí Minh. Tháng 8/2006.
“KHAI THÁC DỮ LIỆU EST (Expressed Sequence Tags) NHẰM PHÁT HIỆN
MICROSATELLITE PHỤC VỤ CHO CÔNG TÁC PHÂN TÍCH VÀ SO SÁNH
ĐẶC ĐIỂM DI TRUYỀN CỦA ONG MẬT”
Giảng viên hướng dẫn:
TS. BÙI MINH TRÍ
Thời gian nghiên cứu: từ tháng 2 đến tháng 7 năm 2006
Địa điểm nghiên cứu: Trung tâm Phân tích Thí Nghiệm - trường Đại học Nông
Lâm TP. Hồ Chí Minh
Ở Việt Nam, nghề nuôi ong mật đã hình thành rất lâu và hiện nay các sản phẩm
của ong mật hầu hết là được xuất khẩu. Hiệu quả kinh tế mang về từ nghề nuôi là khá
cao. Tuy nhiên, việc nuôi ong chỉ tập trung chủ yếu ở một số vùng nhất định như Tây
Nguyên (Đak Lak), miền Đông Nam Bộ, chưa tận dụng được hết nguồn tài nguyên có
sẵn. Sự hạn chế này là do chưa xác định được loài ong cho mật nào phù hợp với từng
vùng địa lý cụ thể tại Việt Nam. Chính vì thế chúng tôi tiến hành nghiên cứu về việc
thiết lập nên primer chạy phản ứng PCR dựa vào chỉ thị microsatellite của các loài ong
cho mật để làm cơ sở cho những bước nghiên cứu định danh và xác định đặc điểm di
truyền của ong mật phục vụ cho việc mở rộng nghề nuôi ong mật ở các vùng ở Việt
Nam.
Những kết quả đã đạt được:
۰Chúng tôi đã chọn được một nguồn dữ liệu (EST) tốt cho nghiên cứu
۰Thiết lập được phương pháp để tìm kiếm microsatellite từ nguồn EST
۰ Thiết kế được những cặp primer dựa vào vùng bảo tồn hai bên những
loại microsatellite tìm được
Kết luận: Sự thành công của việc thiết kế primer đã làm cơ sở cho những bước
nghiên cứu xa hơn về đặc điểm di truyền của các loài ong cho mật. Thành công này
mở ra một triển vọng cho việc ứng dụng lĩnh vực Bioinformatic hỗ trợ cho nghiên cứu
thực nghiệm, làm giảm đáng kể chi phí và đẩy nhanh tốc độ nghiên cứu thực nghiệm
tại Trung Tâm.
MỤC LỤC
CHưƠNG TRANG
Trang tựa
Lời cảm tạ iii
Tóm tắt iv
Mục lục .v
Danh sách các chữ viết tắt viii
Danh sách các bảng .ix
Danh sách các hình .x
1. MỞ ĐẦU 1
1.1. Đặt vấn đề .1
1.2. Mục đích và yêu cầu nghiên cứu 2
1.2.1. Mục đích nghiên cứu .2
1.2.2. Yêu cầu nghiên cứu .2
1.3. Giới hạn .2
2. TỔNG QUAN TÀI LIỆU .3
2.1. Giới thiệu chung về ong mật .3
2.1.1. Cấu tạo cơ thể của ong mật 3
2.1.1.1. Hình thái cơ thể 3
2.1.1.2. Các cơ quan bên trong 6
2.1.2. Tổ chức của đàn ong 6
2.1.3. Yêu cầu dinh dưỡng của ong .7
2.1.4. Các sản phẩm của ong .7
2.1.4.1. Mật ong .7
2.1.4.2. Phấn hoa .7
2.1.4.3. Sữa ong chúa 7
2.1.4.4. Sáp ong 8
2.2. Nguồn gốc EST (Expressed Sequence Tags) 8
2.2.1. EST là gì? 8
2.2.2. Phương pháp tạo EST 8
2.3. Microsatellite là gì? .10
2.3.1. Các dạng microsatellite .10
2.3.2. Cơ chế hình thành microsatellite .11
2.3.3. Ứng dụng của microsatellite 12
2.3.4. Marker phân tử (molecular markers) .13
2.3.5. Vì sao chọn marker microsatellite? .14
2.4. Ngôn ngữ lập trình Perl (Practical Extraction and Reporting Language) .15
2.4.1. Nguồn gốc của Perl 15
2.4.2. Cấu trúc của Perl 16
2.4.2.1. Dữ liệu vô hướng (scala data) 16
2.4.2.2. Cấu trúc điều khiển .16
2.4.2.3. Các List, Array và Hash .19
2.4.2.4. Dòng chương trình và các thường trình con .19
2.4.2.5. Package và Module 20
2.5. Giới thiệu về mồi (primer) 21
2.5.1. Khái quát về mồi 21
2.5.2. Đặc điểm của mồi .21
2.5.2.1. Tính chuyên biệt .21
2.5.2.2. Tính ổn định .22
2.5.2.3. Tính tương thích .23
2.6. Tin sinh học .24
2.6.1. Khái niệm tin sinh học 24
2.6.2. Các lĩnh vực nghiên cứu chính của tin sinh học .24
2.6.2.1. Genomics - Hệ gen học 24
2.6.2.2. Sinh học tiến hóa 26
2.6.2.3. Phân tích chức năng gen .26
3. PHưƠNG TIỆN VÀ PHưƠNG PHÁP NGHIÊN CỨU .29
3.1. Thời gian và địa điểm tiến hành nghiên cứu .29
3.1.1. Thời gian nghiên cứu .29
3.1.2. Địa điểm nghiên cứu .29
3.2. Vật liệu và công cụ nghiên cứu .29
3.2.1. Vật liệu nghiên cứu .29
3.2.2. Công cụ nghiên cứu .29
3.3. Phương pháp tiến hành nghiên cứu .30
3.3.1. Quy trình nghiên cứu tổng quát .30
3.3.2. Phương pháp nghiên cứu .31
3.3.2.1. Sơ đồ các bước tiến hành nghiên cứu .31
3.3.2.2. Các bước tiến hành nghiên cứu chi tiết 32
4. KẾT QUẢ VÀ THẢO LUẬN 42
4.1. Kết quả tìm kiếm và tải trình tự EST về máy tính cá nhân .42
4.1.1. Kết quả tìm kiếm EST .42
4.1.2. Kết quả tải trình tự EST về máy tính cá nhân .43
4.2. Kết quả tìm và phân loại microsatellite .44
4.2.1. Kết quả tìm microsatellite qua xử lý của EST_TRIMMER 44
4.2.2 Kết quả xử lý qua MISA 45
4.3. Kết quả thiết kế primer 49
4.3.1. Kết quả thiết kế primer qua 6 Script Perl 49
4.3.2. Kết quả so sánh và chọn lọc primer được thiết kế .56
5. KẾT LUẬN VÀ ĐỀ NGHỊ 59
5.1. Kết luận .59
5.1.1. Sơ đồ phương pháp thực hiện 59
5.1.2. Kết quả đạt được .60
5.2. Đề nghị 60
6. TÀI LIỆU THAM KHẢO 61
7. PHỤ LỤC .64
94 trang |
Chia sẻ: lvcdongnoi | Lượt xem: 3439 | Lượt tải: 1
Bạn đang xem trước 20 trang tài liệu Khai thác dữ liệu est (Expressed sequence tags ) nhằm phát hiện microsattellte phục vụ cho công tac phân tích và so sánh đặc điểm di truyền của ong mật, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
1
BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƢỜNG ĐẠI HỌC NÔNG LÂM TP. HỒ CHÍ MINH
BỘ MÔN CÔNG NGHỆ SINH HỌC
************
KHÓA LUẬN TỐT NGHIỆP
KHAI THÁC DỮ LIỆU EST (Expressed Sequence Tags)
NHẰM PHÁT HIỆN MICROSATELLITE PHỤC VỤ CHO
CÔNG TÁC PHÂN TÍCH VÀ SO SÁNH ĐẶC ĐIỂM
DI TRUYỀN CỦA ONG MẬT
Ngành học: CÔNG NGHỆ SINH HỌC
Niên khóa: 2002-2006
Sinh viên thực hiện: TRẦN NGỌC VIỆT
Thành phố Hồ Chí Minh
Tháng 8/2006
2
BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƢỜNG ĐẠI HỌC NÔNG LÂM THÀNH PHỐ HỒ CHÍ MINH
BỘ MÔN CÔNG NGHỆ SINH HỌC
************
KHAI THÁC DỮ LIỆU EST (Expressed Sequence Tags)
NHẰM PHÁT HIỆN MICROSATELLITE PHỤC VỤ CHO
CÔNG TÁC PHÂN TÍCH VÀ SO SÁNH ĐẶC ĐIỂM
DI TRUYỀN CỦA ONG MẬT
Giáo viên hƣớng dẫn: Sinh viên thực hiện:
TS. BÙI MINH TRÍ TRẦN NGỌC VIỆT
Thành phố Hồ Chí Minh
Tháng 8/2006
iii
LỜI CẢM TẠ
Cảm ơn công lao nuôi dƣỡng, dạy dỗ của cha mẹ
Xin chân thành cảm tạ
Ban Giám hiệu Trƣờng Đại học Nông Lâm Thành Phố Hồ Chí Minh
Ban chủ nhiệm Bộ Môn Công nghệ Sinh Học cùng tất cả quý thầy cô đã
truyền đạt kiến thức cho tôi trong suốt quá trình học tại trƣờng.
Chân thành cảm ơn
TS. Bùi Minh Trí đã tận tình hƣớng dẫn, giúp đỡ tôi trong suốt thời gian thực
hiện đề tài tốt nghiệp.
Xin cảm ơn CN. Lƣu Phúc Lợi đã giúp đỡ, hỗ trợ tài liệu chuyên môn.
Cảm ơn các anh chị tại phòng Sinh Hóa đã tạo điều kiện tốt cho tôi khi tiến hành thực
hiện công việc tại Trung Tâm.
Xin cảm ơn bạn bè thân yêu của lớp DH02SH đã chia sẻ cùng tôi những vui buồn
trong thời gian học cũng nhƣ hết lòng hỗ trợ, giúp đỡ tôi trong thời gian thực hiện đề
tài.
Tp. Hồ Chí Minh tháng 08 năm 2006
Sinh viên thực hiện
Trần Ngọc Việt
iv
TÓM TẮT
TRẦN NGỌC VIỆT, Đại Học Nông Lâm Thành phố Hồ Chí Minh. Tháng 8/2006.
“KHAI THÁC DỮ LIỆU EST (Expressed Sequence Tags) NHẰM PHÁT HIỆN
MICROSATELLITE PHỤC VỤ CHO CÔNG TÁC PHÂN TÍCH VÀ SO SÁNH
ĐẶC ĐIỂM DI TRUYỀN CỦA ONG MẬT”
Giảng viên hƣớng dẫn:
TS. BÙI MINH TRÍ
Thời gian nghiên cứu: từ tháng 2 đến tháng 7 năm 2006
Địa điểm nghiên cứu: Trung tâm Phân tích Thí Nghiệm - trƣờng Đại học Nông
Lâm TP. Hồ Chí Minh
Ở Việt Nam, nghề nuôi ong mật đã hình thành rất lâu và hiện nay các sản phẩm
của ong mật hầu hết là đƣợc xuất khẩu. Hiệu quả kinh tế mang về từ nghề nuôi là khá
cao. Tuy nhiên, việc nuôi ong chỉ tập trung chủ yếu ở một số vùng nhất định nhƣ Tây
Nguyên (Đak Lak), miền Đông Nam Bộ, chƣa tận dụng đƣợc hết nguồn tài nguyên có
sẵn. Sự hạn chế này là do chƣa xác định đƣợc loài ong cho mật nào phù hợp với từng
vùng địa lý cụ thể tại Việt Nam. Chính vì thế chúng tôi tiến hành nghiên cứu về việc
thiết lập nên primer chạy phản ứng PCR dựa vào chỉ thị microsatellite của các loài ong
cho mật để làm cơ sở cho những bƣớc nghiên cứu định danh và xác định đặc điểm di
truyền của ong mật phục vụ cho việc mở rộng nghề nuôi ong mật ở các vùng ở Việt
Nam.
Những kết quả đã đạt đƣợc:
۰ Chúng tôi đã chọn đƣợc một nguồn dữ liệu (EST) tốt cho nghiên cứu
۰ Thiết lập đƣợc phƣơng pháp để tìm kiếm microsatellite từ nguồn EST
۰ Thiết kế đƣợc những cặp primer dựa vào vùng bảo tồn hai bên những
loại microsatellite tìm đƣợc
Kết luận: Sự thành công của việc thiết kế primer đã làm cơ sở cho những bƣớc
nghiên cứu xa hơn về đặc điểm di truyền của các loài ong cho mật. Thành công này
mở ra một triển vọng cho việc ứng dụng lĩnh vực Bioinformatic hỗ trợ cho nghiên cứu
thực nghiệm, làm giảm đáng kể chi phí và đẩy nhanh tốc độ nghiên cứu thực nghiệm
tại Trung Tâm.
v
MỤC LỤC
CHƢƠNG TRANG
Trang tựa
Lời cảm tạ ……………………………………………………………………………..iii
Tóm tắt …………………………………...………….………………………………..iv
Mục lục …………………………………………………………………………..…….v
Danh sách các chữ viết tắt............................................................................................viii
Danh sách các bảng .......................................................................................................ix
Danh sách các hình .........................................................................................................x
1. MỞ ĐẦU ....................................................................................................................1
1.1. Đặt vấn đề...........................................................................................................1
1.2. Mục đích và yêu cầu nghiên cứu........................................................................2
1.2.1. Mục đích nghiên cứu .................................................................................2
1.2.2. Yêu cầu nghiên cứu ...................................................................................2
1.3. Giới hạn .............................................................................................................2
2. TỔNG QUAN TÀI LIỆU ...........................................................................................3
2.1. Giới thiệu chung về ong mật .............................................................................3
2.1.1. Cấu tạo cơ thể của ong mật........................................................................3
2.1.1.1. Hình thái cơ thể ................................................................................3
2.1.1.2. Các cơ quan bên trong ......................................................................6
2.1.2. Tổ chức của đàn ong ..................................................................................6
2.1.3. Yêu cầu dinh dƣỡng của ong .....................................................................7
2.1.4. Các sản phẩm của ong ...............................................................................7
2.1.4.1. Mật ong .............................................................................................7
2.1.4.2. Phấn hoa .................................................................................................7
2.1.4.3. Sữa ong chúa ..........................................................................................7
2.1.4.4. Sáp ong ..................................................................................................8
2.2. Nguồn gốc EST (Expressed Sequence Tags) ....................................................8
2.2.1. EST là gì? ..................................................................................................8
2.2.2. Phƣơng pháp tạo EST ................................................................................8
vi
2.3. Microsatellite là gì? .........................................................................................10
2.3.1. Các dạng microsatellite ...........................................................................10
2.3.2. Cơ chế hình thành microsatellite .............................................................11
2.3.3. Ứng dụng của microsatellite ....................................................................12
2.3.4. Marker phân tử (molecular markers) .......................................................13
2.3.5. Vì sao chọn marker microsatellite? .........................................................14
2.4. Ngôn ngữ lập trình Perl (Practical Extraction and Reporting Language) .............15
2.4.1. Nguồn gốc của Perl ......................................................................................15
2.4.2. Cấu trúc của Perl ..........................................................................................16
2.4.2.1. Dữ liệu vô hƣớng (scala data) ..............................................................16
2.4.2.2. Cấu trúc điều khiển ...............................................................................16
2.4.2.3. Các List, Array và Hash .......................................................................19
2.4.2.4. Dòng chƣơng trình và các thƣờng trình con .........................................19
2.4.2.5. Package và Module ..............................................................................20
2.5. Giới thiệu về mồi (primer) ....................................................................................21
2.5.1. Khái quát về mồi ..........................................................................................21
2.5.2. Đặc điểm của mồi .........................................................................................21
2.5.2.1. Tính chuyên biệt ...................................................................................21
2.5.2.2. Tính ổn định .........................................................................................22
2.5.2.3. Tính tƣơng thích ...................................................................................23
2.6. Tin sinh học ...........................................................................................................24
2.6.1. Khái niệm tin sinh học ..................................................................................24
2.6.2. Các lĩnh vực nghiên cứu chính của tin sinh học ...........................................24
2.6.2.1. Genomics - Hệ gen học ........................................................................24
2.6.2.2. Sinh học tiến hóa ..................................................................................26
2.6.2.3. Phân tích chức năng gen .......................................................................26
3. PHƢƠNG TIỆN VÀ PHƢƠNG PHÁP NGHIÊN CỨU .........................................29
3.1. Thời gian và địa điểm tiến hành nghiên cứu ...................................................29
3.1.1. Thời gian nghiên cứu ...............................................................................29
3.1.2. Địa điểm nghiên cứu ...............................................................................29
3.2. Vật liệu và công cụ nghiên cứu .......................................................................29
3.2.1. Vật liệu nghiên cứu .................................................................................29
vii
3.2.2. Công cụ nghiên cứu .................................................................................29
3.3. Phƣơng pháp tiến hành nghiên cứu .................................................................30
3.3.1. Quy trình nghiên cứu tổng quát ...............................................................30
3.3.2. Phƣơng pháp nghiên cứu .........................................................................31
3.3.2.1. Sơ đồ các bƣớc tiến hành nghiên cứu .............................................31
3.3.2.2. Các bƣớc tiến hành nghiên cứu chi tiết ..........................................32
4. KẾT QUẢ VÀ THẢO LUẬN ..................................................................................42
4.1. Kết quả tìm kiếm và tải trình tự EST về máy tính cá nhân .............................42
4.1.1. Kết quả tìm kiếm EST .............................................................................42
4.1.2. Kết quả tải trình tự EST về máy tính cá nhân .........................................43
4.2. Kết quả tìm và phân loại microsatellite ...........................................................44
4.2.1. Kết quả tìm microsatellite qua xử lý của EST_TRIMMER ....................44
4.2.2 Kết quả xử lý qua MISA ..........................................................................45
4.3. Kết quả thiết kế primer ....................................................................................49
4.3.1. Kết quả thiết kế primer qua 6 Script Perl ................................................49
4.3.2. Kết quả so sánh và chọn lọc primer đƣợc thiết kế ...................................56
5. KẾT LUẬN VÀ ĐỀ NGHỊ ......................................................................................59
5.1. Kết luận ...........................................................................................................59
5.1.1. Sơ đồ phƣơng pháp thực hiện ..................................................................59
5.1.2. Kết quả đạt đƣợc .....................................................................................60
5.2. Đề nghị ............................................................................................................60
6. TÀI LIỆU THAM KHẢO ........................................................................................61
7. PHỤ LỤC .................................................................................................................64
viii
DANH SÁCH CÁC CHỮ VIẾT TẮT
AFLP Amplified Fragment Length Polymorphism
ALP Amplified Length Polymorphism
AP-PCR Arbitrary Primer –Polymerase Chain Reaction
BLAST Basic Local Alignment Search Tools
CEB Computional Evolution Biology
DAF DNA Amplification Fringerprinting
DDBJ DNA Data Bank of Japan
EMBL the European Molecular Biology Laborary
EST Expressed Sequence Tags
NCBI the National Center for Biotechnology Information
MPSS Massively Parllel Signatur Sequencing
PCR Polymerase Chain Reaction
PDA Primer Design Assitant
PERL Practical Extraction and Reporting Language
RAPD Radom Aplified Polymorphic DNA
RFLP Restriction Fragment Length Polymorphism
SNP Single Nucleotide Polymorphism
SSCP Single Strand Conformation Polymorphism
SSR Simple Sequence Repeats
STS Sequence Tagged Sites
ix
DANH SÁCH CÁC BẢNG
BẢNG TRANG
Bảng 2.1. Tên gọi một số marker DNA ..................................................................13
Bảng 4.1. Kết quả xử lý qua MISA ........................................................................47
Bảng 4.2. Thành phần của các dạng microsatellite .................................................47
Bảng 4.3. Tỷ lệ phần trăm các dạng microsatellite .................................................48
Bảng 4.4. Phần trăm các loại microsatellite chiếm tỷ lệ cao ..................................48
Bảng 4.5. Kết quả primer của dạng dinucleotide SSR ............................................54
Bảng 4.6. Kết quả primer của dạng trinucleotide SSR ...........................................55
Bảng 4.7. Kết quả primer của dạng tetranucleotide SSR .......................................56
Bảng 4.8. Kết quả primer sau cùng của dạng dinucleotide SSR ............................57
Bảng 4.9. Kết Quả primer sau cùng của dạng tri/tetra-nucleotide SSR ..................57
Bảng 4.10. Trình bày loại SSR và mã số truy cập của EST ...................................58
x
DANH SÁCH CÁC HÌNH
HÌNH TRANG
Hình 2.1. Hình thái các loài ong cho mật .......................................................................3
Hình 2.2. Thể hiện ba phần chính của ong .....................................................................4
Hình 2.3. Hình thái phần đầu của con ong .....................................................................4
Hình 2.4. Hình thái phần ngực của con ong ...................................................................5
Hình 2.5. Hình thái phần bụng của con ong ...................................................................5
Hình 2.6. Sơ đồ nguồn gốc của EST ..............................................................................9
Hình 2.7. Cách thức tạo nên EST .................................................................................10
Hình 2.8. Cơ chế bắt chéo lỗi trong giảm phân ............................................................11
Hình 2.9. Cơ chế trƣợt lỗi trong quá trình sao mã ........................................................12
Hình 3.1. Trình bày qui trình nghiên cứu tổng quát .....................................................30
Hình 3.2. Các bƣớc tiến hành nghiên cứu chính ..........................................................31
Hình 3.3. Giao diện trên trang NCBI với từ khóa honeybee ........................................32
Hình 3.4. Cú pháp thực thi của EST_TRIMMER ........................................................35
Hình 3.5. Cú pháp thực thi của MISA ..........................................................................36
Hình 3.6. Giao diện của Primer3 ..................................................................................38
Hình 3.7. Giao diện của PrimerQuest ...........................................................................40
Hình 3.8. Giao diện của PDA .......................................................................................40
Hình 3.9. Giao diện của DNAClub ..............................................................................41
Hình 4.1. Kết quả tìm thấy EST trên NCBI .................................................................42
Hình 4.2. Kết quả download với tùy chọn có sẵn của NCBI .......................................43
Hình 4.3. Kết quả thực thi 4 tác vụ của EST_TRIMMER ...........................................45
Hình 4.4. File chứa kết quả trình tự EST đƣợc chọn ....................................................45
Hình 4.5. File định dạng FASTA .................................................................................45
Hình 4.6. Thể hiện kết quả thực thi của MISA ............................................................46
Hình 4.7. Kết quả của file new_ids170404 ..................................................................49
Hình 4.8. Kết quả trình diễn của ssrout170404 ............................................................50
Hình 4.9. Kết quả trình diễn của labdbout170404 ........................................................50
Hình 4.10. Xuất kết quả các thông số thiết lập từ script ..............................................51
Hình 4.11. Trình bày primer đƣợc thiết kế ...................................................................51
xi
Hình 4.12. Trình diễn của rescreened170404 ...............................................................52
Hình 4.13. Kết quả màn hình xử lý qua 4_ssr_blast ....................................................52
Hình 4.14. Thể hiện EST và primer sau cùng ..............................................................53
Hình 4.15. Trình bày primer đạt đƣợc sau cùng ...........................................................53
Hình 5.1. Qui trình nghiên cứu thiết kế primer ............................................................59
1
Phần 1
MỞ ĐẦU
1.1. Đặt vấn đề
Trong thế giới động vật, ong mật là loài thuộc lớp côn trùng. Chúng xuất hiện
cách đây 40 triệu năm vào thời kỳ Eocene. Ong mật có ở khắp nơi trên thế giới gồm
nhiều loài khác nhau. Mỗi loài có điều kiện môi trƣờng phát triển khác nhau và hiệu
quả sản xuất cũng khác nhau. Sản phẩm đƣợc làm ra bởi ong mật nhƣ phấn hoa, mật
ong, sáp ong, sữa ong chúa, keo ong, nọc ong là các loại thực phẩm dƣợc liệu độc đáo
có giá trị kinh tế cao. Ngoài ra, ong mật còn có tác động hữu ích đến nhiều loài động
vật và đặc biệt là tác động rất cần thiết trên thực vật đó là thụ phấn hoa.
Sự đa dạng và giá trị di truyền học của ong mật cần phải có phƣơng pháp để
định danh chính xác từng loài và dƣới loài (thứ). Điều này rất cần thiết, nó có tác động
quyết định đến hiệu quả kinh tế trong nghề nuôi ong nói riêng và ý nghĩa về bảo vệ đa
dang sinh học nói chung. Công việc này sẽ phục vụ đắc lực trong việc tuyển chọn
đƣợc loài ong phù hợp nhất cho nghề nuôi ong ở từng vùng địa lý riêng (nhƣ nguồn
mật hoa, thời tiết…), đảm bảo bảo vệ “thuần khiết” đặc điểm di truyền ban đầu của
mỗi loài ong.
Hiện nay, marker microsatellite là một chọn lựa tốt trong việc phân tích sự đa
dạng di truyền, lập bản đồ di truyền, nhận biết giữa các loài và các cá thể trong một
loài. Dựa trên nguồn dữ liệu EST (Expressed Sequence Tags) chúng ta có thể tìm ra
đƣơc những vị trí microsatellite có ở trên các EST một cách nhanh chóng nhờ vào lĩnh
vực nghiên cứu gọi là tin sinh học (bioinformatics).
Việc ứng dụng bioinformatic sẽ làm cho công việc nghiên cứu trở nên dễ dàng
và chính xác hơn rất nhiều. Bioinformatic là một lĩnh vực khoa học sử dụng các công
nghệ của các ngành toán học ứng dụng, tin học, thống kê và khoa học máy tính để giải
quyết các vấn đề sinh học.
Trên cơ sở đó tôi tiến hành thực hiện đề tài:
“Khai thác dữ liệu EST (Expressed Sequence Tags) nhằm phát hiện
microsatellite phục vụ cho công tác so sánh và phân tích đặc điểm di truyền của
ong mật”
2
Đề tài đƣợc thực hiện dƣới sự hƣớng dẫn của TS. Bùi Minh Trí. Đối tƣợng
nghiên cứu là các loài ong cho mật.
1.2. Mục đích và yêu cầu nghiên cứu
1.2.1. Mục đích nghiên cứu
- Xây dựng đƣợc phƣơng pháp nhận diện marker microsatellite từ dữ liệu EST
có tìm thấy microsatellite của các loài ong cho mật.
- Thiết kế đƣợc primer từ hai vùng bảo tồn của microsatellite cho việc chạy
phản ứng PCR (Polymerase Chain Reaction) khuếch đại trình tự microsatellite đặc
trƣng nhất.
- So sánh lựa chọn, thiết kế đƣợc các công cụ tin học phù hợp nhất cho công
việc nghiên cứu.
1.2.2. Yêu cầu
- Tập hợp đƣợc toàn bộ và nhanh nhất dữ liệu EST hiện có của các loài ong mật
để cho xác suất tìm thấy microsatellite là lớn nhất.
- Phải có phƣơng pháp nhanh nhất trong việc xác định và phân loại
microsatellite có trong các EST.
- Xây dựng đƣợc một qui trình trong nghiên cứu về thiết kế mồi (primer) để
thực hiện phản ứng PCR khuyếch đại microsatellite đặc trƣng có trong EST.
- Mồi đƣợc thiết kế phải đảm bảo nghiêm ngặt về tiêu chuẩn các thông số kỹ
thuật và tính đại diện cao, đảm bảo cho việc chạy phản ứng PCR có đƣợc kết quả tốt.
1.3. Giới hạn
- Đề tài chỉ thực hiện trên loài ong mật.
- Chỉ tiến hành thiết kế mồi và khảo sát toàn bộ qui trình trên lý thuyết mà chƣa
đƣợc tiến hành kiểm tra lại bằng thực nghiệm.
- Năng lực và thời gian có giới hạn nên việc nghiên cứu sẽ có những hạn chế
nhất định.
3
Phần 2
TỔNG QUAN TÀI LIỆU
2.1. Giới thiệu chung về ong mật
Trong thế giới động vật, ong mật thuộc ngành chân đốt (Athropoda), lớp côn
trùng (Insecta), bộ cánh màng (Hymenoptera), họ ong mật (Apisdae), giống ong mật
(Apis). Ong mật xuất hiện cách đây khoảng 40 triệu năm đƣợc tìm thấy trong mẫu hóa
thạch vào thời kỳ Eocene (Mark L. Winston, 1987).
Trên thế giới có 7 loài ong cho mật, ở Việt Nam có 4 loài chính:
1. Apis mellifera: Ong Ý
2. Apis cerena: Ong ruồi
3. Apis dorsata: Ong khoái hay ong gác kèo
4. Apis florae: Ong muỗi
Trong đó hai loài Apis mellifera và Apis cerena có giá trị kinh tế cao, đang
đƣợc nuôi rộng rãi. Hai loài còn lại chỉ đƣợc khai thác tự nhiên.
2.1.1. Cấu tạo cơ thể của ong mật
2.1.1.1. Hình thái cơ thể
Hình 2.1. Hình thái các loài ong cho mật
Ong có bộ vỏ bao ngoài đƣợc cấu tạo bởi chất chitin có vai trò nhƣ
khung xƣơng ngoài nâng đỡ các cơ quan bên trong và chống lại các nhân tố bất
lợi bên ngoài. Cơ thể ong gồm ba phần khớp động với nhau: đầu, ngực và bụng.
Trong quá trình phát triển cơ thể ong phải trải qua những lần lột xác.
4
Hình 2.2. Thể hiện 3 phần chính của ong
Phần đầu
Hình 2.3. Hình thái phần đầu của con ong
Đầu con ong có cấu tạo hình hộp, trên đầu có hai mắt kép. Đỉnh đầu có
ba mắt đơn phân bố dạng tam giác. Trƣớc đầu có một đôi râu có nhiều đốt (râu
ong đực có 12 đốt, râu ong chúa và ong thợ có 11 đốt), râu của ong là cơ quan
xúc giác rất nhạy.
Miệng và vòi ong có đặc điểm khác với những loài côn trùng khác có
chức năng cắn, nghiền, hút. Ong dùng hàm trên cắn vật cứng, nghiền phấn
hoa… Vòi hút của ong đặc trƣng cho từng giống, ong dùng vòi hút để hút mật
hoa, sirô, nƣớc.
Phần ngực
Ngực gồm 3 đốt: đốt ngực trƣớc, đốt ngực giữa và đốt ngực sau. Phần
ngực mang các cơ quan vận động là cánh và chân ong. Các đốt ngực đƣợc chia
ra nửa lƣng và nửa bụng.
Ngực gồm 3 đốt: đốt ngực trƣớc, đốt ngực giữa và đốt ngực sau. Phần
ngực mang các cơ quan vận động là cánh và chân ong. Các đốt ngực đƣợc chia
ra nửa lƣng và nửa bụng.
5
Hình 2.4. Hình thái phần ngực của con ong
Nửa lƣng có 2 đôi cánh: đôi cánh trƣớc lớn hơn đôi cánh sau, khi ong
bay đôi cánh trƣớc móc lại với đôi cánh sau thông qua hệ thống móc cánh. Nửa
bụng của phần ngực có 3 đôi chân gắn vào 3 đốt ngực tƣơng ứng.
Phần bụng
Hình 2.5. Hình thái phần bụng của con ong
Bụng ong có 6 đốt và nối với phần ngực qua đốt chuyển tiếp. Mỗi đốt gồm hai
nửa: nửa lƣng và nửa bụng, các đốt bụng nối với nhau bằng màng kitin mỏng và đàn
hồi (nhờ màng này ong có thể thay đổi thể tích bụng), hai bên mỗi đốt bụng có lỗ thở.
Ở phần bụng của 4 đốt bụng cuối cùng có cơ quan tiết sáp, cuối bụng có ngòi
đốt (ong đực không có ngòi đốt, ong chúa trƣởng thành thì ngòi đốt có tác dụng nhƣ
một máng đẻ trứng và là một vũ khi đánh nhau với các con ong chúa khác).
Giữa đốt bụng thứ 5 và thứ 6 của ong có tuyến Naxonop tiết ra mùi đặc trƣng
cho đàn ong (ở ong chúa tuyến này phát triển mạnh và tiết ra mùi đặc trƣng gọi là chất
chúa để điều khiển hoạt động bìng thƣờng của đàn ong).
6
2.1.1.2. Các cơ quan bên trong
Cơ quan tiêu hóa
Ong mật thuộc vào các côn trùng ding dƣỡng chuyên tính, cơ quan tiêu
hóa còn là nơi dự trữ tạm thời mật khi thu và chuyển về tổ.
Cơ quan hô hấp
Gồm hai lỗ thở, hệ thống khí quản phân nhiều nhánh, các túi khí và hệ
thống mao quản trao đổi khí với các tế bào, mô trong cơ thể.
Cơ quan tuần hoàn
Hệ thống tuần hoàn của ong là hệ thống mở, tim gồm 5 ngăn, hai bên
sƣờn của mỗi ngăn có các cửa để máu lƣu thông.
Cơ quan thần kinh
Cơ quan thần kinh của ong mật phát triển cao, bảo đảm mối liên hệ của
đàn ong với môi trƣờng xung quanh, điều khiển mọi hoạt động thống nhất trong
cơ thể ong. Cơ quan thần kinh của ong chia làm ba phần: thần kinh trung ƣơng,
thần kinh ngoại biên, thần kinh thực vật.
Cơ quan sinh dục
Cơ quan sinh dục của ong chúa gồm hai buồn trứng hình quả lê, mỗi
buồn trứng có rất nhiều ống dẫn trứng nằm song song với nhau.
Cơ quan sinh dục của ong thợ về cấu tạo giống nhƣ cơ quan sinh dục của
ong chúa, nhƣng không đƣợc phát triển hoàn chỉnh, hai buồn trứng ong thợ có
dạng dải.
Cơ quan sinh dục của ong đực gồm hai đôi dịch hoàn: ống dẫn tinh,
tuyến phụ và bộ phận giao phối.
2.1.2. Tổ chức của đàn ong
Đàn ong là một tổ chức phức tạp gồm hàng nghìn con liên kết với nhau
thành một đơn vị thống nhất bằng quá trình trao đổi chất. Nhờ có sự thống nhất
giữa các cá thể, đàn ong có thể giữ đƣợc nhiệt độ tối ƣu trong tổ, thu đƣợc
nhiều mật và phấn hoa, bảo vệ tổ chống kẻ thù và phát triển. Mỗi đàn ong có
những đặc điểm cá thể riêng: mùi đặc thù, khả năng khai thác mật và tiết sáp,
khả năng chia đàn, sức chống bệnh truyền nhiễm…
7
Đàn ong chỉ sống và phát triển khi có đủ các thành phần. Mỗi cá thể
trong đàn (ong chúa, ong thợ, ong đực) thực hiện một chức năng nhất định theo
hƣớng bảo tồn và kéo dài cuộc sống của cả đàn.
Ong chúa: ong chúa làm nhiệm vụ đẻ trứng
Ong thợ: ong thợ làm nhiệm vụ nuôi ấu trùng, lấy mật và phấn hoa, xây
bánh tổ, điều chỉnh nhiệt độ, làm sạch tổ, bảo vệ tổ, chăm sóc ong chúa…
Ong đực: nhiệm vụ của ong đực là giao phối với ong chúa tơ
2.1.3. Yêu cầu dinh dƣỡng của ong
Khẩu phần ăn tự nhiên của ong mật trƣởng thành phải có: protein (amino
acid), carbonhydrate (đƣờng), lipid (acid béo, sterol), vitamin, chất khoáng
(muối), nƣớc. Những nguồn dinh dƣỡng này trong khẩu phần ăn phải đƣợc xác
định rõ tỉ lệ về số lƣợng và chất lƣợng để đạt đƣợc mức dinh dƣỡng cao nhất.
2.1.4. Các sản phẩm của ong mật
2.1.4.1. Mật ong
Thành phần mật ong có trên 65% dạng đƣờng khử gồm glucose và
fructose, còn saccharose ít, chỉ có khoảng 5%. Ngoài ra trong quá trình luyện
mật hoa, con ong còn tiết ra một số acid hữu cơ có tác dụng làm cho đƣờng
trong mật ong không bị lên men.
2.1.4.2. Phấn hoa
Phấn hoa là sản phẩm giàu dinh dƣỡng đƣợc ong thu từ nhị hoa của các
loài hoa khác nhau để làm thức ăn cho chúng. Phấn hoa chứa 30 – 35% protein,
trong đó 10% là acid amin tự do, các enzyme, vitamin… (phấn hoa chứa 21
acid amin cần thiết cho cơ thể, trong đó có 10 acid amin không thay thế).
Dùng phấn hoa có tác dụng tốt cho cơ thể, tăng cƣờng sức khỏe vì phấn
hoa có nhiều chất dinh dƣỡng dễ hấp thụ…
2.1.4.3. Sữa ong chúa
Sữa ong chúa (tên gọi có nguồn gốc lịch sử) là nguồn dinh dƣỡng cao
cấp, là sản phẩm đặc biệt. Nó là nguồn thức ăn duy nhất để nuôi ong chúa và ấu
8
trùng của ong chúa do ong thợ non tiết ra. Sữa ong chúa có thành phần dinh
dƣỡng nhƣ sau: protein (18%), lipid (6,46%), các vitamin, chất khô (39,95%),
tro (0,83%).
Sữa ong chúa kích thích quá trình trao đổi lipid và protein giúp cơ thể
khỏe mạnh. Sữa ong chúa giàu hormon, vitamin E có tác dụng kích thích sinh lý,
tái tạo tế bào, chống sự già cỗi của các hệ thống tế bào. Sữa ong chúa dùng để
chữa các bệnh đƣờng tiêu hóa, gan, thận, nâng cao sức đề kháng với các bệnh
truyền nhiễm.
2.1.4.4. Sáp ong
Sáp ong là dẫn xuất của acid béo no và không no có phân tử lƣợng lớn,
các acid tự do và rƣợu gồm 50 hợp chất, 75% là este, carbonhydrate 12 – 15%,
acid béo tự do 13 – 15%.
Ngoài ra còn có nọc ong và keo ong là những sản phẩm dƣợc liệu thiên
nhiên có giá trị cao do ong mật tạo ra.
2.2. Nguồn gốc EST (Expressed Sequence Tags)
2.2.1. EST là gì?
EST là một phần nhỏ của trình tự DNA (thƣờng dài từ 200 – 500 nucleotide)
đƣợc tạo ra từ một hoặc cả hai đầu của một gen biểu hiện (từ đầu 5‟ hay 3‟ của cDNA).
Gồm có 5‟EST và 3‟EST
5‟ EST đƣợc tạo ra từ một phần đầu 5‟ của cDNA, có khuynh hƣớng bảo
tồn giữa các loài và không thay đổi nhiều trong một họ gen.
3‟ EST đƣợc tạo ra từ một phần đầu 3‟ của cDNA, dạng này có thể sẽ rơi
vào vùng không mã hoá (non-coding) hay vùng không dịch mã
(Untranslated Regions, UTRs). Do đó khuynh hƣớng bảo tồn giữa các
loài thấp hơn những trình tự mã hóa.
Một Expressed Sequence Tag (EST) có thể sử dụng giúp cho việc xác đinh
những gen chƣa biết và lập bản đồ của chúng trong một bộ gen (genome).
9
2.2.2 Phƣơng pháp tạo EST
Sơ đồ nguồn gốc của EST
Hình 2.6. Sơ đồ nguồn gốc của EST
Sử dụng mRNA để tạo cDNA
cDNA là gì?
cDNA là một dạng của DNA đƣợc tạo ra trong các phòng thí nghiệm, sử
dụng một loại enzyme gọi là reverse transcriptase. Tạo cDNA đi ngƣợc với tiến
trình bình thƣờng của sự sao mã trong tế bào. Bởi vì, ngƣời sản xuất sử dụng
mRNA làm khuôn (template) chứ không phải DNA. Không giống nhƣ DNA
của bộ gen, cDNA chỉ chứa exon hay gen biểu hiện.
mRNA là một chìa khóa để tìm thấy những gen biểu hiện trong bộ gen.
Tuy nhiên, mRNA không bền vững ở bên ngoài tế bào. Do đó, các nhà khoa
học đã sử dụng một loại enzyme đặc biệt để biến đổi nó thành dạng DNA
(cDNA) bổ sung (complementary DNA). cDNA có cấu tạo bền vững hơn rất
nhiều so với mRNA. Vì đƣợc tạo ra từ mRNA, các intron đã đƣợc bị loại bỏ
nên cDNA chỉ đại diện cho những trình tự DNA biểu hiện.
Từ cDNA đến EST
Một cDNA đại diện cho một gen biểu hiện đƣợc phân lập, sau đó các
nhà khoa học có thể giải trình tự từ hai đầu của phân tử này thƣờng khoảng 100
đến vài trăm nucleotide (khoảng 500 nucleotide) để tạo ra hai loại EST. Đó có
thể là 5‟EST và 3‟EST.
10
Hình 2.7. Cách thức tạo nên EST
2.3. Microsatellite là gì?
Microsatellite là trình tự đơn lặp lại (Simple Sequence Repeats - SSR) từ 1 – 10
nucleotide. Chúng xuất hiện khắp trong các loài sinh vật bậc cao, mặc dù tần số xuất
hiện của SSR có sự biến đổi giữa các loài. SSR rất phong phú, nằm rải rác khắp nơi
trong bộ gen và cho thấy mức độ đa hình cao hơn so với các marker di truyền khác.
Những đặc điểm này, kết hợp lại làm cho SSR đƣợc xác định một cách dễ dàng, chúng
đƣợc sử dụng làm marker phân tử. Khả năng tự thừa kế của SSR trong những tính
trạng trội, đó là những thuận lợi mà chúng có đƣợc khi so sánh với các loại marker
phân tử khác. SSR gần đây đã trở thành marker di truyền quan trọng, đặc biệt là với
các loài ngũ cốc nhƣ lúa mì và lúa mạch.
2.3.1. Các dạng microsatellite
Dạng mononucleotide SSR là dạng chỉ có 1 loại base trong trình tự lặp lại. Ví dụ
nhƣ AAAAAAAAAA
Dạng dinucleotide SSR là dạng trong trình tự lặp lại có 2 loại base. Ví dụ nhƣ
GTGTGTGTGTGT
Dạng trinucleotide SSR là dạng có đến 3 loại base trong trình tự lặp lại. Ví dụ
nhƣ ATGATGATGATGATG
Dạng tetranucleotide SSR là dạng có tới 4 loại base trong trình tự lặp lại. Ví dụ
nhƣ ACGTACGTACGTACGT
11
Dạng trinucleotide xuất hiện ít hơn dạng dinucleotide tới 10 lần, dạng
tetranucleotide thì ít hơn dạng trinucleotide (Ma và ctv., 1996)
Sự lặp lại của polyA/T là rất phổ biến ở các loài. Tuy nhiên, sự phân bố giữa
các loài rất khác nhau. Dạng này thƣờng không ổn định vì vậy trong phân tích di
truyền và lập bản đồ di truyền… là không phù hợp.
Dạng CA/GT thƣờng gặp trong các loài có vú, gấp đôi dạng AT và gấp 3 dạng
AG/CT. Ở thực vật dạng thƣờng gặp là AA/TT và AT/TA. Chúng có thể đƣợc phần
thành ba dạng, sau đây là 3 ví dụ cụ thể:
Dạng liên tục: ATATATATATATAT
Dạng kết hợp: GCGCGCGC TATATA
Dạng ngắt quảng: CACACACA TGCT CACACACA
Loại đa hình cao nhất là dạng không bị ngắt quãng. Tuy nhiên, trong thực tế
dạng kêt hợp và ngắt quãng đƣợc tìm thấy nhiều hơn.
2.3.2. Cơ chế hình thành microsatellite
Cơ chế đột biến hình thành microsatellite vẫn chƣa đƣợc hiểu biết một cách đầy
đủ. Tuy nhiên, di truyền học và các nghiên cứu khác cho rằng cơ chế xuất hiện và hình
thành microsatellite là do 2 quá trình sau:
Quá trình bắt chéo lỗi trong quá trình giảm phân ( unequal crossing- over
during meiosis)
.
Hình 2.8. Cơ chế bắt chéo lỗi trong giảm phân
12
Quá trình trƣợt lỗi trong sao mã (replication slippage)
Đây đƣợc coi là nguyên nhân chủ yếu và nó xảy ra trên mạch chậm (lagging
strand). Quá trình này liên quan đến quá trình trƣợt lỗi của enzyme polymerase trên
phân tử DNA mới tổng hợp. Sự trƣợt lỗi này tạo ra một chỗ phình nhất thời có thể bị
loại bỏ trong quá trình sửa lỗi hoặc là có thể kéo dài thêm ở mạch đối diện tạo thành
một đoạn lặp lại dài hơn.
Hình 2.9 . Cơ chế trƣợt lỗi trong quá trình sao mã
2.3.3. Ứng dụng của microsatellite
SSR đƣợc sử dụng để lập bản đồ di truyền. Chúng dễ dàng sử dụng và chứa
đựng thông tin cao có thể thay thế tốt cho RFLP trong kỹ thuật lập bản đồ di truyền ở
ngƣời (Dib và ctv., 1996). Sự phát triển SSR trong thực vật là rất nhanh, và vị trí SSR
hiện giờ đƣợc hợp nhất để thành lập bản đồ di truyền của tất cả các loài ngũ cốc (Liu
và ctv., 1996; Korzun và ctv., 1997; Smith và ctv., 1997; Stephenson và ctv., 1998).
SSR có thể đƣợc sử dụng trong công tác phân tích và so sánh đặc điểm di
truyền của các loài. Sự đa hình của SSR đƣợc xác định bằng phƣơng pháp PCR với
13
mồi đƣợc thiết kế ở vùng bảo tồn hai bên SSR (flanking regions) trên cơ sở sự khác
nhau về kích thƣớc của các băng khi điện di của trình tự lặp lại.
2.3.4. Marker phân tử (molecular marker)
Chỉ thị phân tử là những đặc điểm thể hiện ở khía cạnh hoá học hay cấu trúc
phân tử di truyền lại cho đời sau, giống nhƣ các nhân tố di truyền Meldel, nhƣng lại có
thể định lƣợng đƣợc. Về nguyên tắc, bất cứ đoạn DNA nào phân biệt đƣợc hai cá thể,
hai dòng hoặc các giống khác nhau thì có thể xem nhƣ là một marker DNA. Marker
DNA có nhiều ƣu điểm hơn so với marker hình thái và isozyme vì sản phẩm thể hiện
tính đa hình cao, tính đồng trội, tính ổn định không phụ thuộc vào yếu tố môi trƣờng.
Các chỉ thị di truyền phân tử đƣợc sử dụng để xác định mối quan hệ giữa các cá thể
trong cùng một loài hoặc giữa các loài, là cơ sở cho việc phân loại dƣới loài (thứ), phát
hiện loài mới và mối quan hệ tiến hóa giữa loài (Ahn và ctv, 1993; Dunforal và ctv,
1995). Chúng có thể đƣợc dùng để chọn các tổ hợp lai (Nair và ctv, 1995; Zhang và
ctv, 1995).
Các chỉ thị DNA có thể chia thành 2 nhóm sau (Bùi Chí Bửu và Nguyễn Thị
Lang, 2004):
- Chỉ thị dựa trên cơ sở chuỗi phản ứng polymerase (PCR - Polymerase Chain
Reaction) (PCR-based): có các RAPD, AFLP, SSR, SSCP, STS
- Chỉ thị trên cơ sở đánh dấu thăm dò và lai DNA (DNA / DNA hydridization-based):
RFLP, minisatellite.
Bảng 2.1. Tên gọi một số marker DNA
Chỉ thị (marker) Tên đầy đủ
RAPD Random amplified polymorphic DNA
AP-PCR Arbitrary primer-PCR
DAF DNA amplification fingerprinting
AFLP Amplified fragment length polymorphism
ALP Amplicon length polymorphism
SSR Simple sequence repeat (microsatellite)
SSCP Single strand conformation polymorphism
RFLP Restriction fragment length polymorphism
14
STS Sequence-tagged sites
Chọn giống nhờ chỉ thị phân tử là một chiến lƣợc đƣợc thế giới ủng hộ từ năm
1995, là phƣơng pháp tác động mạnh đến hiệu quả chọn giống với các marker có kết
quả kỹ thuật cao trên cơ sở PCR để đánh giá kiểu gen của tính trạng mục tiêu. Sau khi
đánh giá kiểu gen chúng ta so sánh với đánh giá kiểu hình để tìm ra mức độ chính xác
của phƣơng pháp (Bùi Chí Bửu, 2002).
2.3.5. Vì sao chọn marker SSR?
Hiện nay marker SSR là một công cụ mạnh (powerful tool) đƣợc ứng dụng rộng
rải trong việc lập bản đồ bộ gen của các loài; phân tích đặc điểm di truyền của các loài,
dƣới loài và các cá thể trong một loài phục vụ có hiệu quả cho công tác chọn giống
trong chăn nuôi và trồng trọt; tìm hiểu về nguồn gốc và phân lập các gen gây bệnh (các
gen có liên quan đến bệnh Alzheimer, ung thƣ ruột kết và nhiều bệnh khác) từ đó
nghiên cứu ra phƣơng pháp điều trị.
Marker SSR có các ƣu điểm nổi bật sau
Di truyền đa allen và đồng trội
Có tính chỉ thị cao (non- abundant)
Có ở tận hai đầu của bộ gen (tính chỉ thị rộng)
Marker RAPD thì dễ dàng phát triển nhƣng giới hạn trong nhiều mục đích ứng
dụng (Haymer 1994). Microsatillite (Simple Sequence Repeats, SSRs) có độ đa hình
cao, marker đồng trội, hiệu quả này đã đƣợc chứng minh qua nhiều mục đích ứng dụng
bao gồm kỹ thuật finger-printing (Smith và Devey, 1994), nghiên cứu di truyền quần
thể (Haymer 1994; Tsumura và ctv, 1996; Thomas và ctv, 1999), kiểm tra sƣ phân bố
di truyền cho đời sau (Dow và ctv, 1995), kiểm tra sự thuần hóa (Morchen và ctv,
1996).
SSR dễ dàng sử dụng hơn sự đa hình chiều dài đoạn cắt giới hạn (Restriction
Fragment Length Polymorphisms, RFLPs) chỉ giải quyết đƣợc số lƣợng nhỏ DNA, sự
đa hình cao và khả năng phân tích nhanh. Marker SSR có thể dễ dàng thay đổi giữa
15
các nhà khoa học bởi vì mỗi locus đƣợc xác định bởi trình tự mồi riêng. SSR phân tích
nhanh hơn sự khuyếch đại đa hình ngẫu nhiên DNA (Random Amplified Polymorphic
DNA, RAPD) và sự chuyển đổi tốt hơn AFLP. SSR hiện giờ thay thế cho RFLP trong
lập bản đồ di truyền các cây trồng nông nghiệp. Sự kết hợp của SSR với AFLP tạo nên
bản đồ di truyền chi tiết. Sự đồng trội tự nhiên của SSR cũng là điểm mạnh trong lập
bản đồ di truyền.
2.4. Ngôn ngữ lập trình Perl (Practical Extraction and Reporting
Language)
2.4.1. Nguồn gốc của Perl
Trƣớc khi Java hay JavaScript chiếm lĩnh Internet, và thậm chí trƣớc khi Web
xuất hiện, Perl đã có một vai trò rất quan trọng. Từ viêc tự động hóa các tác vụ quản lý
UNIX cho đến việc thực hiện thƣờng trình phân tích file, Perl đƣợc sử dụng nhƣ một
ngôn ngữ tiện ích thực sự.
Vào ngày 18 tháng 10 năm 1987, Larry Wall, tác giả của ngôn ngữ này, lần đầu
tiên đƣa Perl vào sử dụng tại nhóm usenet comp.sourse. Ngôn ngữ mới này phát sinh
từ ngôn ngữ lập trình C và bị ảnh hƣởng bởi các ngôn ngữ khác nhƣ BASIC, awk, sed,
và UNIX shell. Perl là sự kết hợp các ƣu điểm của những ngôn ngữ trên.
Những ngƣời có ít hay không có kinh nghiệm lập trình đều có thể học và sử
dụng Perl để lập trình một cách dễ dàng. Ngoài việc dễ dàng học, Perl còn là một ngôn
ngữ hữu dụng. Ngay từ đầu, Perl đã có một khả năng rất lớn trong việc thao tác text,
file, và các tiến trình hệ thống.
Từ lúc khai sinh đến nay, Perl đã có nhiều phiên bản, sau Perl 1.0 là Perl
2.0, …Perl 5.6. Perl 5.6 xuất hiện vào tháng 3 năm 2000. Bênh cạnh một cú pháp mới
đƣợc dùng để diễn dịch và khai báo các thuộc tính thƣờng trình phụ, Perl 5.6 còn bổ
sung khá nhiều đặc tính nhỏ mà những ngƣời lập trình yêu cầu vốn không có trong các
phiên bản trƣớc. Các đặc tính này bao gồm:
Hỗ trợ Unicode và UTF-8
Hỗ trợ 64 bit
Hỗ trợ các file lớn hơn 2GB
16
Có nhiều khả năng chẩn đoán hơn
Các loại cảnh báo theo phạm vi từ vựng
Hàm open có thêm một số đối số
Hàm pack đƣợc cải tiến thêm
2.4.2. Cấu trúc của Perl
2.4.2.1. Dữ liệu vô hƣớng (scalar data)
Dữ liệu vô hƣớng (scalar data) ám chỉ một kiểu dữ liệu duy nhất gồm số
và chuỗi. Đây là kiểu dữ liệu cơ bản nhất mà Perl đã quen xử lý. Biến vô hƣớng
phải đƣợc đặt tên với ký tự “$”.
Các số
Theo quan điểm của ngƣời sử dụng, thƣờng có hai dạng khác nhau. Kiểu
số thứ nhất là một interger, tức là một số nguyên. Các số nguyên này đƣợc trình
bày với các cơ số 10. Kiểu thứ hai là số thập phân. Ngoài ra còn có hai kiểu số
đặc biệt khác là các số bách phân và thập lục phân. Các số bách phân đƣợc trình
bày với cơ số 8 và các số thập lục phân với các chữ số cơ số 16.
Các chuỗi
Một chuỗi là một loạt các ký tự liên tiếp. Một chuỗi có thể đƣợc tạo
thành bởi bất kỳ tổ hợp ký tự nào từ bộ 256 ký tự.
Chuỗi có hai dạng khác nhau, gồm chuỗi có dấu trích dẫn đơn và chuỗi
có dấu trích dẫn kép.
Khi viết một chƣơng trình cần phải lƣu một số các dữ liệu vô hƣớng cho
nhiều muc đích lập trình khác nhau. Và nó sẽ đƣợc lƣu vào các biến vô hƣớng
(scalar variable). Một biến vô hƣớng có thể đƣợc xem nhƣ là một thùng chứa.
Ngƣời lập trình có thể đặt một giá trị vô hƣớng vào thùng này và lấy nó ra bất
kỳ lúc nào khi cần nó. Ngƣời lập trình có thể thay đổi những gì họ có trong
thùng chứa vào bất kỳ lúc nào trong khi một chƣơng trình đang thực thi.
2.4.2.2. Cấu trúc điều khiển
17
Cấu trúc điều khiển là tập hợp các câu lệnh điều kiện. Các câu lệnh điều
kiện đƣợc sử dụng trong ngôn ngữ lập trình khi một quyết định cần đƣợc thực
hiện trƣớc khi một phần mã đƣợc thƣc thi.
Các khối câu lệnh
Một khối lệnh là một chuỗi các câu lệnh thƣc thi đƣợc đƣợc nhóm lại với
nhau bằng các dấu ngoặc „{„ và „}‟. Một khối lệnh trong một chƣơng trình
trông giống nhƣ thế này:
{
$a = 12;
$a + = 5;
print “a equals $a\n”}
Câu lệnh điều kiện if-then-else
Câu lệnh điều kiện if-then-else nhận một biểu thức và đánh giá nó với
một giá trị là đúng/sai. Nếu việc xác định của một biểu thức là giá trị đúng, khối
lệnh cho phần câu lệnh then đƣợc thực thi. Nếu phần xác định của biểu thức là
sai, khối lệnh else sẽ đƣợc thực thi. Cú pháp của câu lệnh điều kiện if-then-else
nhƣ sau:
if ( biểu thức) ví dụ:
{ #!/usr/bin/perl
khối lệnh „then‟ $a = 20;
} if($a =15){print “a is equal to 15.\n”;}
else else{print “a is not equal to 15.\n”;}
{
khối lệnh „else‟
}
Việc bỏ đi phần else của câu lệnh này là hoàn toàn hợp lệ nếu chúng ta
không cần nó. Dƣới đây là cú pháp câu lệnh if-then mà không có else.
If (biểu thức)
{
khối lệnh „then‟
}
Việc có một khối lệnh else mà không có khối lệnh if trƣớc đó là không
hợp lệ trong Perl.
Câu lệnh điều kiện while
18
Câu lệnh điều kiện while là một câu điều kiện hữu ích bởi vì nó cho phép
ngƣời lập trình lặp lại một khối lệnh bao nhiêu lần tùy ý. Lệnh while hoạt động
giống nhƣ câu lệnh điều kiện if-then-else ở chỗ xác định một biểu thức cho
việc đánh giá đúng/sai. Một khác biệt lớn là nó tiếp tục thực thi khối lệnh khi
biểu thức là đúng. Dƣới đây là cú pháp cho câu lệnh điều kiện while.
While (biểu thức) ví dụ: #!/usr/bin/perl
{ $a = 15;
khối lệnh „while‟ while ($a<25) {
} print“$a is still less than 25\n”;}
Câu lệnh điều kiện until
Câu lệnh điều kiện until ngƣợc với câu lệnh while. Khối lệnh until chỉ
thực thi khi biểu thức xác định là sai. Dƣới đây là cú pháp cho câu lệnh điều
kiện until.
until (biểu thức) ví dụ: #!/usr/bin/perl
{ $a = 15;
khối lệnh „until‟ } until ($a >25) { print “the
value of is $a \n”; $a; }
Câu lệnh điều kiện do while-until
Trong một số trƣớng hợp, ngƣời lập trình có thể cần khối lệnh phải đƣợc
thực thi ít nhất một lần. Perl cho phép ngƣời lập trình thực hiện điều này bằng
cách sử dụng câu lệnh điều kiện do while-until. Câu lệnh có cú pháp nhƣ sau:
do
{
khối lệnh „do‟
} until (biểu thức)
Câu lệnh điều kiện do while–until cho phép bạn thƣc thi khối lệnh ít nhất
một lần, bất kể biểu thức xác định nhƣ thế nào (đúng hay sai).
Ví dụ
#!/usr/bin/perl
$a = 12;
do {
print “ the statement block has been excuted \n”;
while ($a < 10)
Câu lệnh điều kiện for
19
Câu lệnh for đƣợc sử dụng rộng rãi bởi các nhà lập trình trong tất cả các
ngôn ngữ. Lý do của điều này là câu lệnh for cung cấp cho ngƣời lập trình một
phƣơng pháp nhanh chóng xác định số lần mà một khối lệnh đƣợc thực thi. Cú
pháp câu lệnh điều kiện for nhƣ sau.
For (câu lệnh 1;biểu thức điều kiện; câu lệnh 2)
{
khối lệnh „for‟
}
Ví dụ
#!/usr/bin/perl
for ($a=1;$a<10;$a++){# the for conditional statement
print “the statement block has been executed $a times \n”;}
2.4.2.3. Các List, Array và Hash
Danh sách (list)
Danh sách là một nhóm dữ liệu vô hƣớng sắp xếp theo thứ tự, nó là một
chuỗi các giá trị vô hƣớng đƣợc đặt trong các dấu ngoặc đơn, nó có dạng: (1, 2,
3, 6, 7, 12); (1, 2, “hello”, 3, 6 , “again”); (4, 5, “$name”, 7, 10).
Các Array
Một biến mảng (array variable) giống nhƣ một biến vô hƣớng trong đó
nó đƣợc tạo ra để lƣu trữ dữ liệu. Sự khác biệt là biến mảng đƣợc thiết kế để lƣu
trữ một danh sách trong khi một biến vô hƣớng đƣợc thiết kế để lƣu trữ một dữ
liệu vô hƣớng số ít. Biến mảng đƣợc biểu thị bằng ký tự @ đầu tiên
(@number).
Các hash (băm)
Một hash là một biến khác mà ngƣời lập trình có thể sử dụng để lƣu trữ
dữ liệu vô hƣớng. Đối với các array, phần tử đâu tiên có một index là 0, phần tử
thứ hai có một index là 1,… Mỗi trong các phần tử đƣợc chứa trong một hash
có những gì đƣợc gọi là các khóa (key), các khóa đƣợc sử dụng làm index.
Những khoá này có thể đƣợc ấn định bởi ngƣời dùng và chúng có thể là bất kỳ
nếu muốn. Cú pháp của hash nhƣ sau.
%hash = (key, element, key, element)
20
2.4.2.4. Dòng chƣơng trình và các thƣờng trình con
Dòng chƣơng trình và các thƣờng trình con là một cách để giúp cho
ngƣời lập trình phân chia mã của mình thành các đoạn. Bằng cách thực hiện
điều này, ngƣời lập trình thƣờng có thể tổ chức chƣơng trình của mình tốt hơn
theo chức năng.
Ngoài ra, điều này còn cho phép ngƣời lập trình tạo các phần hay chức
năng để sử dụng lại thay vì phải viết lại.
Dòng chƣơng trình
Khi bàn về dòng chƣơng trình lôgic, chúng ta ám chỉ đến dòng mà
chƣơng trình đi qua khi nó giải quyết một tác vụ. Ví dụ, khi bạn thức dậy vào
buổi sáng, bạn có thể tắm rửa, mặc đồ, ăn sáng, và sau đó đi làm. Một chƣơng
trình đƣợc thiết kế logic sẽ tuân theo tiến trình tƣơng tự đó, bất kể bất kỳ điểm
chung giữa các bƣớc nhƣ mở cửa hay đi bộ. Do đó, bằng cách tuân theo kiểu
phƣơng pháp này, ngƣời lập trình sẽ khai báo các biến này thay vì tại phần trên
cùng – và các thƣờng trình con thay vì tại phân dƣới cùng – khi cần thiết.
Một dòng chức năng là nơi mà ngƣời lập trình nhóm các chƣơng trình lại
với nhau. Ví dụ, tại cuối chƣơng trình, ngƣời lập trình kéo tất cả thƣờng trình
con, đƣợc sắp xếp bằng chức năng tƣơng tự. Các thủ tục đi bộ, mở cửa, và lái
xe có thể nằm kề nhau, trong khi đó nói chuyện và các dạng giao tiếp khác có
thể theo sau.
Thƣờng trình con
Một thƣờng trình con là phƣơng pháp để tạo các hàm của Perl. Những
hàm này cho phép ngƣời lập trình thực hiện mọi thứ từ việc truyền các đối số và
chỉnh sửa các giá trị đến việc cho ra giá trị.
Sự khai báo các thƣờng trình con trong ngôn ngữ Perl đƣợc thực hiện
bằng cách sử dụng từ khóa ngôn ngữ sách. Theo sau từ khóa này là một mã
nhận dạng tên dùng để gọi thƣờng trình con khi cần đến. Sau đây là cú pháp cơ
bản, trong đó NAME tham chiếu tên mà ngƣời lập trình muốn gọi thƣờng trình
con và code là mã mà ngƣời lập trình muốn thực thi khi thƣờng trình con đƣợc
gọi.
Sub NAME {
Code }
21
2.4.2.5 Package và Module
Package
Một package là một tập hợp các hàm Perl đƣợc nhóm thành một file đơn.
File này, cũng đƣợc gọi là một thƣ viện (library) và có phần mở rộng .pl (đôi
khi là .pm), đƣợc chỉ ra bởi tên file của nó trong mã. Một package khai báo một
namespace khác của các biến và/hoặc các thƣờng trình con bên trong nó. Mục
đích là để các biến tránh ghi đè lên nhau.
Module
Module không có gì hơn là một package. Điểm khác biệt duy nhất là một
Module đƣợc thiết kế để sử dụng lại. Điều này đƣợc thực hiện bằng cách cho
phép xuất một số hay tất cả các biến và thƣờng trình con của một Module sang
các package khác.
Trên đây, tôi chỉ trình bày sơ lƣợt một vài thành phần trong cấu trúc hoạt
động của ngôn ngƣ lập trình Perl. Còn rất nhiều các yếu tố cấu tạo - nguyên tắc
chi tiết ứng dụng của từng thành phần trong Perl mà do mục đích và yêu cầu
của đề tài nên tôi không thể trình bày hết đƣợc.
2.5. Giới thiệu về mồi (primer)
2.5.1. Khái quát về mồi
Mồi (primer) là một thành phần quan trọng không thể thiếu trong phản ứng
PCR (Polymerase Chain Reaction). Mồi là những đoạn nucleotide ngắn, bắt cặp bổ
sung với đầu 5‟ hay 3‟ của mạch DNA khuôn mẫu. Mồi đƣợc thiết kế dựa vào vùng
trình tự đã đƣợc biết, nằm ở hai đầu của đoạn gen cần khuếch đại.
Trong phản ứng PCR bao giờ cũng cần có cặp mồi (mồi xuôi và mồi ngƣợc).
Có rất nhiều tiêu chuẩn nghiêm ngặt đặt ra khi thiết kế một cặp mồi nhƣ chiều dài mồi,
tính chuyên biệt của cặp mồi, nhiệt độ nóng chảy Tm của mồi, nhiệt độ bắt cặp, sự tạo
thành cấu trúc bậc hai của mồi… để đảm bảo phản ứng PCR thành công và thu đƣợc
sản phẩm nhân bản (một số lƣợng lớn bản sao của đoạn DNA khuôn ban đầu).
2.5.2. Đặc điểm của mồi (primer)
22
2.5.2.1 Tính chuyên biệt
Duy nhất: chỉ có duy nhất một vị trí bắt cặp của primer trên khuôn DNA,
nghĩa là trình tự primer chỉ xuất hiện một lần trên trình tự khuôn. Ngoài ra, cũng phải
cần đảm bảo prime
Các file đính kèm theo tài liệu này:
- TRAN NGOC VIET - 02126159.pdf