JOURNAL OF SCIENCE OF HNUE<br />
Natural Sci. 2016, Vol. 61, No. 4, pp. 116-121<br />
This paper is available online at http://stdb.hnue.edu.vn<br />
<br />
DOI: 10.18173/2354-1059.2016-0018<br />
<br />
XÁC ĐỊNH, PHÂN LOẠI VÀ XÂY DỰNG BẢN ĐỒ GEN<br />
CỦA HỌ DEHYDRIN Ở CÂY QUÝT (Citrus clementina)<br />
Cao Phi Bằng1 và Trần Thị Thanh Huyền2<br />
1<br />
<br />
Khoa Khoa học Tự nhiên, Trường Đại học Hùng Vương<br />
2<br />
Khoa Sinh học, Trường Đại học Sư phạm Hà Nội<br />
<br />
Tóm tắt. Các dehydrin (DHN) thuộc nhóm II của họ LEA. Chúng Ďóng vai trò quan trọng trong<br />
việc bảo vệ tế bào trƣớc các tác Ďộng bất lợi của môi trƣờng thông qua khả năng giữ nƣớc và bảo<br />
vệ các màng sinh học cũng nhƣ các phân tử protein. Trong công trình này, nhờ sử dụng các<br />
phƣơng pháp nghiên cứu in silico, chúng tôi Ďã xác Ďịnh Ďƣợc tổng số sáu gen mã hóa cho các<br />
DHN trong hệ gen của cây quýt (Citrus clementina). Sáu DHN của cây quýt Ďều có mang phân<br />
mảnh K Ďặc trƣng cho các protein thuộc họ DHN Ďã Ďƣợc báo cáo. Các gen trong họ DHN của cây<br />
quýt phân bố ở 5 trong tổng số 9 nhiễm sắc thể. Kết quả phân tích các motif bảo thủ cũng nhƣ<br />
phân tích cây phả hệ Ďã chỉ ra rằng các DHN này Ďƣợc xếp vào ba nhóm SKn, KS và YnSKn. Mỗi<br />
nhóm gồm có hai gen. Hai gen CclDHN1 và CclDHN6 có thể là sản phẩm của một sự kiện nhân<br />
Ďôi phân mảnh nhiễm sắc thể diễn ra sau quá trình phân hóa loài giữa quýt và Arabidopsis.<br />
Từ khóa: Dehydrin (DHN), bản Ďồ gen, cây phả hệ, in silico, quýt, xác Ďịnh gen.<br />
<br />
1. Mở đầu<br />
Quýt (Citrus clementina) là cây thuộc họ Cam, một trong những họ cây ăn quả quan trọng nhất<br />
trên thế giới. Theo thống kê, năm 2009, sản lƣợng của các cây trong họ này Ďạt 122,3 triệu tấn (FAO<br />
2009). Ở Việt Nam, thống kê cho thấy sản lƣợng hàng năm của các cây thuộc họ cam, quýt Ďạt khoảng<br />
700 nghìn tấn (Thống kê Việt Nam 2012). Do có giá trị cao, cây quýt là một trong các cây Ďƣợc lựa<br />
chọn làm Ďại diện trong dự án giải trình tự hệ gen các cây thuộc họ Cam [1].<br />
Dehydrin (DHN) mã hóa các protein thuộc nhóm II của họ Late Embryogenesis Abundant protein<br />
(LEA) [2]. Chúng Ďóng vai trò quan trọng trong sự trả lời thích nghi của thực vật với các Ďiều kiện bất<br />
lợi của môi trƣờng, Ďặc biệt là vai trò bảo vệ tế bào trong quá trình mất nƣớc [2, 3]. Các protein DHN<br />
Ďƣợc báo cáo có vai trò quan trọng Ďối với các chồi ngủ và quá trình luyện lạnh của cây gỗ [2].<br />
Các DHN Ďƣợc Ďặc trƣng bởi sự có mặt của ít nhất một trình tự bảo thủ gồm có 15 axit amin giàu<br />
lysine, EKKGIM(E/D)KIKEKLPG (phân mảnh K). Phân mảnh K thƣờng phân bố ở Ďầu carboxyl của<br />
phân tử protein và có khả năng hình thành cấu trúc xoắn lƣỡng cực, cấu trúc giữ vai trò quan trọng<br />
trong sự tƣơng tác của DHN với các màng sinh học và các protein [2]. Ngoài ra, DHN cũng có thể có<br />
các motif bảo thủ khác là phân mảnh Y và phân mảnh S. Phân mảnh Y giàu tyrosine,<br />
(V/T)D(E/Q)YGNP, phân bố ở gần Ďầu tận cùng amin và có một bộ phận axit amin giống với motif ở<br />
vị trí gắn nucleotide của các protein chaperone ở nhiều loài sinh vật [2]. Phân mảnh S giàu serine, gồm<br />
từ 4 tới 10 serine). Dựa vào cấu trúc, các DHN có thể Ďƣợc chia thành 5 phân nhóm: Kn, SKn, KnS,<br />
YnKn và YnSKn [2]. Gần Ďây, phân nhóm SKS lần Ďầu tiên Ďã Ďƣợc báo cáo ở trên Ďối tƣợng cây<br />
dƣơng [4].<br />
Với vai trò Ďặc biệt quan trọng trong việc bảo vệ tế bào và sự cảm ứng mạnh bởi các Ďiều kiện bất<br />
lợi vô sinh cũng nhƣ hữu sinh, các DHN Ďƣợc coi là chỉ thị phân tử của tính chống chịu với các Ďiều<br />
kiện bất lợi của môi trƣờng ở thực vật [3]. Trong nghiên cứu này, chúng tôi hƣớng tới xác Ďịnh trình tự<br />
Ngày nhận bài: 24/3/2015. Ngày nhận Ďăng: 26/4/2015.<br />
Tác giả liên lạc: Cao Phi Bằng, Ďịa chỉ e-mail: phibang.cao@hvu.edu.vn<br />
<br />
116<br />
<br />
Xác định, phân loại và xây dựng bản đồ gen của họ Dehydrin ở cây quýt (Citrus clementina)<br />
<br />
của các DHN trong hệ gen của cây quýt, xây dựng cây phả hệ và phân loại các DHN. Đồng thời lập<br />
bản Ďồ gen của các gen trong họ này.<br />
<br />
2. Nội dung nghiên cứu<br />
2.1. Vật liệu và phƣơng pháp nghiên cứu<br />
* Cơ sở dữ liệu<br />
Trình tự hệ gen của cây quýt Ďƣợc lấy từ Wu et al [5]. Các trình tự DHN của cây Arabidopsis<br />
Ďƣợc lấy từ Hundertmark và Hincha [6].<br />
* Phương pháp<br />
Xác định các gen DHN ở cây quýt: Các protein DHN của cây Arabidopsis [6] Ďƣợc dùng làm<br />
khuôn dò, chƣơng trình TBLASTN Ďƣợc sử dụng Ďể tìm kiếm các gen tƣơng Ďồng trên dữ liệu hệ gen<br />
của cây quýt. Pfam (cơ sở dữ liệu các họ protein [7] Ďƣợc sử dụng Ďể xác nhận sự hiện diện của các<br />
vùng bảo thủ trong trình tự protein suy diễn của các ứng viên DHN.<br />
Xác định các motif bảo thủ: Phần mềm MEME Ďƣợc sử dụng Ďể tách các motif từ các protein<br />
DHN ở cây quýt và cây Arabidopsis [8].<br />
Tạo cây phả hệ: Các trình tự protein DHN của cây quýt và cây Arabidopsis Ďƣợc sắp dãy bằng<br />
cách dùng phần mềm MAFFT [9]. Cây phả hệ Ďƣợc xây dựng từ các trình tự protein DHN Ďã sắp dãy<br />
nhờ phần mềm MEGA5, dữ liệu Ďƣợc xử lí là tất cả các vị trí và phƣơng pháp Bootstrap với 1000 lần<br />
lặp lại [10].<br />
Lập bản đồ gen: Bản Ďồ cƣ trú của gen trên các nhiễm sắc thể Ďƣợc thiết lập nhờ phần mềm<br />
MapChart [11].<br />
<br />
2.2. Kết quả và thảo luận<br />
* Xác định họ gen DHN trong hệ gen của cây quýt<br />
Hệ gen hoàn chỉnh của cây quýt Ďã Ďƣợc tìm kiếm với các protein DHN khuôn dò của cây<br />
Arabidopsis nhờ sử dụng chƣơng trình TBLASTN. Tổng số, 6 gen có thể mã hóa cho các DHN Ďã<br />
Ďƣợc xác Ďịnh (Bảng 1). Kết quả phân tích vùng bảo thủ nhờ sử dụng Pfam cho thấy chỉ có 4 DHN là<br />
CclDHN2, CclDHN3, CclDHN4 và CclDHN5 là các DHN Ďiển hình (PF00257). Hai DHN còn lại là<br />
CclDHN1 và CclDHN6 tƣơng Ďồng với nhiều DHN thuộc nhóm KS Ďã Ďƣợc chỉ ra ở nhiều loài thực<br />
vật khác dù không tìm thấy vùng bảo thủ Ďặc trƣng PF00257.<br />
<br />
Gen<br />
CclDHN1<br />
CclDHN2<br />
CclDHN3<br />
CclDHN4<br />
CclDHN5<br />
CclDHN6<br />
<br />
Bảng 1. Họ DHN ở cây quýt<br />
Tên locus<br />
Nhiễm sắc thể<br />
Ciclev10024637 m.g<br />
3<br />
Ciclev10002349 m.g<br />
5<br />
Ciclev10026675 m.g<br />
7<br />
Ciclev10029952 m.g<br />
8<br />
Ciclev10029285 m.g<br />
8<br />
9<br />
<br />
Vị trí<br />
41697369..41697776<br />
42490019..42490852<br />
1699891..1699246<br />
550850..551472<br />
5894816..5896074<br />
7493081..7493375<br />
<br />
Các protein suy diễn Ďƣợc dùng làm khuôn Ďể tìm các protein tƣơng Ďồng ở các loài khác<br />
(ortholog) có trong cơ sở dữ liệu của NCBI. Phép kiểm tra này khẳng Ďịnh các trình tự tìm Ďƣợc Ďều<br />
thuộc họ DHN. Thực vậy, các protein Ďã Ďƣợc báo cáo giống nhất với các CclDHN Ďều là các DHN<br />
(Bảng 2).<br />
Số lƣợng gen DHN ở cây quýt ít hơn ở cây Arabidopsis [6], cây dƣơng [4] nhƣng nhiều hơn ở<br />
cây nho [12].<br />
Các gen mã hóa DHN của cây quýt Ďƣợc phân bố trên 5 trong tổng số 9 nhiễm sắc thể. Trong Ďó,<br />
chỉ duy nhất nhiễm sắc thể số 8 có mang hai gen là CclDHN4 và CclDHN5. Còn lại, các nhiễm sắc thể<br />
3; 5; 7 và 9 chỉ mang một gen thuộc họ này. Dựa trên Ďộ tƣơng Ďồng cao, có thể hai gen CclDHN1 và<br />
CclDHN6 Ďƣợc hình thành do một sự kiện nhân Ďôi phân mảnh nhiễm sắc thể.<br />
<br />
117<br />
<br />
Cao Phi Bằng và Trần Thị Thanh Huyền<br />
<br />
Bảng 2. Các gen tương đồng gần nhất với các DHN của cây quýt<br />
có trong cơ sở dữ liệu của NCBI<br />
Protein<br />
<br />
Miêu tả trên NCBI<br />
<br />
CclDHN1<br />
<br />
COR15 [Citrus clementina<br />
x Citrus reticulata]<br />
dehydrin [Citrus x<br />
paradisi]<br />
dehydrin [Jatropha curcas]<br />
dehydrin 3 [Vitis yeshanensis]<br />
> gb|AFI38957.1| dehydrin 3<br />
[Vitis yeshanensis]<br />
dehydrin 4 [Vitis<br />
yeshanensis] ><br />
gb|AFI38958.1| dehydrin 4<br />
[Vitis yeshanensis]<br />
cold stress protein [Citrus<br />
trifoliata]<br />
<br />
CclDHN2<br />
CclDHN3<br />
CclDHN4<br />
<br />
CclDHN5<br />
<br />
CclDHN6<br />
<br />
Chỉ số<br />
cực<br />
đại<br />
<br />
Chỉ<br />
số<br />
tổng<br />
<br />
Mức<br />
độ so<br />
sánh<br />
<br />
Giá trị Evalue<br />
<br />
Mức<br />
độ<br />
tƣơng<br />
đồng<br />
<br />
Kí hiệu<br />
Genbank<br />
<br />
237<br />
<br />
237<br />
<br />
100%<br />
<br />
7E - 79<br />
<br />
95%<br />
<br />
AAQ92310.1<br />
<br />
432<br />
<br />
432<br />
<br />
100%<br />
<br />
8 E - 153<br />
<br />
99%<br />
<br />
AAN78125.1<br />
<br />
120<br />
81.3<br />
<br />
120<br />
81.3<br />
<br />
100%<br />
49%<br />
<br />
2 E - 32<br />
2 E - 17<br />
<br />
56%<br />
57%<br />
<br />
ADT65201.1<br />
AEQ19905.1<br />
<br />
139<br />
<br />
139<br />
<br />
98%<br />
<br />
1 E - 38<br />
<br />
50%<br />
<br />
AEQ19906.1<br />
<br />
108<br />
<br />
108<br />
<br />
69%<br />
<br />
1 E - 29<br />
<br />
86%<br />
<br />
AAA99963.1<br />
<br />
Hình 1. Bản đồ gen của các dehydrin trong hệ gen của cây quýt<br />
* Xác định các motif bảo thủ, phân tích cây phả hệ và phân loại các dehydrin<br />
Kết quả phân tích motif bảo thủ bằng phần mềm MEME cho thấy, phân mảnh K (trình tự<br />
KKG[IFL]M[ED]KIKEKLPG[HG]H, hình 2A) có mặt ở tất cả các DHN của cây quýt với số lần lặp<br />
lại khác nhau. Trong Ďó, CclDHN1 và CclDHN6 chỉ có 1 phân mảnh K, CclDHN2 và CclDHN4 cùng<br />
có 2 phân mảnh K trong khi 3 phân mảnh K Ďƣợc tìm thấy ở CclDHN3 và CclDHN5. Chỉ một phân<br />
mảnh S ([LG]H[RD]S[GN]SSSSSSS[DE][ED][DE], hình 2C) Ďƣợc tìm thấy ở cả sáu DHN của cây<br />
quýt, nhƣng vị trí của phân mảnh này lại rất khác nhau, nằm ở Ďầu tận cùng carboxyl của FsDHN1 và<br />
FsDHN6 trong khi nằm ở phía Ďầu tận cùng amin của bốn DHN còn lại. Riêng CclDHN4 có mang<br />
phân mảnh S không hoàn chỉnh, chỉ với hai axit amin Serine. Phân mảnh Y (DE[YFH]GNP, hình 2B)<br />
chỉ Ďƣợc tìm thấy ở CclDHN3 (2 bản sao) và CclDHN5 (3 bản sao). Nhƣ vậy, các DHN của cây quýt<br />
có mang các phân mảnh bảo thủ, Ďặc trƣng giống nhƣ ở các DHN của loài khác Ďã Ďƣợc miêu tả [3].<br />
118<br />
<br />
Xác định, phân loại và xây dựng bản đồ gen của họ Dehydrin ở cây quýt (Citrus clementina)<br />
<br />
Hình 2. Biểu tượng trình tự axit amin của phân mảnh K (A),<br />
phân mảnh Y (B) và phân mảnh S (C)<br />
Các motif bảo thủ và vị trí của chúng trong phân tử protein Ďƣợc thể hiện rõ hơn qua Hình 3, hình<br />
biểu diễn kết quả sắp dãy các CclDHN nhờ sử dụng phần mềm MAFFT.<br />
<br />
Hình 3. Sự sắp dãy các dehydrin của cây quýt.<br />
(Dấu sao chỉ các axit amin bảo thủ. Các phân mảnh bảo thủ nằm trong ô, nền xám, phân mảnh K chữ<br />
in đậm, phân mảnh Y chữ in đậm nghiêng, phân mảnh S chữ in nghiêng)<br />
Cây phả hệ Ďƣợc thiết lập từ các protein DHN của cây quýt (Ccl) và cây Arabidopis (At) Ďƣợc thể<br />
hiện ở hình 4. Các CclDHN này chỉ phân bố trên ba nhánh chính của cây phả hệ Ďiều này cho phép<br />
xếp loại các CclDHN vào ba nhóm. Căn cứ trên cách phân loại của các tác giả khác [4, 6], sáu DHN<br />
của cây quýt Ďƣợc xếp vào ba nhóm KnS, SKn và YnSKn. Trong Ďó, hai protein CclDHN1 và<br />
CclDHN6 nằm cùng nhánh với DHN thuộc phân nhóm KnS của cây Arabidopsis, nhóm này gồm các<br />
DHN không có phân mảnh Y. Hai CclDHN2 và CclDHN4 nằm cùng nhánh với các DHN thuộc phân<br />
nhóm SKn, nhóm chỉ có các phân mảnh bảo thủ thuộc S và K, trong Ďó phân mảnh K nằm sau phân<br />
mảnh S (hình 3). Cuối cùng, hai protein CclDHN3 và CclDHN5 Ďƣợc xếp vào phân nhóm YnSKn nhờ<br />
sự có mặt của phân mảnh Y ở phía Ďầu amin của các protein suy diễn. Phân tích cây phả hệ cũng cho<br />
thấy có ít nhất một hiện tƣợng nhân Ďôi gen Ďã xảy ra trong họ DHN của cây quýt, tạo thành cặp gen<br />
CclDHN1 và CclDHN6. Kết quả này phù hợp với các hiện tƣợng nhân Ďôi gen DHN Ďã Ďƣợc chỉ ra ở<br />
các loài khác [4, 6]. Căn cứ vào vị trí của gen trong cây phả hệ, có thể kết luận sự kiện nhân Ďôi gen<br />
CclDHN1 và CclDHN6 xảy ra gần Ďây, sau thời kì biệt hóa loài.<br />
119<br />
<br />
Cao Phi Bằng và Trần Thị Thanh Huyền<br />
<br />
Hình 4. Cây phả hệ được xây dựng từ các DHN của cây quýt và cây Arabidopsis<br />
<br />
3. Kết luận<br />
Trong công trình này chúng tôi Ďã xác Ďịnh Ďƣợc tổng số 6 gen DHN trong toàn bộ hệ gen của cây<br />
quýt. Các gen này tƣơng Ďồng cao với các DHN của nhiều loài thực vật khác. Kết quả phân tích các<br />
motif bảo thủ trong các protein suy diễn cho thấy các DHN của cây quýt có mang các motif bảo thủ Ďặc<br />
trƣng nhƣ phân mảnh K, phân mảnh Y và phân mảnh S tùy gen. Dựa trên sự có mặt của các motif bảo<br />
thủ, kết hợp với phân tích cây phả hệ Ďã chỉ ra rằng các gen này thuộc về ba nhóm KS và YnSKn và<br />
SKn. Bản Ďồ gen của họ DHN ở cây quýt Ďã Ďƣợc chúng tôi xây dựng, trong Ďó các DHN phân bố trên 5<br />
trong tổng số 9 nhiễm sắc thể. Đây là những kết quả bƣớc Ďầu có ý nghĩa quan trọng, mở Ďƣờng cho việc<br />
nghiên cứu chức năng của các DHN ở loài cây này.<br />
Lời cảm ơn. Công trình này Ďƣợc hoàn thành với sự hỗ trợ kinh phí từ chƣơng trình nghiên cứu khoa<br />
học cơ bản của Trƣờng Đại học Hùng Vƣơng.<br />
TÀI LIỆU THAM KHẢO<br />
[1]<br />
<br />
[2]<br />
[3]<br />
<br />
[4]<br />
<br />
[5]<br />
<br />
[6]<br />
[7]<br />
<br />
120<br />
<br />
Aleza P, Juarez J, Hernandez M, et al., 2009. Recovery and characterization of a Citrus<br />
clementina Hort. ex Tan. 'Clemenules' haploid plant selected to establish the reference whole<br />
Citrus genome sequence. BMC Plant Biology, 9(1), 110. DOI:10.1186/1471-2229-9-110.<br />
Rorat T, 2006. Plant dehydrins - Tissue location, structure and function. Cellular, Molecular<br />
Biology Letters, 11(4), pp. 536-556.<br />
Hanin M, Brini F, Ebel C, Toda Y, Takeda S, Masmoudi K, 2011. Plant dehydrins and stress<br />
tolerance: versatile proteins for complex mechanisms. Plant Signaling & Behavior, 6(10),<br />
pp. 1503-1509.<br />
Liu CC, Li CM, Liu BG, et al., 2012. Genome-wide Identification and Characterization of a<br />
Dehydrin Gene Family in Poplar (Populus trichocarpa). Plant Molecular Biology Reporter,<br />
30(4), pp. 848-859.<br />
Wu GA, Prochnik S, Jenkins J, et al., 2014. Sequencing of diverse mandarin, pummelo and<br />
orange genomes reveals complex history of admixture during citrus domestication. Nature<br />
Biotechnology, 32(7), pp. 656-662.<br />
Hundertmark M, Hincha DK, 2008. LEA (late embryogenesis abundant) proteins and their<br />
encoding genes in Arabidopsis thaliana. BMC Genomics, 9(1), 118.<br />
Finn RD, Bateman A, Clements J, et al., 2014. Pfam: the protein families database. Nucleic<br />
Acids Res, 42, pp. D222-D230.<br />
<br />