Đồ án Xây dựng hệ thống soạn thảo văn bản đa ngữ Anh - Việt - Chăm

Xây dựng Hệ thống Soạn thảo Văn bản Đa ngữ - Đưa ra những vấn đề cấp thiết cần giải quyết trong việc soạn thảo văn bản đa ngữ Anh – Việt - Chăm - Xây dựng Hệ thống soạn thảo văn bản đa ngữ Anh – Việt – Chăm : * Phương pháp mã hóa. * Phương pháp tạo Font. * Xây dựng giao diện STVB Đa ngữ. - Soạn thảo văn bản tiếng Chăm, đa ngữ. - In ấn sách, tài liệu giáo dục. - Nhận dạng chữ viết, tiếng nói. - Dịch thuật. - Chữ Chăm cho người mù. - Thông tin đại chúng. - Ứng dụng Internet .

ppt22 trang | Chia sẻ: lvcdongnoi | Ngày: 04/07/2013 | Lượt xem: 1814 | Lượt tải: 0download
Bạn đang xem nội dung tài liệu Đồ án Xây dựng hệ thống soạn thảo văn bản đa ngữ Anh - Việt - Chăm, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
ÑAÏI HOÏC ÑAØ NAÜNG TRÖÔØNG ÑAÏI HOÏC KYÕ THUAÄT KHOA COÂNG NGHEÄ THOÂNG TIN – ÑIEÄN TÖÛ VIEÃN THOÂNG Ñoà aùn Toát nghieäp XAÂY DÖÏNG HEÄ THOÁNG SOAÏN THAÛO VAÊN BAÛN ÑA NGÖÕ ANH – VIEÄT – CHAÊM Sinh vieân thöïc hieän : TRÖÔNG KYØ QUOÁC Thaày giaùo höôùng : Ts. PHAN HUY KHAÙNH Xaây döïng Heä thoáng Soaïn thaûo Vaên baûn Ña ngöõ - Ñöa ra nhöõng vaán ñeà caáp thieát caàn giaûi quyeát trong vieäc soaïn thaûo vaên baûn ña ngöõ Anh – Vieät - Chaêm * Phöông phaùp maõ hoùa. * Phöông phaùp taïo Font. * Xaây döïng giao dieän STVB Ña ngöõ. - Xaây döïng Heä thoáng soaïn thaûo vaên baûn ña ngöõ Anh – Vieät – Chaêm : Thöïc Traïng Tieáng Chaêm Hieän Nay Ñoái vôùi daân toäc Chaêm - Chæ bieát noùi vaø nghe, khoâng bieát vieát, bieát ñoïc. - Raát ít giôùi trí thöùc Chaêm coøn bieát vieát, bieát ñoïc vaø coù yù thöùc baûo toàn. - Ñeán tröôøng chæ hoïc tieáng Vieät. - Ngoân ngöõ, chöõ vieát Chaêm coù xu höôùng latinh hoùa. Ñoái vôùi khoa hoïc giaùo duïc - Sau nhieàu theá kyû vaên hoùa Chaêm chæ laø nhöõng kho taøng veà lòch söû, toân giaùo, veà kinh teá, khoa hoïc töï nhieân, xaõ hoäi khoâng ñaùng keå. - Khoâng coù giôø hoïc tieáng Chaêm. - Baûo toàn chöõ vieát ôû caùc trung taâm vaên hoùa Chaêm. Ñoái vôùi thoâng tin ñaïi chuùng - Saùch baùo, thoâng tin, kinh teá vaên hoùa xaõ hoäi, giaùo duïc chöa coù tieáng Chaêm. - Chöông trình tieáng Chaêm treân soùng PT-TH chöa nhieàu do thieáu ngöôøi am hieåu veà dòch thuaät vaø kinh phí coøn haïn cheá. Nhu Caàu Xöû Lyù Tin Hoïc Tieáng Chaêm - Soaïn thaûo vaên baûn tieáng Chaêm, ña ngöõ. - In aán saùch, taøi lieäu giaùo duïc. - Nhaän daïng chöõ vieát, tieáng noùi. - Dòch thuaät. - Chöõ Chaêm cho ngöôøi muø. - Thoâng tin ñaïi chuùng. - ÖÙng duïng Internet... Tìm Hieåu Boä Chöõ Chaêm Goàm 41 chöõ caùi : a b c d e f g h i j k l m n o p q r s t u v w x y z A B C D E F G H I J K L M N O Vaø 24 kyù töï phuï ñeå gheùp : Kyù töï phuï ñaùnh treân chöõ 111 2 3 4 5 6 7 ! @ # $ % ^ & Kyù töï phuï ñaùnh döôùi chöõ 8 9 * ( Kyù töï phuï ñaùnh tröôùc vaø sau chöõ 0 _ = \ [ ] Tìm Hieåu Chöõ Vieát Chaêm Ngaøy nay coù söï traø troän chöõ coå vaø chöõ latinh, chöõ latinh phuïc vuï nghe – noùi - dòch. Phoái hôïp giöõa caùc kyù töï ñeå taïo moät soá nguyeân aâm hoaëc nguyeân aâm ñoâi. * kyù töï u gheùp vôùi daáu 0 vôùi kyù töï c vôùi daáu # taïo nguyeân aâm /eâ/: u 0 c# /pakïeâ/ * daáu 0 gheùp vôùi kyù töï t vôùi daáu \ vôùi daáu # taïo nguyeân aâm ñoâi /iô/: 0t\# /diô/ Moãi caùch gheùp cho ngöõ nghóa khaùc nhau, caùc chöõ ñeàu coù theå gheùp vôùi kyù töï phuï. * u 0 c# /pakïeâ/ ‘ buoåi saùng ’ * 0t\# /diô/ ‘ nghieâng ’ Phöông Phaùp Maõ Hoùa Bieåu dieãn Kyù töï trong Maùy tính - Maõ nhò phaân : khoù tieáp caän, khoâng thuaän tieän. - Baûng maõ ASCII ra ñôøi. - Heä thoáng maõ naøy duøng 7 bit ñeå maõ hoùa, coù 128 kyù töï khaùc nhau : 32 kyù töï ñieàu khieån, 95 kyù töï töông öùng 95 maõ ASCII töø 32-128. Phöông Phaùp Maõ Hoùa Maõ hoùa chöõ Vieät - Duøng baûng maõ ASCII môû roäng (1 byte chuaån 8 bit) nhö vaäy coù 256 kyù töï. - Caùch maõ hoùa : * Theo caáu truùc daáu lieàn (maõ hoùa 1 byte): Theo nguyeân taéc döïng saün con chöõ nguyeân aâm vaø daáu thanh 5 thanh x 12 nguyeân aâm x 2 daïng hoa/thöôøng = 120 toå hôïp 29 nguyeân aâm x 2 daïng hoa/thöôøng = 58 daïng chöõ coù 44 chöõ hình daùng gioáng chöõ latinh -> maõ hoùa 134 kyù töï. * Theo caáu truùc daáu rôøi (maõ hoùa 2 byte): Theo nguyeân taéc caùc nguyeân aâm vaø caùc thanh ñöôïc thay ñoåi hình daùng trong nhöõng oâ rieâng. -> caàn 24 daïng hình ñeå theå hieän taát caû chöõ thuaàn Vieät : 10 daáu thanh saéc, huyeàn, hoûi, ngaõ, naëng cho chöõ hoa/thöôøng. 12 nguyeân aâm hoa/thöôøng : AÊ, AÂ, EÂ, OÂ, Ô, Ö – aê, aâ, eâ, oâ, ô, ö. 2 phuï aâm hoa/thöôøng : Ñ, ñ. Phöông Phaùp Maõ Hoùa Giaûi phaùp maõ hoùa chöõ Chaêm - Duøng baûng maõ 1 byte (ABC, VietWare_F) ñeå tích hôïp boä chöõ Chaêm. - Söû duïng caùc byte coøn troáng hoaëc khoâng söû duïng (töø 128 ñeán 255) ñeå maõ hoùa boä chöõ Chaêm. - Sô ñoà minh hoïa giaûi phaùp maõ hoùa chöõ Chaêm : Minh hoïa Phöông Phaùp Maõ Hoùa Giaûi phaùp maõ hoùa chöõ Chaêm Phöông Phaùp Taïo Font Tích hôïp boä chöõ Chaêm vaøo Font 1 byte - Khôûi ñoäng Corel Draw - Veõ caùc kyù töï chöõ Chaêm minh hoïa - Export töøng kyù töï döôùi daïng bitmap vaøo moät thö muïc ñaõ ñöôïc taïo tröôùc ñoù - Ñoùng Corel Draw laïi - Khôûi ñoäng Font Creator - Môû baát kyø moät font 1 byte minh hoïa - Import laàn löôït caùc kyù töï ñaõ ñöôïc xuaát tröôùc ñoù vaøo caùc byte (oâ) coøn troáng trong baûng maõ minh hoïa - Ñaët teân tröôùc khi löu Söû duïng Corel Draw, Font Creator ñeå tích hôïp theo quy trình : Phöông Phaùp Taïo Font Baûng maõ ñaõ Tích hôïp boä chöõ Chaêm Phöông Phaùp Taïo Font Ña daïng hoùa Font chöõ Chaêm Champa-Tekon Champa-Avo Champa-Couri ˜¬ƒ¥ ˜¬ƒ¥ ˜¬ƒ¥ Xaây Döïng Heä Thoáng Soaïn Thaûo Vaên Baûn Ña Ngöõ Chöùc naêng cuûa Chöông trình - Chöông trình soaïn thaûo rieâng, deã söû duïng, ñôn giaûn, tieän lôïi ... - Soaïn thaûo tieáng Chaêm & soaïn thaûo ña ngöõ. - Chöùc naêng Tìm kieám - Thay theá. - Chöùc naêng Goõ taét. - Chöùc naêng Môû, Löu, ñònh daïng vaên baûn ... Xaây Döïng Heä Thoáng Soaïn Thaûo Vaên Baûn Ña Ngöõ Giaûi Thuaät Boä Goõ Ña Ngöõ Anh – Vieät - Chaêm Thuaät toaùn ôû möùc ñoä toång quaùt nhö sau : - Khôûi ñoäng chöông trình soaïn thaûo - Choïn kieåu goõ *Goõ tieáng Anh : Thöïc hieän soaïn thaûo *Goõ tieáng Vieät : Xöû lyù daáu cho caùc kyù töï a,e,i,o,u,y,d khi soaïn thaûo *Goõ tieáng Chaêm : Xöû lyù maõ Ascii baøn phím töông öùng maõ kyù töï Chaêm ñöôïc maõ hoùa - Keát thuùc soaïn thaûo Xaây Döïng Heä Thoáng Soaïn Thaûo Vaên Baûn Ña Ngöõ Phöông aùn Thieát keá Giao dieän Coù thöïc ñôn chính cho chöông trình, thanh coâng cuï vôùi caùc chöùc naêng hay söû duïng. * Öu ñieåm : . Thieát keá goïn. . Vuøng soaïn thaûo roäng. . Tieän söû duïng caùc chöùc naêng hay duøng. * Nhöôïc ñieåm : . Ít tröïc quan. . Thieát keá phöùc taïp. minh hoïa Keát Luaän & Höôùng Phaùt Trieån Nhaän xeùt & Ñaùnh giaù Chöông trình - Maõ hoùa boä chöõ Chaêm. - Ña daïng hoùa boä chöõ Chaêm. - Tích hôïp caùc boä chöõ Chaêm vaøo caùc font chöõ 1 byte. - Xaây döïng chöông trình soaïn thaûo rieâng. - Xaây döïng boä goõ ña ngöõ. Ñaõ hoaøn thaønh töông ñoái toát caùc muïc tieâu ñaõ ñeà ra : Chöông trình hoã trôï cho ngöôøi söû duïng : - Soaïn thaûo tieáng Chaêm. - Soaïn thaûo ña ngöõ : Anh - Vieät - Chaêm. - Tìm kieám vaø Thay theá. - Goõ taét. - Löu tröõ, in aán... - Duøng chung vôùi WinWord. Keát Luaän & Höôùng Phaùt Trieån Höôùng phaùt trieån cuûa Chöông trình - Xaây döïng giao dieän nhieàu ngoân ngöõ. - Söû duïng baûng maõ Unicode ñeå maõ hoùa. - Naâng caáp boä goõ ñeå soaïn thaûo tieáng Chaêm cho taát caû caùc öùng duïng khaùc trong Windows. Keát Luaän & Höôùng Phaùt Trieån Keát Luaän Muïc ñích cuûa ñeà taøi naøy laø tin hoïc hoùa tieáng Chaêm, giaûi quyeát vaán ñeà veà ngoân ngöõ ñeå coù theå giuùp cho ñoàng baøo caùc daân toäc coù theå hieåu bieát, gaàn guõi nhau hôn goùp söùc cho coâng cuoäc baûo toàn, phaùt trieån vaên hoùa, thöïc hieän ñaïi ñoaøn keát caùc daân toäc Vieät Nam. Lôøi Caûm Ôn Tröôùc tieân, toâi xin toû loøng bieát ôn ñeán Thaày giaùo Ts PHAN HUY KHAÙNH ngöôøi ñaõ gôïi môû cho toâi nhöõng suy nghó ñeå töøng böôùc giaûi quyeát ñöôïc yeâu caàu cuûa ñeà taøi ñaët ra. Thaày ñaõ taïo nhöõng ñieàu kieän thuaän lôïi vaø ñaõ taän tình höôùng daãn cho toâi hoaøn thaønh ñoà aùn naøy. Toâi xin chaân thaønh caûm ôn caùc caùn boä giaûng vieân Ñaïi hoïc Ñaø Naüng, tröôøng Ñaïi hoïc Kyõ thuaät ñaõ nhieät tình daïy baûo vaø giuùp ñôõ trong suoát thôøi gian hoïc taäp taïi tröôøng. Toâi xin chaân thaønh caûm ôn caùc caùn boä khoa Coâng Ngheä Thoâng Tin - Ñieän töû Vieãn thoâng ñaõ cung caáp nhieàu thoâng tin, taøi lieäu vaø phöông phaùp thöïc hieän ñeà taøi toát nghieäp naøy. Toâi xin chaân thaønh caûm ôn laõnh ñaïo, caùc anh chò ñoàng nghieäp ngöôøi Chaêm taïi ñaøi PTTH Ninh Thuaän ñaõ daønh nhieàu thôøi gian giuùp toâi tìm hieåu veà ngoân ngöõ Chaêm vaø ñöa chöông trình naøy vaøo öùng duïng thöïc tieãn. Sau cuøng, toâi xin chuyeån lôøi caûm ôn ñeán nhöõng ngöôøi thaân trong gia ñình, cuøng taát caû baïn beø gaàn xa ñaõ ñoäng vieân, khích leä tinh thaàn giuùp cho toâi töï tin, vöôït qua nhöõng khoù khaên trong suoát thôøi gian laøm ñoà aùn naøy. Sinh vieân TRÖÔNG KYØ QUOÁC. Phöông Phaùp Taïo Font Duøng Corel Draw veõ hình daùng chöõ Chaêm Freehand Tool Export Sharp Tool Phöông Phaùp Taïo Font Duøng Font Creator môû Font 1 byte Font .VnTekon Phöông Phaùp Taïo Font Import Kyù töï vaøo baûng maõ 1 byte

Các file đính kèm theo tài liệu này:

  • pptBao ve luan van_Truong Quoc Ky.ppt
  • pptslide tot nghiep.ppt