Chương trình chuyển đổi cây cú pháp chuyển đổi rất tốt trong phạm vi cùng
cấp và chuyển đổi được các thành phần khác cấp, điều mà các chương trình chuyển
đổi dựa trên luật cố định không thể thực hiện được hoặc chỉ có thể thực hiện trên bề
mặt câu.
159 trang |
Chia sẻ: lylyngoc | Lượt xem: 2437 | Lượt tải: 0
Bạn đang xem trước 20 trang tài liệu Luận văn -Xây dựng chương trình chuyển đổi cây cú pháp trong hệ dịch tự động Anh-Việt, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
lên câu tiếng Anh. Việc áp dụng các
luật diễn ra khá nhanh vì chương trình khơng cần phải lựa chọn luật nữa mà chỉ cần
đưa luật vào áp dụng cho câu tiếng Anh, luật nào khơng thoả phần điều kiện cho
câu tiếng Anh thì được bỏ qua. Sau khi kết thúc luật cuối cùng, chúng ta cĩ cây cú
pháp tiếng Anh với trật tự các thành phần là của cây cú pháp tiếng Việt. Sau khi kết
thúc quá trình áp dụng các luật chuyển đổi khác cấp, về cơ bản câu tiếng Anh đã cĩ
thể được gắn nghĩa tiếng Việt để hình thành câu dịch. Tuy nhiên để cĩ được câu
dịch tiếng Việt phù hợp với một số cấu trúc đặc biệt trong tiếng Việt, chúng ta cần
tiến hành giai đoạn chèn, xố các từ trong cây cú pháp tiếng Anh bằng một số hư từ
và một số từ đặc biệt trong câu tiếng Việt cĩ tính quyết định đến chất lượng câu
dịch.
Chuyển đổi
cùng cấp
Cây cú pháp tiếng Anh
với các thành phần
cùng cấp cĩ trật tự
tiếng Việt
Tập luật
chuyển đổi
cùng cấp
Cây cú pháp tiếng
Anh với các thành
phần cĩ trật tự
tiếng Việt
Chương 5 – Thử nghiệm & đánh giá
Trang 128
Chương 5
THỬ NGHIỆM – ĐÁNH GIÁ
5.1 Thử nghiệm
5.1.1 Độ đo sử dụng
Vì mục tiêu cuối cùng của chuyển đổi cây cú pháp là câu cĩ trật tự từ đúng
theo tiếng Việt, do đĩ kết xuất của chương trình chuyển đổi cây cú pháp là một
danh sách cĩ thứ tự bao gồm : những từ trong câu tiếng Anh gốc đã được sắp xếp
lại, những từ bị xố được đánh dấu xố và những từ tiếng Việt được chèn thêm.
Ví dụ:
Câu tiếng Anh : Do you understand what I say ?
E1 E2 E3 E4 E5 E6 E7
Kết quả chuyển đổi:
You do cĩ understand what I say khơng ?
E2 X I1 E3 E4 E5 E6 I2 E7
Bạn cĩ hiểu điều mà tơi nĩi khơng ?
Nếu khơng xét đến những từ tiếng Việt được chèn thêm, kết quả chuyển đổi
của một câu đúng hay khơng thể hiện ở trật tự các từ tiếng Anh được giữ lại (khơng
bị xố) cĩ đúng hay khơng. Trên thực tế dịch một câu tiếng Anh, ta gán nghĩa tiếng
Việt cho các từ cĩ nghĩa trong câu trước, muốn cho câu cĩ nghĩa, ta phải sắp xếp
những nghĩa này lại. Con người luơn luơn cĩ xu hướng tối thiểu hố hao phí cơng
sức, do đĩ số từ cần di chuyển đến vị trí đúng phải là nhỏ nhất. Dựa trên quan điểm
này, chúng em đưa ra độ đo mức độ chính xác cho một câu như sau:
Chương 5 – Thử nghiệm & đánh giá
Trang 129
%100
W
A-WDs ×=
với
DS= Độ chính xác của câu S (%)
W = tổng số từ trong câu S
A = số từ ít nhất trong câu S cần di chuyển để câu cĩ trật tự từ đúng
Xác định A là một bài tốn tìm chi phí tối thiểu được giải quyết bằng phương
pháp quy hoạch động.
Độ đo này tương tự như độ đo số lần “nhấn phím” (Key stroke)[11]. Mỗi một
“nhấn phím” bao gồm hai thao tác cắt và dán một từ , là chi phí để chuyển một từ về
vị trí đúng của nĩ.
Ta cũng cĩ thể phân loại câu đã chuyển đổi bằng cách chia các câu kết xuất
thành các nhĩm cĩ A nằm trong một khoảng nào đĩ.
5.1.2 Kết quả học rút luật chuyển đổi
Ngữ liệu huấn luyện sử dụng được lấy từ bộ sách CADASA, Come to the
world of microcomputer 12 cuốn do Nhà xuất bản Thống Kê phát hành. Tổng số
câu xấp xỉ 10.000, chiều dài trung bình là 17 từ /câu.
Để tạo ngữ liệu vàng, đầu tiên ngữ liệu được liên kết từ và phân tích thành cây
cú pháp. Từ đĩ, chương trình sẽ tự động xây dựng ngữ liệu vàng cho cả hai bước
huấn luyện. Ngữ liệu vàng bước 2 là cây cú pháp được biểu diễn dưới dạng ngoặc.
Ngữ liệu vàng địi hỏi phải chính xác thì luật rút ra mới chính xác, nhưng việc xây
dựng thủ cơng bằng tay tốn rất nhiều cơng sức. Do đĩ, chúng em chọn cách xây
dựng bán tự động. Tuy nhiên, cũng cần phải cĩ sự chỉnh sửa bằng tay ở kết quả liên
kết từ và ngữ liệu vàng dạng cây cú pháp.
Chương 5 – Thử nghiệm & đánh giá
Trang 130
Kết quả học luật chuyển đổi cho giai đoạn 1 (chuyển đổi cùng cấp) được tĩm
tắt trong bảng sau:
Tổng số mẫu 79.663
Số khung luật sử dụng (xem phụ lục 1) 12
Thời gian học bước 1 7giờ 23 phút 56 giây1
Số luật rút ra 1427
Số luật được giữ lại 137
Bảng 15: Tĩm tắt kết quả học luật chuyển đổi cùng cấp
0.937
0.9375
0.938
0.9385
0.939
0.9395
0.94
0.9405
0.941
1 76 151 226 301 376 451 526 601 676 751 826 901
Hình 38: Đánh giá tập luật học chuyển đổi cùng cấp –
137 luật đầu cho kết quả tốt nhất
Kết quả học luật chuyển đổi cho giai đoạn 2 (chuyển đổi khác cấp) được tĩm
tắt trong bảng sau:
Tổng số mẫu học (bằng số cây cú pháp) 5112
Chiều dài câu trung bình 17 từ/câu
1 Cấu hình máy: PIII-800, 256MBRAM
Số luật
Đ
ộ
ch
ín
h
xá
c
Chương 5 – Thử nghiệm & đánh giá
Trang 131
Số khung luật sử dụng (phụ lục 2) 3
Thời gian học bước 1 9 giờ 27 phút 06 giây
Số luật rút ra 817
Số luật được giữ lại 112
Bảng 16: Tĩm tắt kết quả học luật chuyển đổi cùng cấp
0.9394
0.9396
0.9398
0.94
0.9402
0.9404
0.9406
1 70 139 208 277 346 415 484 553 622 691 760
Hình 39: Đánh giá tập luật học chuyển đổi khác cấp –
112 luật đầu cho kết quả tốt nhất
5.1.3 Một số kết quả chuyển đổi
Dưới đây là một số minh hoạ cho kết quả dịch sử dụng khối chuyển đổi cú
pháp của chúng em (VCLTransfer), câu dịch được hiển thị bằng tiếng Việt.
Câu tiếng Anh cĩ sự chuyển đổi tương đối đơn giản
Một số kết quả chuyển đổi tương tự:
(E1) This computer is the most powerful .
(V1) Máy tính này là mạnh nhất .
Số luật
Đ
ộ
ch
ín
h
xá
c
Chương 5 – Thử nghiệm & đánh giá
Trang 132
(E) These devices convert a bar code, which is a pattern of printed bar on
products, into a code the computer can understand.
Ư (V) Những thiết bị này biến đổi một mã thanh, mà là một mẫu của thanh
được in trên sản phẩm, vào một mã máy tính cĩ thể hiểu.
(E) A game controller can be considered an input device because a
computer game is a program.
Ư (V) Một bộ điều khiển trị chơi cĩ thể được cân nhắc như một thiết bị đầu
vào bởi vì một trị chơi máy tính là một chương trình
Câu tiếng Anh cĩ sự chuyển đổi trung bình
Một số kết quả chuyển đổi tương tự:
(E) Intel will jointly develop the chips with an Israeli company, Alvarion,
which will incorporate them into its own line of broadband wireless access
systems now under development, the companies said in separate statements.
Ư (V) Intel sẽ kết hợp phát triển những vi mạch với một cơng ty Israeli,
Alvarion, mà sẽ tập hợp chúng vào đường của nĩ của hệ thống (sự) truy cập
khơng dây băng thơng rộng bây giờ dưới sự phát triển, những cơng ty nĩi trong
những tuyên bố riêng biệt.
Câu tiếng Anh cĩ sự chuyển đổi phức tạp.
Một số kết quả chuyển đổi tương tự:
(E3) This system is able to translate all normal and new sentence patterns .
(V3) Hệ thống này cĩ khả năng để dịch tất cả các mẫu câu bình thường và mới .
(E2) This is a new and very powerful computer .
(V2) Đây là một máy tính mới và rất mạnh .
Chương 5 – Thử nghiệm & đánh giá
Trang 133
(E) Several computer manufacturers now offer another spacesaving
pointing device, consisting of a small joystick positioned near the middle of the
keyboard, typically between the G and H keys.
Ư (V) Vài nhà sản xuất máy tính bây giờ đưa ra một thiết bị trỏ tiết kiệm
khơng gian khác, gồm một cần điều khiển trị chơi nhỏ được định vị gần ở giữa
của bàn phím, điển hình giữa những phím G và H.
(E) When running any Windows program, you can press Alt to activate the
menu bar, and then press a highlighted letter in a menu's name to open that
menu.
Ư (V) Khi mà chạy bất kỳ chương trình Windows nào, bạn cĩ thể nhấn Alt để
kích hoạt thanh thực đơn, rồi sau đĩ nhấn một chữ sáng mạnh trong tên của một
thực đơn để mở thực đơn đĩ.
Câu phủ định trong tiếng Anh
Một số kết quả chuyển đổi tương tự:
(E) In many cases, however, an ordinary input device may not be appropriate.
Ư (V) Tuy nhiên, trong nhiều trường hợp, một thiết bị đầu vào thơng thường
khơng cĩ thể (thì) thích hợp.
Câu hỏi trong tiếng Anh
(E1) Is an old man installing a new computer program ?
(V1) Một người đàn ơng già đang cài đặt một chương trình máy tính mới phải khơng ?
(E4) Some people can not use a mouse.
(V4) Vài người khơng cĩ thể sử dụng một con chuột.
Chương 5 – Thử nghiệm & đánh giá
Trang 134
Một số kết quả chuyển đổi tương tự:
(E) How do you double-click an item with a mouse ?
Ư (V) Nhấp kép một mục với một con chuột bằng cách nào ?
(E) Do you think Intel should implement a similar change?
Ư (V) Bạn cĩ suy nghĩ Intel nên thực hiện một sự thay đổi tương tự như nhau
khơng?
(E) Which operating system are you using ?
Ư (V) Bạn đang sử dụng hệ điều hành nào ?
Một trong các vấn đề lớn của chuyển đổi cây cú pháp trong hệ dịch Anh-Việt
là giải quyết chuyển đổi cho câu hỏi. Việc chuyển đổi cấu trúc cho các dạng câu hỏi
dễ dẫn đến việc các luật mâu thuẫn nhau. Điều này cũng làm ảnh hưởng đến chất
lượng tập luật: khơng đảm bảo cĩ thể chuyển đổi được tất cả các dạng câu hỏi nĩi
riêng và đối với các cấu trúc câu khác nĩi chung. Do tính phức tạp của câu hỏi, các
cấu trúc câu hỏi thường phải cĩ sự tác động bởi cả 4 giai đoạn: chuyển đổi cơ sở
dựa trên các nguyên tắc; chuyển đổi các thành phần cùng cấp/khác cấp và cuối cùng
là giai đoạn chèn/xố.
5.2 Đánh giá
5.2.1 Ngữ liệu thử nghiệm
Ngữ liệu thử nghiệm của chúng em gồm 1.000 câu trong bộ sách CADASA
trong phần chưa được dùng để huấn luyện.
Kết quả thử nghiệm được tĩm tắt trong bảng sau:
(E1) How can a computer compute a complex formular ?
(V1) Một máy tính cĩ thể tính tốn một cơng thức phức tạp bằng cách nào ?
Chương 5 – Thử nghiệm & đánh giá
Trang 135
W A Độ chính xác Ds
Sau khi gán nhãn chuyển đổi cơ sở 17.767 2.239 87,4%
Sau khi chuyển đổi cùng cấp 17.767 1.385 92,2%
Sau khi chuyển đổi khác cấp 17.767 1.058 94,1%
Bảng 17: Kết quả thử nghiệm việc áp dụng chuyển đổi cây cú pháp
Ngồi ra để đánh giá chung về kết quả chuyển đổi của chương trình (bao gồm
cả phần chèn/xố các thành phần chức năng trong tiếng Việt. Chúng em so sánh kết
xuất của chương trình với một chương trình dịch hiện cĩ ở thị trường, EVTRAN 2.0
(cơng ty SOFTEX, 1999-2000). Do kết quả dịch là sự phối hợp giữa chuyển đổi cấu
trúc và chuyển đổi từ vựng, nên việc đánh giá kết quả chuyển đổi cấu trúc khơng thể
làm tự động dựa vào kết quả dịch. Chúng ta chỉ cĩ thể đánh giá một câu đúng, sai
về trật tự từ mà thơi. Một số mẫu câu dịch từ hai hệ thống được chúng em trình bày
trong phần phụ lục 4. Ở đây chúng em muốn nhấn mạnh đến trật tự của từ trong câu
cịn về ngữ nghĩa trên bề mặt của câu thuộc về một thành phần khác của hệ dịch.
5.2.2 Nhận xét
Chương trình chuyển đổi cây cú pháp chuyển đổi rất tốt trong phạm vi cùng
cấp và chuyển đổi được các thành phần khác cấp, điều mà các chương trình chuyển
đổi dựa trên luật cố định khơng thể thực hiện được hoặc chỉ cĩ thể thực hiện trên bề
mặt câu.
Tuy nhiên vẫn cịn một số vấn đề trở ngại rất lớn cho việc chuyển đổi cú pháp.
Đĩ là sự phụ thuộc của chương trình chuyển đổi cây cú pháp vào sự chính xác của
quá trình phân tích ở bước trước. Cụ thể đĩ là các bộ phận: gán nhãn từ loại, phân
tích cú pháp câu, và xác định quan hệ ngữ pháp trong câu.
Chẳng hạn, nếu các từ trong cây cú pháp bị gán nhãn từ loại sai dẫn đến cây cú
pháp của câu cũng bị sai. Phương pháp học chuyển trạng thái cĩ thể học ra luật khắc
phục những lỗi sai cĩ hệ thống. Những lỗi sai quá chi tiết dẫn đến luật sửa sai cũng
chi tiết và khơng thể áp dụng cho đa số các trường hợp khác, thậm chí cĩ thể làm
Chương 5 – Thử nghiệm & đánh giá
Trang 136
sai ở trường hợp mới. Để khắc phục nhược điểm này, ta cần phải tăng lượng ngữ
liệu học và tính đa dạng của bộ ngữ liệu học.
Chương 6 - Tổng kết
Trang 137
Chương 6
TỔNG KẾT
6.1 Kết quả
Hiện nay, chương trình chuyển đổi cây cú pháp cĩ khả năng:
Chuyển đổi trật tự các thành phần cùng cấp với nhiều mức độ phức tạp:
chuyển đúng vị trí các định ngữ so với danh từ trung tâm trong định ngữ,
bổ ngữ so với tính từ/động từ trong tính ngữ/động ngữ, …
Chuyển đổi trật tự các thành phần khơng cùng cấp: chuyển vị trí các
trạng từ bổ nghĩa cho câu, vị trí những từ hỏi, …
Chèn, xố một số thành phần như: xố trợ động từ trong câu tiếng Anh
(khơng cĩ ý nghĩa ngữ pháp trong tiếng Việt), chèn thêm một số hư từ để
câu tiếng Việt trở nên tự nhiên hơn.
Như vậy, chương trình đã cơ bản hồn thành những mục tiêu mà luận văn đã
đề ra ban đầu là chuyển đổi cây cú pháp cho tài liệu khoa học kỹ thuật (trước mắt là
tài liệu về tin học) và cĩ khả năng tiếp tục mở rộng trong tương lai khi chúng em
xây dựng được kho ngữ liệu huấn luyện đầy đủ và bao quát hơn nữa. Tuy nhiên cho
đến nay, chương trình vẫn cịn một số hạn chế do sự nhập nhằng về mặt cấu trúc
cũng như độ chính xác của kết quả khối phân tích bước trước (phân tích ngữ pháp,
xác định quan hệ, …).
6.2 Hướng phát triển
Chương trình được cài đặt theo phương pháp hướng đối tượng kết hợp với khả
năng mở rộng của chương trình học, do đĩ cĩ khả năng phát triển dễ dàng trong
tương lai. Trong thời gian tới, chúng em sẽ tiếp tục hồn thiện ngữ liệu học cả về số
lượng lẫn chất lượng để chương trình bao quát nhiều cấu trúc hơn nữa.
Chương 6 - Tổng kết
Trang 138
Mặt khác, do giới hạn của luận văn, khung luật trong chương trình chỉ khai
thác các đặc trưng về từ loại, từ, cấu trúc ngữ, … mà chưa quan tâm đến những
nhân tố ảnh hưởng đến sự khác biệt cấu trúc giữa tiếng Anh và tiếng Việt khác. Do
đĩ, chúng em sẽ tiếp tục mở rộng thêm các loại khung luật để cĩ thể rút trích được
những đặc trưng cịn lại như: ngữ nghĩa, chiều dài nghĩa tiếng Việt của một thành
phần cú pháp (chẳng hạn: "Trong tiếng Việt, định ngữ dài hơn sẽ đứng sau các định
ngữ ngắn hơn"), loại tính từ miêu tả làm định ngữ trong các danh ngữ (chỉ màu sắc,
hình dáng,...), ...
6.3 Kết luận
Cấu trúc cú pháp của câu gĩp phần tạo nên ngữ nghĩa của câu. Do đĩ, chuyển
đổi cấu trúc cú pháp trong hệ dịch tự động Anh-Việt gĩp một phần khơng nhỏ vào
chất lượng của hệ dịch. Trong luận văn này, chúng em đưa ra một cách tiếp cận mới
trong việc chuyển đổi cây cú pháp Anh-Việt, dựa trên phương pháp học Chuyển
trạng thái và hướng lỗi nhanh (FnTBL) để rút trích tri thức chuyển đổi từ ngữ liệu
song ngữ. Chương trình chuyển đổi cây cú pháp được cài đặt cho kết quả thử
nghiệm trên các tài liệu Khoa học khá cao (trên 94%) đã chứng tỏ đây là một
phương pháp cĩ tiềm năng rất lớn.
Với kết quả đạt được và qua thực nghiệm, chúng em thấy rằng khối chuyển
đổi cây cú pháp của chúng em thực hiện cĩ thể được đưa vào làm khối chuyển đổi
trong hệ dịch tự động Anh-Việt dựa trên sự chuyển đổi khá tốt. Đây cũng chỉ là
bước khởi đầu trong quá trình nghiên cứu về chuyển đổi cấu trúc Anh-Việt. Để
chương trình đạt chất lượng cao nhất địi hỏi cả một quá trình tiếp tục lao động
nghiên cứu, sáng tạo khơng ngừng. Tuy nhiên, kết quả bước đầu này của chương
trình là một sự khích lệ để chúng em bước tiếp trên con đường thực hiện mơ ước
“được đĩng gĩp một phần nhỏ bé vào việc xây dựng một hệ dịch tự động từ tiếng
Anh sang chính tiếng mẹ đẻ của mình - tiếng Việt”.
Phụ lục
Trang 139
PHỤ LỤC 1
KHUNG LUẬT VÀ MỘT SỐ LUẬT CÙNG CẤP
STT Khung luật học chuyển đổi cùng cấp
1 prpos=(P) & pos(X,Y)=() & idx(X,Y)=() : idx(X,Y)=()
2 grpos=(G) & prpos=(P) & pos(X,Y)=() & idx(X,Y)=() : idx(X,Y)=()
3 prpos=(P) & pos(X,Y)=() & wrd(T)=({DT},W) & idx(X,Y)=() : idx(X,Y)=()
4 prpos=(P) & pos(X,Y)=() & wrd(T)=({JJ},W) & idx(X,Y)=() : idx(X,Y)=()
5 prpos=(P) & pos(X,Y)=() & wrd(T)=({RB},W) & idx(X,Y)=() : idx(X,Y)=()
6 prpos=(P) & pos(X,Y)=() & wrd(T)=({IN},W) & idx(X,Y)=() : idx(X,Y)=()
7 prpos=(P) & pos(X,Y)=() & wrd(T)=({AUX},W) & idx(X,Y)=() :
idx(X,Y)=()
8 prpos=(P) & pos(X,Y)=() & wrd(T)=({PRP$},W) & idx(X,Y)=() :
idx(X,Y)=()
9 prpos=(P) & pos(X,Y)=() & wrd(T)=({CC},W) & idx(X,Y)=() : idx(X,Y)=()
10 prpos=(P) & pos(X,Y)=() & wrd(T)=({MD},W) & idx(X,Y)=() :
idx(X,Y)=()
11 prpos=(P) & pos(X,Y)=() & wrd(T)=({PRT},W) & idx(X,Y)=() :
idx(X,Y)=()
12 prpos=(P) & pos(X,Y)=() & wrd(T)=({ORD},W) & idx(X,Y)=() :
idx(X,Y)=()
STT Một số luật chuyển đổi cùng cấp
1 prpos=({NP}) & pos(1,2)=({NN},{CD}) & idx(1,2)=({2},{1}) :
idx(1,2)=({1},{2})
2 prpos=({NP}) & pos(1,3)=({DT},{NN},{POS}) & wrd(1)=({DT},{the}) &
idx(1,3)=({2},{3},{1}) : idx(1,3)=({1},{3},{2})
3 prpos=({NP}) & pos(1,2)=({NNP},{CD}) & idx(1,2)=({2},{1}) :
idx(1,2)=({1},{2})
4 grpos=({S1}) & prpos=({SBARQ}) & pos(1,3)=({WHNP},{SQ},{.}) &
Phụ lục
Trang 140
idx(1,3)=({1},{2},{3}) : idx(1,3)=({2},{1},{3})
5 prpos=({VP}) & pos(1,3)=({MD},{ADVP},{VP}) & idx(1,3)=({1},{2},{3})
: idx(1,3)=({2},{1},{3})
6 prpos=({NP}) & pos(1,3)=({DT},{ORD},{NN}) & idx(1,3)=({1},{2},{3}) :
idx(1,3)=({1},{3},{2})
7 grpos=({S}) & prpos=({NP}) & pos(1,3)=({NP},{:},{NP}) &
idx(1,3)=({1},{2},{3}) : idx(1,3)=({3},{1},{2})
8 prpos=({ADJP}) & pos(1,2)=({RB},{JJR}) & wrd(1)=({RB},{much}) &
idx(1,2)=({1},{2}) : idx(1,2)=({2},{1})
9 prpos=({SQ}) & pos(1,3)=({MD},{NP},{VP}) & idx(1,3)=({1},{2},{3}) :
idx(1,3)=({2},{1},{3})
10 prpos=({ADVP}) & pos(1,2)=({RBS},{RB}) & idx(1,2)=({1},{2}) :
idx(1,2)=({2},{1})
11 prpos=({NP}) & pos(1,3)=({VB},{NN},{CD}) & idx(1,3)=({1},{3},{2}) :
idx(1,3)=({1},{2},{3})
12 prpos=({SBARQ}) & pos(1,3)=({WHADVP},{SQ},{.}) &
idx(1,3)=({1},{2},{3}) : idx(1,3)=({2},{1},{3})
13 prpos=({NP}) & pos(1,4)=({DT},{NN},{NN},{POS}) &
idx(1,4)=({2},{4},{3},{1}) : idx(1,4)=({1},{4},{3},{2})
14 prpos=({ADJP}) & pos(1,3)=({RBS},{RB},{VBN}) &
idx(1,3)=({1},{2},{3}) : idx(1,3)=({3},{2},{1})
15 prpos=({NP}) & pos(1,4)=({DT},{JJ},{NN},{POS}) &
wrd(1)=({DT},{the}) & idx(1,4)=({2},{4},{3},{1}) :
idx(1,4)=({1},{4},{3},{2})
16 grpos=({SQ}) & prpos=({VP}) & pos(1,2)=({AUX},{NP}) &
idx(1,2)=({1},{2}) : idx(1,2)=({2},{1})
17 prpos=({NP}) & pos(1,3)=({DT},{JJ},{NN}) & wrd(2)=({JJ},{great}) &
idx(1,3)=({1},{3},{2}) : idx(1,3)=({1},{2},{3})
18 grpos=({ADJP}) & prpos=({ADVP}) & pos(1,2)=({RB},{RBR}) &
idx(1,2)=({1},{2}) : idx(1,2)=({2},{1})
19 grpos=({NP}) & prpos=({ADJP}) & pos(1,2)=({RB},{VBN}) &
idx(1,2)=({1},{2}) : idx(1,2)=({2},{1})
20 prpos=({NP}) & pos(1,4)=({JJ},{:},{NN},{NNS}) &
idx(1,4)=({1},{2},{4},{3}) : idx(1,4)=({4},{1},{3},{2})
Phụ lục
Trang 141
PHỤ LỤC 2
KHUNG LUẬT VÀ MỘT SỐ LUẬT KHÁC CẤP
STT Khung luật học chuyển đổi khác cấp
1 route() & pos() & posb(X,Y)=() & pose(W,Z)=() : move(U,V)
2 route() & pos() & posb(X,Y)=() & pose(W,Z)=() & posw()=(IN) &
wrd()=(T) : move(U,V)
3 route() & pos() & posb(X,Y)=() & pose(W,Z)=() & posw()=(IN) &
wrd()=(T) & noc()=(N) : move(U,V)
STT Một số luật chuyển đổi khác cấp
1 route(0.1.0,0.1,0)&pos(RB,ADVP,VP)&posb(0,0)=(RB)&
pose(0,2)=(AUX,ADVP,NP):move(0,0)posw()=(RB)&wrd()=(too): move(0,0)
2 route(0.1,0,0.2) & pos(ADVP,S,VP) & posb(0,3)=(NP,ADVP,VP,.) &
pose(0,1)=(VBZ,SBAR) : move(1,1)
3 route(0.1,0,0.2) & pos(ADVP,S,VP) & posb(0,3)=(NP,ADVP,VP,.) &
pose(0,1)=(VBP,SBAR) : move(1,1)
4 route(0.2.1,0.2,0) & pos(AUX,VP,SQ) & posb(0,1)=(N*,AUX) &
pose(0,2)=(N*,MD,VP) : move(1,2)
5 route(0.1,0,0.2) & pos(WH*,VP,PP) & posb(0,2)=(VBG,WH*,PP) &
pose(0,0)=(IN) : move(1,1)
6 route(0.1.0,0.1,0,0.0) & pos(RB,VP,S,NP) & pose(0,0)=(EX) & posw()=(RB)
& wrd()=(not) : move(0,0)
7 route(0.3.1,0.3,0) & pos(AUX,VP,SQ) & posb(0,1)=(N*,AUX) &
pose(0,4)=(NP,AUX,ADVP,VP,.) & posw(1)=(AUX) & wrd(1)=(been) :
move(1,3)
8 route(0.1.0,0.1,0,0.0,0.0.0) & pos(WP,WH*,SBARQ,SQ,VP) &
posb(0,0)=(WP)&pose(0,1)=(VB*,S)&posw()=(WP)&wrd()=(what):move(1,0)
9 route(0.1,0,0.2,0.2.0) & pos(WH*,VP,S,VP) & posb(0,2)=(VBG,WH*,S) &
pose(0,0)=(TO) : move(1,1)
10 route(0.2.0,0.2,0) & pos(RB,ADVP,VP) & posb(0,0)=(RB) &
pose(0,2)=(VBP,NP,ADVP) &
Phụ lục
Trang 142
PHỤ LỤC 3
MỘT SỐ KẾT QUẢ DỊCH SỬ DỤNG KHỐI CHUYỂN
ĐỔI CÂY CÚ PHÁP VCLTRANSFER
Với đề tài “Xây dựng chương trình chuyển đổi cây cú pháp tự động trong hệ
dịch Anh-Việt” của chúng em, chất lượng chuyển đổi của chương trình đã được
kiểm chứng thực tế qua việc tích hợp khối chuyển đổi vào trong hệ dịch Anh-Việt
hồn chỉnh. Dưới đây là một số kết quả dịch của hệ dịch VCLEVT 2.0 đã được tích
hợp khối chuyển đổi cây cú pháp của chúng em (đây là chương trình dịch tự động
Anh-Việt do nhĩm VCL thực hiện).
* Do chúng em muốn nhấn mạnh đến chất lượng của khối chuyển đổi nên
trong phần dịch dưới đây chúng em cĩ hiệu chỉnh lại ngữ nghĩa của một số từ chưa
được dịch chính xác lắm (tuy nhiên rất hạn chế), điều này chỉ nhằm mục đích làm
cho câu dịch dễ đọc và dễ theo dõi hơn; kết quả chuyển đổi là kết quả thực tế của
chương trình và khơng cĩ bất cứ sự hiệu chỉnh nào.
Các câu tiếng Anh thử nghiệm dưới đây thuộc bộ sách CADASA, Come to
the world of microcomputers, NXB Thống kê, 2002.
STT Câu tiếng Anh VCLEVT 2.0 (sử dụng VCLTransfer)
1 In an era of high-speed
communications, we want to
receive information immediately
and in many ways simultaneously.
Vào một thời đại của truyền thơng tốc độ
cao, chúng tơi muốn để nhận thơng tin ngay
lập tức và trong nhiều cách song song.
2 Today's multimedia products
appeal to multiple senses at one
time and respond to our changing
needs with ever-increasing speed.
Những sản phẩm truyền thơng đa phương
tiện của hơm nay kêu gọi tới nhiều giác
quan cùng một lúc và đáp ứng tới những
nhu cầu thay đổi của chúng tơi với tốc độ
ngày càng tăng.
Phụ lục
Trang 143
3 This chapter introduces you to
basic multimedia concepts and
explains how multimedia works.
Chương này giới thiệu bạn tới những khái
niệm truyền thơng đa phương tiện cơ bản
và giải thích làm thế nào những truyền thơng
đa phương tiện làm việc.
4 At a more advanced level, people
use movies and television to
combine multiple types of media
(sound, video, animation, still
graphics, and text) to create
different kinds of messages that
inform or entertain in unique and
meaningful ways.
Tại một mức tiên tiến hơn, người sử dụng
những phim và truyền hình để kết hợp nhiều
loại của phương tiện ( âm thanh, hình, hoạt
hình, vẫn cịn những đồ họa, và văn bản ) để
tạo ra những loại khác nhau của thơng điệp
mà báo tin hay là giải trí trong những cách
duy nhất và đầy ý nghĩa.
5 This requirement may mean
giving the user multiple pieces of
information simultaneously - such
as a rotating 3-D image of a motor,
an audio description of its
function, and pop-up text boxes
that provide more information
when the user points at certain
parts of the graphic.
Yêu cầu này cĩ thể nghĩa là đưa nhiều
miếng người dùng của thơng tin song song -
như là một hình ảnh 3-D đang quay của
một động cơ, một sự mơ tả âm của chức
năng của nĩ, và những cái hộp văn bản
phổ biến mà cung cấp thơng tin nhiều hơn
khi mà người dùng trỏ tại những bộ phận
nào đĩ của đồ họa.
6 Multimedia developers continually
struggle to find ways to make their
products more appealing to users,
whether the product is a fast-paced
action game, a tutorial on disk, or
an e-commerce Web site.
Những nhà phát triển truyền thơng đa
phương tiện liên tục đấu tranh để tìm thấy
những cách để làm những sản phẩm của họ
hấp dẫn hơn tới những người dùng, dù sản
phẩm là một trị chơi hoạt động fast-paced,
một sự hướng dẫn trên dĩa, hay là một trang
web thương mại điện tử.
7 Steps in a tutorial or a carefully
crafted story, for example, must be
told in an unalterable sequence for
accuracy or the most dramatic
impact.
Ví dụ như, những bước trong một sự hướng
dẫn hay là một chuyện được thủ cơng cẩn
thận, phải được bảo trong một dãy nối tiếp
khơng cĩ thể thay đổi được cho sự chính
xác hay là sự va chạm kịch tính nhất.
8 Because of the intensive amount
of digital information that goes
into building every second of a
program, multimedia publishers
must always consider the user's
equipment - the hardware on which
the content will be displayed.
Bởi vì lượng cao độ của thơng tin số mà đi
vào xây dựng mọi giây của một chương trình
nên nhà xuất bản truyền thơng đa phương
tiện luơn luơn phải cân nhắc thiết bị của
người dùng - phần cứng mà trên đĩ nội
dung sẽ được hiển thị.
Phụ lục
Trang 144
9 The advantage of passive matrix
monitors is that they are less
expensive than active matrix, a
major consideration in laptops
where the monitor can account for
one-third the cost of the entire
computer.
Thuận lợi của màn hình ma trận thụ động
là rằng chúng (thì) ít mắc hơn hơn so với
ma trận đang hoạt động, một sự cân nhắc
chính trong những máy xách tay nơi mà màn
hình cĩ thể xem như là one-third(một phần
ba) giá của tồn thể máy vi tính.
10 Many large companies and
organizations rely heavily on a
commercial or custom DBMS to
handle immense data resources.
Nhiều cơng ty lớn và tổ chức phụ thuộc
nặng nề trên một DBMS thương mại hay là
phong tục để xử lý những tài nguyên dữ
liệu bao la.
Các câu tiếng Anh thử nghiệm dưới đây thuộc phần Help and Support của
Windows XP Professional, Microsoft Coporation.
STT Câu tiếng Anh VCLEVT 2.0 (Sử dụng VCLTransfer)
1 Read articles containing full
descriptions for performing key
tasks from start to finish.
Đọc những tác phẩm chứa những sự mơ tả
đầy đủ cho thực hiện những nhiệm vụ chủ
chốt từ khởi đầu để/đến hồn tất.
2 Thank you for choosing to use
Windows-XP-Professional!
Cám ơn bạn cho chọn để sử dụng Windows-
XP-Professional!
3 There are many new and exciting
features at your fingertips.
Cĩ nhiều đặc tính mới và thú vị lúc/ở
những đầu ngĩn tay của bạn.
4 You can also communicate with
other people on other networks
without worrying about
compromising your privacy or
your personal data files.
Bạn cũng cĩ thể truyền tin với người khác
trên những mạng khác mà khơng cĩ lo ngại
về thỏa hiệp riêng tư của bạn hay là
những tập tin dữ liệu cá nhân của bạn.
5 Windows XP Professional has
many features and tools that will
make using your computer easy,
effective, and entertaining.
Windows XP Professional cĩ nhiều đặc tính
và cơng cụ mà sẽ làm sử dụng máy tính của
bạn dễ, hữu hiệu, và giải trí.
6 Copying software without the
permission of the owner is
"copyright infringement," and the
law imposes penalties on infringers.
Sao chép phần mềm mà khơng cĩ sự cho
phép của người sở hữu là `` sự vi phạm bản
quyền bản quyền, '' và luật đánh thuế những
phạt trên những người vi phạm bản quyền.
Phụ lục
Trang 145
7 Almost all commercial computer
software is licensed directly or
indirectly from the copyright
owner (the software publisher) for
use by the customer through a type
of contract called an "End User
License Agreement" (also known
as a EULA).
Hầu như tất cả phần mềm máy tính
thương mại được cho phép trực tiếp hay là
gián tiếp từ người sở hữu bản quyền ( nhà
xuất bản phần mềm ) cho việc sử dụng bởi
khách hàng xuyên qua một loại của hợp
đồng gọi một `` sự thỏa thuận giấy phép
người dùng cuối '' ( cũng biết như một
EULA ).
8 Do Microsoft products give me the
ability to access the Internet?
Những sản phẩm Microsoft cĩ đưa tơi khả
năng để truy cập Internet khơng?
9 Internet access is a feature
included in most Microsoft
products.
(sự) truy cập mạng INTERNET là một đặc
tính được bao gồm trong hầu hết những sản
phẩm Microsoft.
10 It is important to understand the
difference between registering
your copy of Windows-XP and
activating it.
Nĩ (thì) quan trọng để hiểu sự khác nhau
giữa đăng ký bản sao của bạn của
Windows-XP và kích hoạt nĩ.
Các câu tiếng Anh thử nghiệm dưới đây thuộc trang Web của PCWorld
Mỹ, địa chỉ
STT Câu tiếng Anh VCLEVT 2.0 (Sử dụng VCLTransfer)
1 Ink jet printers, along with digital
cameras, are changing the way we
print photographs.
Dọc theo với những máy ảnh số, những
máy in tia mực, đang thay đổi cách chúng
tơi in những bức hình chụp.
2 When loaded with special photo
inks and paper, ink jet printers
have become one of the best
options for transforming a digital
image into a photograph.
Khi mà nạp với những mực bức ảnh đặc
biệt và giấy, những máy in tia mực trở nên
một trong những sự lựa chọn tốt nhất cho
biến thể một hình ảnh số thành một bức
hình chụp.
3 These printers provide superior
text quality compared with high-
end ink jet printers.
Những máy in này cung cấp chất lượng
văn bản cao cấp so sánh với những máy in
tia mực đầu cuối.
4 Ink jet printers are inexpensive
printers for the masses, designed
for home users, students, or
anyone who isn't concerned about
Những máy in tia mực là những máy in
khơng đắt cho những khối lượng lớn, được
thiết kế cho những người dùng nhà, những
sinh viên, hay là ai (thì) khơng cĩ liên quan
Phụ lục
Trang 146
the highest text quality. khoảng chất lượng văn bản cao nhất nhất.
5 A high price does not necessarily
indicate excellent graphics.
Một giá cao khơng nhất thiết chỉ thị những
đồ họa xuất sắc.
6 From home offices to businesses,
monochrome laser printers offer
the best balance between price,
print quality, and speed.
Từ những văn phịng nhà tới những kinh
doanh, những máy in la-de đơn sắc đưa ra
cân bằng tốt nhất giữa giá, chất lượng in,
và tốc độ.
7 If you need color, you'll probably
want an ink jet printer, but if you
have the space, it's almost worth it
to buy both.
Nếu bạn cần màu thì bạn cĩ lẽ sẽ muốn một
máy in tia mực, nhưng nếu bạn cĩ khơng
gian thì nĩ (thì) nĩ đáng giá để mua cả hai.
8 Color laser toner cartridges are
also potentially hazardous to the
environment.
Những băng mực toner la-de màu (thì)
cũng cĩ tiềm năng nguy hiểm tới mơi
trường.
9 Few home users will need a color
laser printer
Một ít người dùng nhà sẽ cần một máy in
la-de màu.
10 If you plan to print mostly photos,
look for photo printers with extra
features such as a built-in PC
Card slot, an LCD panel that
allows you to view and print an
image without using your PC, and
bundled image-editing software.
Nếu bạn hoạch định để in chủ yếu những
bức ảnh thì tìm kiếm những máy in bức
ảnh với những đặc tính thêm như là một
khe PC Card nội tại, một bảng điều khiển
LCD mà cho phép bạn xem và in một hình
ảnh mà khơng cĩ sử dụng PC của bạn, và
phần mềm image-editing.
11 These printers provide superior
text quality compared with high-
end ink jet printers.
Những máy in này cung cấp chất lượng
văn bản cao cấp so sánh với những máy in
tia mực đầu cuối.
12 PC World tests and reviews three
different types of printers: ink
jets, monochrome lasers, and
color lasers, on a regular basis.
PC World kiểm tra và ơn lại ba loại khác
nhau của máy in: tia mực, những la-de
đơn sắc, và những la-de màu, trên một cơ
sở thơng thường.
Phụ lục
Trang 147
PHỤ LỤC 4
MỘT SỐ CÂU DỊCH CỦA HAI HỆ DỊCH
Dưới đây là một số kết quả dịch của hai hệ dịch VCLEVT 2.0 đã được tích
hợp khối chuyển đổi cây cú pháp của chúng em và hệ dịch EVTRAN 2.0 hiện là
một sản phẩm thương mại trên thị trường.
Các câu tiếng Anh thử nghiệm dưới đây thuộc bộ sách CADASA, Come to
the world of microcomputers, NXB Thống kê, 2002.
STT VCLEVT 2.0 (sử dụng VCLTransfer) EVTRAN 2.0
1 You can also communicate with other people on other networks without worrying
about compromising your privacy or your personal data files.
Bạn cũng cĩ thể truyền tin với người
khác trên những mạng khác mà khơng
cĩ lo ngại về thỏa hiệp riêng tư của
bạn hay là những tập tin dữ liệu cá
nhân của bạn.
Bạn cĩ thể cũng giao tiếp với những
người khác trên (về) những mạng khác
mà khơng cĩ gây lo lắng về việc thoả
hiệp sự riêng tư hoặc những tập tin dữ
liệu cá nhân (của) Bạn (của) Bạn.
2 From time to time , you may see the term Windows 3.x .
Từng lúc, bạn cĩ thể thấy/xem thuật
ngữ Windows 3.x.
Thỉnh thoảng, bạn cĩ thể nhìn thấy thuật
ngữ Windows 3. X.
3 In other words , two computers running Windows for Workgroups could be
networked together without the need to purchase a separate network operating
system like Novell NetWare .
Nĩi một cách khác, hai máy tính chạy
Windows cho Workgroups cĩ thể
được nối mạng cùng với mà khơng cĩ
nhu cầu để mua một hệ điều hành mạng
riêng biệt giống Novell NetWare.
Nĩi cách khác, hai máy tính chạy
Windows cho những nhĩm làm việc cĩ
thể (thì) được nối mạng cùng nhau mà
khơng cĩ nhu cầu để mua một hệ điều
hành mạng riêng biệt như Novell
NetWare.
4 The IBM / Microsoft partnership did not last long .
Phụ lục
Trang 148
Cùng hội IBM / Microsoft đã khơng
kéo dài lâu.
IBM / quan hệ đối tác Microsoft khơng
lần cuối kéo dài.
5 At the time of its release , Windows NT addressed the market for the 32-bit ,
networked workstations that used some of the most powerful CPUs on the market
.
Lúc thời gian của ấn bản của nĩ,
Windows NT định địa chỉ thị trường
cho những trạm làm việc 32-bit, nối
mạng mà sử dụng một vài CPU mạnh
nhất trên thị trường.
Vào thời gian (của) phiên bản (của) nĩ,
Windows NT hướng vào thị trường cho
32 bít, nối mạng những trạm làm việc
mà sử dụng một ít CPUs mạnh nhất
trên thị trường.
6 If you have a Macintosh , you may also be able to run some versions of UNIX or
Linux ( but not Windows ) .
Nếu bạn cĩ một Macintosh thì bạn cũng
cĩ thể cĩ khả năng để chạy vài phiên
bản của UNIX hay là Linux ( nhưng
khơng những cửa sổ ).
Nếu bạn cĩ một Macintosh, bạn cĩ thể
cũng (thì) cĩ thể chạy vài phiên bản
(của) UNIX hoặc Linux ( Nhưng Khơng
phải là Windows).
7 Do you plan to develop or test applications that run on a specific operating system ?
Bạn cĩ hoạch định để phát triển hay là
kiểm tra những ứng dụng mà chạy trên
một hệ điều hành cụ thể khơng?
Bạn lập kế hoạch phát triển hoặc kiểm
tra những ứng dụng mà chạy trên (về)
một hệ điều hành đặc biệt khơng ?
8 She plays tennis and he does too .
Cơ ấy chơi quần vợt và anh ấy cũng
vậy.
Cơ ấy cũng chơi quần vợt và anh ta làm.
9 The Web is a convenient place to obtain updated information about your new
operating system .
Web là một chỗ tiện lợi để nhận được
thơng tin được cập nhật về hệ điều
hành mới của bạn.
Mạng là một chỗ tiện lợi để đang tồn tại
cập nhật hệ điều hành thơng tin về
mới (của) bạn.
10 Resources on the local computer , as well as resources on remote servers , can be
configured to limit access to specific users and groups of users .
Những tài nguyên trên máy tính cục bộ,
tốt bằng những tài nguyên trên những
máy chủ từ xa, cĩ thể được cấu hình để
giới hạn (sự) truy cập tới những
người dùng cụ thể và những nhĩm
Những tài nguyên trên (về) máy tính địa
phương, cũng như những tài nguyên trên
(về) những người phục vụ từ xa, cĩ thể
được định hình tới những truy nhập tới
những người dùng và những nhĩm
Phụ lục
Trang 149
của người dùng. đặc biệt (của) người dùng giới hạn.
11 Although performance varies according to your hardware and application , you can
expect about a 50 percent improvement .
Mặc dù sự thực thi thay đổi tới phần
cứng và ứng dụng của bạn nhưng bạn
cĩ thể mong đợi về một sự cải tiến 50
phần trăm.
Mặc dầu sự thực hiện thay đổi theo phần
cứng và ứng dụng (của) bạn, bạn cĩ thể
chờ đợi khoảng một 50 sự cải tiến phần
trăm.
12 If you have an active Internet connection , the information will update
automatically .
Nếu bạn cĩ một kết nối Internet đang
hoạt động thì thơng tin sẽ cập nhật một
cách tự động.
Nếu bạn cĩ một tích cực kết nối
Internet, thơng tin sẽ cập nhật tự động.
13 Commercial software developers have also made a commitment to Linux , and
users can expect to see popular software applications to be modified to run under
Linux .
Những nhà phát triển phần mềm
thương mại cũng làm một sự cam kết
tới Linux, và những người dùng cĩ thể
mong đợi để thấy/xem những ứng dụng
phần mềm phổ biến để được hiệu đính
để chạy dưới Linux.
Phần mềm Thương mại (mà) những
người phát triển cĩ cũng làm một tống
đạt tới Linux, và những người dùng cĩ
thể mong đợi săn sĩc những ứng dụng
phần mềm đại chúng sẽ được sửa đổi
được chạy dưới Linux.
14 Some complicated language generation systems involve taking syntactic
knowledge, semantic knowledge, pragmatic knowledge and world knowledge
into consideration.
Vài hệ thống thế hệ ngơn ngữ làm
phức tạp liên quan lấy kiến thức cú
pháp, kiến thức ngữ nghĩa, kiến thức
võ đốn và kiến thức thế giới vào sự
cân nhắc.
Thế hệ ngơn ngữ được làm phức tạp
nào đĩ (mà) những hệ thống kéo theo
cầm (lấy) cho kiến thức và thế giới kiến
thức cú pháp , kiến thức ngữ nghĩa
học , thực dụng kiến thức vào trong sự
xem xét.
Phụ lục
Trang 150
Các câu tiếng Anh thử nghiệm dưới đây thuộc phần Help and Support của
Windows XP Professional, Microsoft Coporation.
STT VCLEVT 2.0 (sử dụng VCLTransfer) EVTRAN 2.0
1 Did you know?
Bạn cĩ biết khơng ? Làm bạn biết?
2 When you are connected to the Internet, this area will display links to timely help and
support information.
Khi mà bạn được nối tới Internet, khu
vực này sẽ hiển thị những mối liên kết
tới sự giúp đỡ đúng lúc và hỗ trợ thơng
tin.
Khi bạn đợc nối tới mạng(lới), nhau
(mà) vùng này sẽ trình bày liên kết tới
thơng tin giúp đỡ và hỗ trợ đúng lúc.
3 If you want to connect to the Internet now, start the New-Connection-Wizard and see
how to establish a Web connection through an Internet service provider.
Nếu bạn muốn để nối tới Internet bây giờ
thì bắt đầu New-Connection-Wizard và
thấy/xem làm thế nào để thiết lập một kết
nối web xuyên qua một nhà cung cấp
dịch vụ Internet.
Nếu bạn muốn nối tới Internet bây giờ,
khởi động New_Connection_Wizard và
xem làm sao để thiết lập một kết nối
Mạng xuyên qua một nhà cung cấp
dịch vụ Internet.
4 See what is new; take an entertaining tour; learn about the programs Windows-XP
contains, including systems, accessories, and communications and entertainment
programs.
Thấy/xem cái gì (thì) mới; lấy một
chuyến du lịch giải trí; học về những
chương trình Windows-XP chứa, bao
gồm những hệ thống, những phụ tùng,
và những truyền thơng và những
chương trình sự giải trí.
Xem cái gì (thì) mới; cầm (lấy) một giải
trí đi du lịch; học khoảng những chơng
trình (mà) Windows - XP chứa đựng , kể
cả những hệ thống, (mà) phụ kiện, và
truyền thơng và trị giải trí lập trình.
5 For example, you can use Remote-Desktop to access your work computer and its
resources from home, and to view files and documents on your computer's desktop
from a co-worker's computer.
Ví dụ như, bạn cĩ thể sử dụng Remote-
Desktop để truy cập máy tính cơng việc
của bạn và những tài nguyên của nĩ từ
nhà, và để xem những tập tin và những
tài liệu trên loại để bàn của máy tính
của bạn từ máy tính của một đồng
Chẳng hạn, bạn cĩ thể sử dụng Từ xa -
Desktop để truy nhập máy tính cơng
việc (của) bạn và những tài nguyên
(của) nĩ từ ở nhà, và để nhìn những hồ
sơ và những tài liệu trên máy tính của
bạn cĩ Desktop từ một co - máy tính
Phụ lục
Trang 151
nghiệp. (của) cơng nhân.
6 With NetMeeting you can have virtual meetings with anyone, anywhere, and you
can participate in discussions using audio, video, or chat.
Với NetMeeting bạn cĩ thể cĩ những
cuộc họp ảo với bất kỳ ai, bất kỳ nơi nào,
và bạn cĩ thể tham dự những cuộc thảo
luận sử dụng âm, hình, hay là tán gẫu.
Với NetMeeting bạn cĩ thể cho phép
thực tế gặp Với bất cứ ai, bất cứ nơi
đâu, và bạn cĩ thể can dự vào những
thảo luận sử dụng âm thanh, viđêơ, hoặc
tán gẫu.
7 Windows-XP-Professional provides extensive online Help for all operating
system features, as well as a digital tour to help you discover the possibilities
awaiting you.
Windows-XP-Professional cung cấp sự
giúp đỡ trực tuyến mở rộng cho tất cả
những đặc tính hệ điều hành, tốt bằng
một chuyến du lịch số để giúp bạn khám
phá những khả năng đợi bạn.
Windows - XP - Chuyên nghiệp cung
cấp sự Giúp đỡ trực tuyến rộng lớn
cho tất cả các đặc tính hệ điều hành,
cũng nh một số đi du lịch Giúp đỡ bạn
khám phá những khả năng đợi bạn.
8 Computer software is protected by copyright law and international copyright
treaties as well as other intellectual property laws and treaties.
Phần mềm máy tính được bảo vệ bởi
luật bản quyền và những hiệp ước bản
quyền quốc tế tốt bằng những luật và
những hiệp ước tài sản trí thức khác.
Phần mềm Máy tính là những pháp
luật và những hiệp ước được bảo vệ
bởi luật bản quyền và những hiệp ớc
bản quyền quốc tế cũng nh sở hữu trí
tuệ khác.
9 Microsoft is not responsible for Webcasting or any other form of transmission
received from any linked site.
Microsoft (thì) khơng chịu trách nhiệm về
Webcasting hay là bất kỳ hình thức khác
nào của sự truyền nhận từ bất kỳ chỗ
được liên kết nào.
Microsoft khơng (thì) cĩ trách nhiệm với
Webcasting hoặc mọi mẫu (dạng) khác
(của) sự truyền nhận từ bất kỳ vị trí đợc
liên kết nào.
10 With online registration, you can use your modem or an Internet connection to
register your copy of Windows-XP.
Với sự đăng ký trực tuyến, bạn cĩ thể
sử dụng bộ điều giải của bạn hay là một
kết nối Internet để đăng ký bản sao của
bạn của Windows-XP.
Với trực tuyến registration, Bạn cĩ thể
sử dụng mơ đem (của) bạn hoặc một
kết nối Internet để đăng ký sự sao chép
(của) bạn (của) Windows - XP.
11 Registration ensures that you receive product support, product update information,
and other benefits.
Phụ lục
Trang 152
Sự đăng ký bảo đảm rằng bạn nhận hỗ
trợ sản phẩm, thơng tin cập nhật sản
phẩm, và những lợi ích khác.
Sự Đăng ký bảo đảm rằng bạn nhận sản
phẩm hỗ trợ, sản phẩm cập nhật
thơng tin, và những lợi ích khác.
Một số câu hỏi do chúng em đưa ra
STT VCLEVT 2.0 (sử dụng VCLTransfer) EVTRAN 2.0
1 What are you doing ?
Bạn đang làm cái gì? Bạn đang gì làm?
2 What should I do to keep up with John ?
Tơi nên làm cái gì để tiếp tục với John ? Tơi cần phải làm giữ vững với
John gì?
3 Who did he beat two years ago ?
Anh ấy đã đánh ai cách đây hai năm ? Ai làm cho anh ta đập hai năm
trước đây?
4 How tall is your mother’s sister ?
Chị/em gái của mẹ của bạn là cao bao
nhiêu ?
Làm sao cao là mẹ (của) bạn cĩ
chị, em gái ?
Phụ lục
Trang 153
PHỤ LỤC 5
HỆ THỐNG NHÃN NGỮ PHÁP
Nhãn từ loại của Penn Tree Bank, kho ngữ liệu thơng dụng nhất hiện nay.
STT Nhãn từ loại Ý nghĩa
1 CC Liên từ kết hợp (Coordinating conjunction)
2 CD Số đếm (Cardinal number)
3 DT Định từ (Determiner)
4 EX “cĩ” (Existential “there”)
5 FW Từ tiếng nước ngồi (Foreign word)
6 IN Giới từ hay liên từ với mệnh đề phụ (Preposition or
subordinating conjunction)
7 JJ Tính từ (Adjective)
8 JJR Tính từ so sánh hơn (Adjective, comparative)
9 JJS Tính từ so sánh nhất (Adjective, superlative)
10 LS Dấu liệt kê(List item marker)
11 MD Động từ khiếm khuyết (Modal)
12 NN Danh từ số ít hay khơng đếm được (Noun, singular or
mass)
13 NNS Danh từ số nhiều (Noun, plural)
14 NP Danh từ riêng số ít (Proper noun, singular)
15 NPS Danh từ riếng số nhiều (Proper noun, plural)
16 PDT Tiền chỉ định từ (Predeterminer)
17 POS Dấu cuối của sở hữu cách (Possessive ending)
18 PP Đại từ nhân xưng (Personal pronoun)
19 PP$ Đại từ sở hữu (Possessive pronoun)
20 RB Trạng từ (Adverb)
21 RBR Trạng từ so sánh hơn (Adverb, comparative)
Phụ lục
Trang 154
22 RBS Trạng từ so sánh nhất (Adverb, superlative)
23 RP Tiểu từ (Particle)
24 SYM Ký hiệu (Symbol)
25 TO Từ “to”
26 UH Thán từ (Interjection)
27 VB Động từ nguyên mẫu khơng “to” (Verb, base form)
28 VBD Động từ thì quá khứ (Verb, past tense)
29 VBG Danh động từ hay hiện tại phân từ (Verb, gerund or
present participle)
30 VBN Quá khứ phân từ (Verb, past participle)
31 VBP Động từ khơng phải ngơi thứ ba số ít thì hiện tại(Verb,
non-3rd person singular present)
32 VBZ Động từ ngơi thứ ba số ít thì hiện tại (Verb, 3rd person
singular present)
33 WDT Định từ bắt đầu bằng Wh- (Wh-determiner)
34 WP Đại từ bắt đầu bằng Wh- (Wh-pronoun)
35 WP$ Đại từ sở hữu bắt đầu bằng Wh- (Possessive wh-pronoun)
36 WRB Trạng từ bắt đầu bằng Wh- (Wh-adverb)
20 nhãn cú pháp của Penn Tree Bank:
STT Nhãn cú pháp Ý nghĩa
1 ADJP Ngữ tính từ (Adjective phrase)
2 ADVP Ngữ trạng từ (Adverbial phrase)
3 AUX Ngữ động từ cĩ trợ động từ (Auxiliary verb phrase)
4 CONJP Ngữ cĩ liên từ (Coordinate phrase)
5 INTJ Ngữ cảm thán từ (Interjection)
6 NEG Ngữ phủ định (Negative)
7 NP Danh ngữ (Noun phrase)
8 PP Giới ngữ (Preposional phrase)
9 PRT Ngữ bắt đầu bằng tiểu từ (Partical phrase)
10 S Mệnh đề khẳng định đơn (Simple declarative clause)
Phụ lục
Trang 155
11 SBAR Mệnh đề phụ bổ nghĩa (Subordinate clause)
12 SBARQ Mệnh đề bắt đầu bằng từ hỏi Wh-
13 SINV Câu đảo ngữ (Inversion sentence)
14 SQ Bộ phận cịn lại của SBARQ sau khi đã bỏ từ/ngữ Wh-
15 VP Động ngữ (Verb phrase)
16 WHADVP Trạng ngữ bắt đầu bằng Wh- (Wh- adverbial phrase)
17 WHNP Danh ngữ bắt đầu bằng Wh- (Wh- noun phrase)
18 WHPP Giới ngữ bắt đầu bằng Wh- (Wh- preposional phrase)
19 X Thành phần khơng xác định (Constituent of unknown or
uncertain type)
20 ? Dấu hỏi trong câu hỏi (Question mark enclosing a
constituent)
Phụ lục
Trang 156
PHỤ LỤC 6
CÁC NHÃN QUAN HỆ NGỮ PHÁP
STT Nhãn quan hệ Ví dụ
1 appo “ACME president, —appoỈP.W. Buckman”
2 aux shouldÅaux—resign
3 be “isÅbe—sleeping
4 c “thatÅc—John loves Mary
5 compl first complement
6 det “theÅdet—hat”
7 gen “Jane’sÅgen—uncle”
8 have “haveÅhave—disappeared”
9 i the relationship between a C clause and its I clause
10 inv-aux inverted auxiliary: “WillÅinv-aux—you stop it”
11 inv-be inverted be: “IsÅinv-be—she sleeping”
12 inv-have inverted have: “HaveÅinv-have—you slept”
13 mod the relationship between a word and its adjunct modifier
14 pnmod post nomial modifier
15 p-spec specifier of prepositional phrases
16 pcomp-c clausal complement of prepositions
17 pcomp-n nominal complement of prepositions
18 post post determiner
19 pre pre determiner
20 pred predicate of a clause
21 rel relative clause
22 vrel passive verb modifier of nouns
23 wha wh-elements at C-spec positions
24 whn wh-elements at C-spec positions
25 whp wh-elements at C-spec positions
26 obj object of verbs
Tài liệu tham khảo
Trang 157
TÀI LIỆU THAM KHẢO
[1] Aravind K.Joshi & Yves Schabes, An Eearley Type Parsing Algorimth for
Tree Adjoining Grammars, Proceedings of the 26th Meeting of the Association
for Computational Linguistics, Buffalo, June 1998.
[2] Aravind K.Joshi, An Introduction to Tree Adjoining Grammars, A. Manaster-
Rammer, editor, Mathematics of Language. John Benjamins, Amsterdam,
1987.
[3] David Yarowsky and Grace Ngai. Inducing Multilingual POS Taggers and NP
Bracketers via Robust Projection across Aligned Corpora, Proceedings of
HLT-02, 2002.
[4] Đinh Điền, Dịch tự động Anh - Việt dựa trên việc học luật chuyển đổi từ ngữ
liệu song ngữ, Luận án tiến sĩ tốn học, ĐHKHTN - ĐHQG Tp.HCM, 2003.
[5] Dinh Dien, Hoang Kiem, Van Toan, Quoc Hung, Phu Hoi, Thuy Ngan, Xuan
Quang, Word alignment in English – Vietnamese bilingual corpus,
Proceedings of International Conference on East-Asia Language Processing
and Internet Information Tecnology 2002, Hanoi, Vietnam, 2002, pp. 3-11.
[6] Dinh Dien, Thuy Ngan, Xuan Quang, A Hybrid Approach to Word Order
Transfer in the English-to-Vietnamese Machine Translation, paper at MT –
Summit IX, Lousiana., USA, 2003.
[7] Dinh Dien, Thuy Ngan, Xuan Quang, Automatic Tree Transfer in English-
Vietnamese Machine Translation, The First International Workshop for
Computer, Information and Communication Technologies – Theme: State of
Art and Future Trends of Information Technologies in Korea and Vietnam –
11 February 2003 – Hanoi, Vietnam, 2003, pp. 7-12.
[8] Eric Brill, A corpus-based approach to language learning, PhD-dissertation,
1993.
Tài liệu tham khảo
Trang 158
[9] James Allen, University of Rochester, Natural Language Understanding, the
Benjamin/Cummings Publishing Company, Inc., 1995.
[10] Ken Samuel, Presentation for DFKI about TBL, Lecture of University, 1997.
[11] Kuang-Hua Chen & Hsin-His Chen, A Hybrid Approach to Machine
Translation System Design, Computational Linguistics and Chinese Languge
Processing. Vol. 1, no. 1, August 1996.
[12] Ngơ Quốc Hưng và Phạm Phú Hội, Liên kết từ trong song ngữ Anh-Việt (Ứng
dụng trong khảo sát trật tự từ), Luận văn tốt nghiệp cử nhân tin học,
ĐHKHTN, 2002.
[13] Nguyễn Đức Dân, Phạm trù thứ tự trong tiếng Việt, Tập san khoa học A –
ĐHTH TP. HCM, số 1/1995.
[14] Nguyễn Lưu Thùy Ngân, Đỗ Xuân Quang, Nguyễn Văn Tồn, Ứng dụng phân
tích ngữ pháp song song vào song ngữ Anh-Việt, Hội nghị khoa học trường
ĐHKHTN lần III, 2002, pp. 192-196.
[15] Nguyễn Tài Cẩn, Ngữ pháp tiếng Việt, NXB ĐHQG Hà Nội, 1998.
[16] Radu Floriance & Grace Ngai, Transformation-Based Learning in the Fast
Lane : A generative Approach, ACL 2001.
[17] Rebecca Hwa, Philip Resnik, Amy Weinberg, and Okan Kolak, Evaluating
Translational Correspondence using Annotation Projection, ACL 2002.
[18] Stuart Sheiber & Yves Schabes, Synchronous Tree Adjoining Grammars,
Proceedings of 13th COLING-90, Helsinki, ACL 1990.
[19] Trần Quốc Bảo, Tìm hiểu và cài đặt bộ phân tích cú phấp dựa trên văn phạm
TAG (Tree adjoining grammar) để phân tích cú pháp câu tiếng Anh, Luận văn
cử nhân tin học, ĐHKHTN, 2002.
[20] Cigdem Keyder Turhan, Structural transfer in an English to Turkish machine
translation system, PhD-dissertation, The Middle East Technical University,
1998.
Tài liệu tham khảo
Trang 159
[21] W. John Hutchins, An Introduction to Machine Translation, The Library of the
University of East Anglia – Norwich – UK, 1992.
Các file đính kèm theo tài liệu này:
- Luận văn-Xây dựng chương trình chuyển đổi cây cú pháp trong hệ dịch tự động Anh-Việt.pdf