Tác·giả: Dũng Vũ
Dịch
máy (machine
translation) đã trở·thành một tiện·ích phổ·biến trong thời·đại internet.
Đây là một trong
những đề·tài phức·tạp nhất của việc·xử·lý ngôn·ngữ con·người trong lĩnh·vực trí·thông·minh nhân·tạo (artificial intelligence) mà giới khoa·học
đã miệt·mài nghiên·cứu để đạt nhiều kết·quả đáng·kể ngày·hôm·nay: tự·điển song·ngữ
tự·động (Anh·Đức, Anh·Pháp, Anh·Nhật, Anh·Việt,…), dịch cụm·từ, câu (như Google
Translator, Babel Fish,…). Tuy·nhiên vẫn còn nhiều khó·khăn.
Dịch máy cũng là
đề·tài được giới khoa·học Việt·Nam quan·tâm và còn gặp nhiều khó·khăn hơn nữa,
ít nhất vì những nguyên·nhân khách·quan sau đây:
Thứ nhất, tiếng·Việt là một ngôn·ngữ rất phức·tạp
(so với ngôn·ngữ Âu·châu).
Thứ hai, dịch máy là một chủ·đề còn mới·mẻ đối·với
giới ngôn·ngữ·học điện·toán Việt·Nam.
Thời·gian nghiên·cứu
chưa lâu (ước khoảng một thập·niên trở·lại·đây). Thiếu nhân·sự, kỹ·thuật, kinh·nghiệm
kỹ·nghệ, tài·chính,… Thậm·chí thiếu kiến·thức ngôn·ngữ·học thuần·túy và đôi·khi
vẫn chưa nắm được đặc·điểm tiếng·Việt.
Bài·viết sơ·lược
này sẽ chỉ·ra một·số vấn·đề dịch máy tiếng·Việt và đồng·thời gợi·ý giải·quyết.
Tuy đây là một đề·tài chuyên·môn nhưng bài·viết chọn cách trình·bày bình·dân,
dễ·hiểu thay·cho hình·thức một tiểu·luận khoa·học khô·khan…
Xem bài viết bằng
bản PDF tại đây:
Phần 3
Phần 4
© 2010 Dũng Vũ
© 2010 talawasURL nguồn: http://www.talawas.org/?p=26459
Không có nhận xét nào:
Đăng nhận xét