Thứ Tư, 25 tháng 5, 2011

Dũng·Vũ - Tiếng Việt và vấn·đề dịch·máy


Tác·giả: Dũng Vũ

Dịch máy (machine translation) đã trở·thành một tiện·ích phổ·biến trong thời·đại internet.

Đây là một trong những đề·tài phức·tạp nhất của việc·xử·lý ngôn·ngữ con·người trong lĩnh·vực trí·thông·minh nhân·tạo (artificial intelligence) mà giới khoa·học đã miệt·mài nghiên·cứu để đạt nhiều kết·quả đáng·kể ngày·hôm·nay: tự·điển song·ngữ tự·động (Anh·Đức, Anh·Pháp, Anh·Nhật, Anh·Việt,…), dịch cụm·từ, câu (như Google Translator, Babel Fish,…). Tuy·nhiên vẫn còn nhiều khó·khăn.

Dịch máy cũng là đề·tài được giới khoa·học Việt·Nam quan·tâm và còn gặp nhiều khó·khăn hơn nữa, ít nhất vì những nguyên·nhân khách·quan sau đây:

Thứ nhất, tiếng·Việt là một ngôn·ngữ rất phức·tạp (so với ngôn·ngữ Âu·châu).

Thứ hai, dịch máy là một chủ·đề còn mới·mẻ đối·với giới ngôn·ngữ·học điện·toán Việt·Nam.

Thời·gian nghiên·cứu chưa lâu (ước khoảng một thập·niên trở·lại·đây). Thiếu nhân·sự, kỹ·thuật, kinh·nghiệm kỹ·nghệ, tài·chính,… Thậm·chí thiếu kiến·thức ngôn·ngữ·học thuần·túy và đôi·khi vẫn chưa nắm được đặc·điểm tiếng·Việt.

Bài·viết sơ·lược này sẽ chỉ·ra một·số vấn·đề dịch máy tiếng·Việt và đồng·thời gợi·ý giải·quyết. Tuy đây là một đề·tài chuyên·môn nhưng bài·viết chọn cách trình·bày bình·dân, dễ·hiểu thay·cho hình·thức một tiểu·luận khoa·học khô·khan…

Xem bài viết bằng bản PDF tại đây:
Phần 2
Phần 3
Phần 4

© 2010 Dũng Vũ
© 2010 talawas
URL nguồn: http://www.talawas.org/?p=26459


Không có nhận xét nào:

Đăng nhận xét