Thứ Bảy, 28 tháng 5, 2011

Hoài·niệm về anh Cao·Xuân·Hạo

Tác·giả: Nguyễn·Quang·Hồng

Hà Nội, cuối Thu, ngày 30-10-2007

Tôi hay tin giáo sư Cao Xuân Hạo từ trần ngay sau giờ phút anh lâm chung, qua điện thoại của một bạn trẻ. Đã từ mấy tháng nay, anh em trong giới ngữ học chúng tôi đều biết Giáo sư lâm bệnh nặng, tuổi cao sức kiệt, khó lòng qua khỏi. Nhưng vào giờ phút ấy, khi biết rằng trên đời này sẽ chẳng bao giờ còn có thể trò chuyện cùng Anh được nữa, lòng tôi bỗng trĩu nặng, ngậm ngùi…

Mãi đến năm 1965, tôi mới có dịp quen biết anh Cao Xuân Hạo. Khi ấy, tôi vừa chân ướt chân ráo từ Đại học Bắc Kinh trở về, đang lao vào tìm hiểu tiếng Việt, thì may mắn được làm quen với các thầy và các bậc đàn anh ở Đại học Tổng hợp Hà Nội, tại khu sơ tán Đại Từ, Thái Nguyên. Nhưng lần đầu tiên tôi gặp anh Cao Xuân Hạo là tại Hà Nội, ngay nơi căn phòng Anh ở. Tôi biết khi ấy anh Cao Xuân Hạo đã thành danh, và đang sống những ngày khó khăn.

Thứ Năm, 26 tháng 5, 2011

Phong ba bão táp có bằng ngữ·pháp Việt·Nam?

Tác·giả: Nguyễn·Đức·Dân
(Báo Tuổi Trẻ, Thứ tư, 25/05/2011, 06:22 (GMT+7))
TT - 1. Học sinh và giáo viên dạy văn có câu châm biếm truyền miệng “phong ba bão táp không bằng ngữ pháp VN”.

Thứ Tư, 25 tháng 5, 2011

Phân·tích kĩ·thuật các kiểu gõ tiếng·Việt

Tác·giả: Phan·Anh·Dũng

R&D Department
Thua Thien Hue Center of Information Technology (Huesoft).

Nguồn: Tạp-chí PC World VN, Thứ Năm, ngày 08 tháng 01 năm 2009 07:24 (GMT+7)

Xử lý tiếng Việt là vấn đề rất cũ, nhưng không phải là nhỏ vì ảnh hưởng tới rất nhiều người dùng. Đa phần các bộ gõ tiếng Việt lâu nay là tự phát, không có tài liệu phân tích kỹ thuật chi tiết. Nhân hợp tác với nhóm m17n thuộc AIST (Viện Khoa Học và Công Nghệ Công Nghiệp Tiên Tiến Nhật Bản) để cải tiến và phát triển các bộ gõ tiếng Việt, Chăm, Thái... trên môi trường Linux mã mở, chúng tôi đã thực hiện một số tài liệu phân tích kỹ thuật một cách bài bản, sau đây xin giới thiệu một số vấn đề rút từ những tài liệu đó.

I. Vài số liệu thống kê về hệ thống âm-vần-chữ cái tiếng Việt

Hội Khai-trí Tiến-đức - Việt-Nam Tự-điển



Hội Khai Trí Tiến Đức

Việt Nam Tự Điển

Mục Lục





Muốn download Tự Điển để dùng offline quý vị bấm vào tên của mỗi chương, right click và chọn Save Target As. Quý vị cũng cần phải download chương Mục Lục. Sau khi download, quý vị phải để tất cả mọi chương trong cùng một folder [tên folder phải là tiếng Việt không dấu - Nguyễn-Tiến-Hải ghi thêm vào].Khi dùng Tự Điển offine quý vị phải mở chương Mục Lục trước tiên.Xin qúy vị thông báo qua email những sai lỗi hay trở ngại khi dùng tự điển. Cảm ơn.

Nguồn: http://www.vietnamtudien.org/vntd-kttd/

Dũng·Vũ - Tiếng Việt và vấn·đề dịch·máy


Tác·giả: Dũng Vũ

Dịch máy (machine translation) đã trở·thành một tiện·ích phổ·biến trong thời·đại internet.

Đây là một trong những đề·tài phức·tạp nhất của việc·xử·lý ngôn·ngữ con·người trong lĩnh·vực trí·thông·minh nhân·tạo (artificial intelligence) mà giới khoa·học đã miệt·mài nghiên·cứu để đạt nhiều kết·quả đáng·kể ngày·hôm·nay: tự·điển song·ngữ tự·động (Anh·Đức, Anh·Pháp, Anh·Nhật, Anh·Việt,…), dịch cụm·từ, câu (như Google Translator, Babel Fish,…). Tuy·nhiên vẫn còn nhiều khó·khăn.

Dịch máy cũng là đề·tài được giới khoa·học Việt·Nam quan·tâm và còn gặp nhiều khó·khăn hơn nữa, ít nhất vì những nguyên·nhân khách·quan sau đây:

Thứ nhất, tiếng·Việt là một ngôn·ngữ rất phức·tạp (so với ngôn·ngữ Âu·châu).

Thứ hai, dịch máy là một chủ·đề còn mới·mẻ đối·với giới ngôn·ngữ·học điện·toán Việt·Nam.

Thời·gian nghiên·cứu chưa lâu (ước khoảng một thập·niên trở·lại·đây). Thiếu nhân·sự, kỹ·thuật, kinh·nghiệm kỹ·nghệ, tài·chính,… Thậm·chí thiếu kiến·thức ngôn·ngữ·học thuần·túy và đôi·khi vẫn chưa nắm được đặc·điểm tiếng·Việt.

Bài·viết sơ·lược này sẽ chỉ·ra một·số vấn·đề dịch máy tiếng·Việt và đồng·thời gợi·ý giải·quyết. Tuy đây là một đề·tài chuyên·môn nhưng bài·viết chọn cách trình·bày bình·dân, dễ·hiểu thay·cho hình·thức một tiểu·luận khoa·học khô·khan…

Xem bài viết bằng bản PDF tại đây:
Phần 2
Phần 3
Phần 4

© 2010 Dũng Vũ
© 2010 talawas
URL nguồn: http://www.talawas.org/?p=26459


Dũng·Vũ - Tiếng Việt và ngôn·ngữ·học hiện·đại - Sơ·khảo về cú·pháp

Tên sách: Tiếng Việt và ngôn·ngữ·học hiện·đại · Sơ·khảo về cú·pháp

Tác·giả: Dũng·
Năm xuất·bản: 2003
Nơi xuất·bản: Germany, Stuttgart, nhà·xuất·bản VIET
Số trang: 355

Phiên·bản sách điện·tử có định·dạng file là PDF. Bạn có·thể vào xem sách online ở link sau: https://docs.google.com. Sau đó, bạn có·thể tải file sách về máy bạn từ google documents bằng cách chọn menu File => Download Original (hoặc bấm CTRL+S) trong google docs https://docs.google.com.

Mục·lục

Phạm·Văn·Hải - Chữ Hán và tiếng Hán-Việt

Tên sách: Chữ Hán và tiếng Hán·Việt
Tác·giả: Phạm·Văn·Hải
Năm xuất·bản: 2005
Nơi xuất·bản: USA, Virginia, Falls Church
Số trang: 1016

Phiên·bản sách điện·tử có định·dạng file là PDF. Bạn có·thể vào xem sách online ở link sau: https://docs.google.com. Sau đó, bạn có·thể tải file sách về máy bạn từ google documents bằng cách chọn menu File => Download Original (hoặc bấm CTRL+S) trong google docs https://docs.google.com .

Mục·lục:
Lời nói đầu........................................................................xv

Chương 1: Tiếng Hán·Việt là gì?............................................1

Chương 2: Tại sao có tiếng Hán·Việt trong tiếng Việt................7

Chương 3: Cách nhận mặt tiếng Hán·Việt...............................17

Chương 4: Chữ Hán.............................................................27

Chương 5: Chữ Hán · Tìm chữ...............................................39

Chương 6: Học chữ Hán........................................................65

Chương 7: Chia loại tiếng Hán·Việt.........................................123

Chương 8: Chữ viết của người Việt · Chữ Nôm........................143

Chương 9: Nhìn lại ảnh·hưởng của Trung·Hoa trong tiếng Việt....171

Chương 10: Một số chữ Hán và tiếng Hán·Việt thường thấy........185

Tài·liệu tham·khảo............................................................... 995


Thứ Ba, 24 tháng 5, 2011

Giáo·trình Từ·vựng tiếng Việt

Tác·giả: Nguyễn·Thị·Thu·Thủy (?)
Nguồn: Thư·viện điện·tử mở của Đại·học Cần·Thơ , URL: http://www.ctu.edu.vn/coursewares/supham/tuvungtv/index.htm

Mục·lục:

Chương 1: Các đơn·vị từ·vựng tiếng Việt xét về mặt cấu·tạo

1. Các khái·niệm khác·nhau về đơn·vị cấu·tạo từ tiếng Việt
2. Các quan·niệm khác·nhau về từ tiếng Việt
3. Từ tiếng Việt và đặc·điểm của từ tiếng Việt
4. Các phương·thức cấu·tạo từ tiếng Việt
5. Các kiểu cấu·tạo từ tiếng Việt
6. Ngữ cố·định

Chương 2: Ý·nghĩa của từ
1. Hoạt·động giao·tiếp và các chức·năng cơ·bản của tín·hiệu ngôn·ngữ
2. Ý·nghĩa của từ
3. Hiện·tượng nhiều nghĩa
4. Sự·chuyển·biến ý·nghĩa của từ

Chương 3: Mối·quan·hệ ngữ·nghĩa giữa các từ trong hệ·thống

1. Hiện·tượng đồng·nghĩa
2. Hiện·tượng trái·nghĩa
3. Hiện·tượng đồng·âm
4. Các trường·hợp từ·vựng tiếng Việt

Chương 4: Các lớp từ·vựng tiếng Việt

1. Các lớp từ·vựng tiếng Việt xét về mặt phạm·vi sử·dụng
2. Các lớp từ·vựng tiếng Việt xét về mặt nguồn·gốc
3. Các lớp từ·vựng tiếng Việt xét về mặt tần·số sử·dụng

Tài·liệu tham·khảo

Chương 1: Các đơn·vị từ·vựng tiếng Việt xét về mặt cấu·tạo

1. Các khái·niệm khác·nhau về đơn·vị cấu·tạo từ tiếng Việt
2. Các quan·niệm khác·nhau về từ tiếng Việt
3. Từ tiếng Việt và đặc·điểm của từ tiếng Việt
4. Các phương·thức cấu·tạo từ tiếng Việt
5. Các kiểu cấu·tạo từ tiếng Việt
6. Ngữ cố·định





I.  CÁC KHÁI NIỆM KHÁC NHAU  VỀ ĐƠN VỊ CẤU TẠO TỪ TIẾNG VIỆT




           ( Xem bảng tổng kết các quan niệm khác nhau về hình vị tiếng Việt.)

          Tựu trung, có thể thấy có hai xu hướng xác định hình vị đối lập:

           1 Hình vị trùng âm tiết.

              Tiêu biểu gồm các tác giả như M.B.Emeneau, Nguyễn Tài Cẩn, Lưu Vân Lăng, Nguyễn Văn Tu ...Tuy nhiên, cách gọi tên không giống nhau. M.B.Emeneau, Lưu Vân Lăng  dùng thuật ngữ morphem, Nguyễn Tài Cẩn dùng khái niệm tiếng, Nguyễn văn Tu dùng từ tố, Lê Văn Lý dùng ngữ vị.

            2 Hình vị không hoàn toàn trùng âm tiết.

                ở khuynh hướng này, nội hàm và ngoại diên của hình vị cũng được nhìn nhận khác nhau.

                   - Theo Ðỗ Hữu Châu: Hình vị là những đơn vị được tạo ra từ các âm vị, tự thân có nghĩa nhưng không được dùng trực tiếp để giao tiếp, tức không trực tiếp được dùng để kết hợp với nhau tạo thành câu... Hình vị (hay yếu tố cấu tạo từ) tiếng Việt là những hình thức ngữ âm cố định, bất biến, nhỏ nhất với dạng chuẩn tối thiểu là 1 âm tiết, tự thân có nghĩa (từ vựng hay ngữ pháp), có thể chịu tác động của phương thức cấu tạo để cấu tạo từ cho tiếng Việt. [ 5, 5 ]

                   - Theo Hồ Lê: Nguyên vị là đơn vị nhỏ nhất có ý nghĩa ngữ ngôn. Từ nguyên vị, không thể tách ra một đơn vị ngữ ngôn nào nhỏ hơn. Nói cách khác, nguyên vị không thể là kết quả của sự kết hợp của hai (hoặc nhiều) đơn vị  ngôn ngữ. Từ nguyên vị chỉ có thể tìm thấy một đơn vị ngữ âm và chỉ một mà thôi, và đơn vị ngữ âm ấy chính là bản thân nguyên vị. Trong tiếng Việt, nguyên vị thường có hình thức một âm tiết. Ví dụ: nhà, đi, đẹp, đẽ( trong đẹp đẽ), núc(trong bếp núc), ngoại, giao... Nhưng bên cạnh đó, cũng có nguyên vị có hình thức cấu tạo nhiều âm tiết. Ví dụ: ô tô, cà phê, ròng rọc, amiđan, axêtilen... [ 19, 75 ]

          - Ðái Xuân Ninh cho rằng: Hình vị tiếng Việt là yếu tố nhỏ nhất về mặt tổ chức mà có ý nghĩa: ý nghĩa từ vựng hay ý nghĩa ngữ pháp. [ 22, 7 ]. Ðứng về mặt âm tiết, có thể chia hình vị tiếng Việt ra hai loại: loại đơn âm tiết ( ăn, uống, con, cái ), loại đa âm tiết ( cà phê, rađiô, ... thằn lằn, cà cuống,...) [ 22, 21 ]



II.  CÁC QUAN NIỆM KHÁC NHAU VỀ TỪ TIẾNG VIỆT


          ( Xem bảng tổng kết các quan niệm khác nhau về từ tiếng Việt )

Giải·thuật Bresenham vẽ đoạn·thẳng



Người·dịch: Nguyễn·Tiến·Hải

Cập·nhật: ngày 30 tháng 05 năm 2011.


Giải·thuật vẽ đoạn·thẳng của Bresenham (tiếng Anh: Bresenham's line algorithm) là giải·thuật xác·định các điểm raster hai chiều cần phải vẽ (chấm điểm), để nhận được xấp·xỉ của  đoạn·thẳng có hai điểm đầu·mút cho trước. Đây là một trong những giải·thuật được phát·triển sớm nhất trong lĩnh·vực đồ·họa máy·tính. Giải·thuật này đã được Jack E. Bresenham thiết·kế vào năm 1962 tại công·ti IBM. Giải·thuật Bresenham thường được dùng để vẽ các đoạn·thẳng trên màn·hình máy·vi·tính, vì nó chỉ sử·dụng các lệnh cộng trừ số·học và các lệnh trên pixel, ngoài ra nó có chi·phí rẻ và thích·hợp với kiến·trúc sơ·khai của máy·tính. Người·ta đã mở·rộng giải·thuật này thành giải·thuật vẽ các đường·cong bậc 2.

Ngôn·ngữ chuẩn

Người·dịch: Nguyễn·Tiến·Hải


Cập·nhật: ngày 24 tháng 05 năm 2011.

Ngôn·ngữ chuẩn (hay tiếng chuẩnphương·ngữ chuẩnphương·ngữ đã được chuẩn·hóa) là loại ngôn·ngữ mà một nhóm người sử·dụng khi thảo·luận nghiêm·túc và chính·thức với nhau.[1] Ngoài ra, ngôn·ngữ còn trở·thành chuẩn qua quá·trình chuẩn·hóa, trong·đó nó được miêu·tả bằng ngữ·pháp, từ·điển, và mã·hóa trong các công·trình có tính·tham·khảo tương·tự.[1] Ngôn·ngữ trở·thành ngôn·ngữ chuẩn thường là thổ·ngữ địa·phương nói ở các khu trung·tâm thương·mại và chính·quyền, nơi cần·thiết phải có một ngôn·ngữ thống·nhất.

Ngôn·ngữ viết chuẩn đôi khi còn được gọi bằng thuật·ngữ tiếng Đức là Schriftsprache.

1 Các đặc·điểm

Việc·thống·nhất quốc·gia về văn·hóa, chính·trị, xã·hội đòi·hỏi cần phải có một giọng (tiếng) chuẩn. Vì thế ngôn·ngữ chuẩn được tạo ra theo một quy·luật bất·thành·văn. Nói chung, các ngôn·ngữ chuẩn thường được tạo·lập dựa trên:
  • từ·điển đã được công·nhận (luật chính·tả và từ·vựng đã được chuẩn·hóa)
  • ngữ·pháp đã được công·nhận
  • chuẩn phát âm (tiếng phổ·thông qua giáo·dục)
  • viện ngôn·ngữ quy·định các chuẩn sử·dụng ngôn·ngữ, ví·dụ: Viện Académie française của Pháp, Viện Hoàng·gia Tây·Ban·Nha
  • địa·vị hiến·pháp
  • sử·dụng công·cộng có hiệu·lực (tòa·án, lập·pháp, trường·học)
  • nền văn·học

2 Chú·thích

ab Finegan, Edward (2007). Language: Its Structure and Use (ấn bản 5th). Boston, MA, USA: Thomson Wadsworth. tr. 14. ISBN 9781413030556.

3 Tài·liệu tham·khảo
  • Baugh, Albert C. and Thomas Cable. 2002. "A History of the English Language" fifth ed. (London: Routledge)
  • Blake, N. F. 1996. "A History of the English Language" (Basingstoke: Palgrave)
  • Smith, Jeremy. 1996. "An Historical Study of English: Function, Form and Change" (London: Routledge)