TTLV: Các vấn đề xử lý tiếng Việt để nâng cao hiệu năng của công cụ tìm kiếm

Thứ sáu - 20/06/2014 00:49

THÔNG TIN VỀ LUẬN VĂN THẠC SĨ

1. Họ và tên học viên: Nguyễn Thị Minh Tâm          2. Giới tính: Nữ

3. Ngày sinh: 23/09/1988

4. Nơi sinh: Bắc Ninh

5. Quyết định công nhận học viên 1883/2010/ QĐ-XHNV-SĐH ngày 21 tháng 10 năm 2010  của Hiệu trưởng Trường Đại học Khoa học Xã hội và Nhân văn, Đại học Quốc gia Hà Nội

6. Các thay đổi trong quá trình đào tạo: Không

7. Tên đề tài luận văn: Các vấn đề xử lý tiếng Việt để nâng cao hiệu năng của công cụ tìm kiếm

8. Chuyên ngành: Ngôn ngữ học ; Mã số: 60 22 01

9. Cán bộ hướng dẫn khoa học: Tiến sĩ Nguyễn Ái Việt- Viện Công nghệ thông tin, Đại học Quốc Gia Hà Nội.

10. Tóm tắt các kết quả của luận văn:

Về lý luận:

  • Luận văn đưa ra những quan niệm về ngôn ngữ cần biết trong quá trình xử lý ngôn ngữ tự nhiên: quan niệm về từ, từ loại.
  • Luận văn đưa ra cách nhìn tổng quan về xử lý ngôn ngữ trong máy tìm kiếm, đồng thời đưa ra các vấn đề về tiếng Việt trong việc nâng cao hiệu năng tìm kiếm: gán nhãn từ loại, xây dựng từ điển, lập chỉ mục…
  • Luận văn nghiên cứu về stop words (một vấn đề còn mới ở Việt Nam chưa được nghiên cứu rộng rãi). Trong đó, luận văn đi sâu vào nghiên cứu bản chất của stop words tiếng Việt và đưa ra định nghĩa phổ quát cho quan niệm này.

Về thực tiễn nghiên cứu:

  • Luận văn đề cập đến bản chất của stop words tiếng Việt gồm có: bản chất từ vựng, từ loại, tính không phụ thuộc vào ngôn ngữ.
  • Dựa vào những đặc trưng đã có, ta có thể xác lập bảng stop words dành cho tiếng Việt.

11. Khả năng ứng dụng trong  thực tiễn: (nếu có)

- Bước đầu xây dựng khung lý thuyết về bản chất stop words.

- Luận văn có vài trò quan trọng trong việc xử lý ngôn ngữ tự nhiên đặc biệt trong quá trình lập chỉ mục cho hệ thống tìm kiếm.

12. Những hướng nghiên cứu tiếp theo: (nếu có): Tìm hiểu sâu hơn các vấn đề về tiếng Việt trong quá trình xử lý ngôn ngữ tự nhiên của máy tìm kiếm

13. Các công trình đã công bố có liên quan đến luận văn:

INFORMATION ON MASTER’S THESIS

1. Full name : Nguyen Thi Minh Tam  2. Sex: Female

3. Date of birth: 23 September 1988 4. Place of  birth: Bac Ninh, Vietnam

5. Admission decision number: No. 1883/2010/QD-XHNV-SDH on 21/10/2010 by the Rector of University of Social Sciences and Humanities, Hanoi – Vietnam National University

6. Changes in academic process: None

7. Official thesis title: The Vietnamese problems in improving search efficiency

8. Major: Linguistics 9. Code: 60 22 01

10. Supervisors: Dr. Nguyen Ai Viet- Information Technology Institute- Vietnam National University, Hanoi.

11. Summary of the findings of the thesis: .....................................................   

From theoretical point of view:

- The thesis has already presented the linguistic concepts which are necessary in the process of language processing: the concepts of word and TAGS.

- The thesis has given an overview of the language processing in the search engines, indetifying the Vietnamese language related issues in the search effficiency improvement: POS tagging, dictionary building, indexing…

- The thesis pioneers reseach on the stop words (a new reseach direction in Vietnam which has not been studied systematically). In particular, the thesis has discussed in dept the nature of the Vietnam stop words and attempeted to give a universal dedinition for this new concept.

From practical point of view:

- The thesis has address the nature of the Vietnamese stop words from different aspects including: the nature of words, POSTAG, the linguistic independence,…

- Based on the above characteristics, it is possble to set up the first theoretically checked list of Vietnamese stop words

12. Practical applicability, if any: ...................................................................

- The initial theoretical framework of the future Vietnamese stop words studies.

- The thesis has contributed an important role in natural language processing particularly in the indexing of the search systems.

13. Further research directions, if any: ...........................................................

Learn more deep Vietnamese language related problems in the natural language processing search engines.

14. Thesis-related publications: ......................................................................

Tổng số điểm của bài viết là: 0 trong 0 đánh giá

Click để đánh giá bài viết

Những tin mới hơn

Những tin cũ hơn

Bạn đã không sử dụng Site, Bấm vào đây để duy trì trạng thái đăng nhập. Thời gian chờ: 60 giây