Phần mềm dịch thuật trực tuyến: Cần quan tâm đến chất lượng

Phan mem dich thuat truc tuyen Can quan tam den chat luong

Những công cụ dịch thuật tự động đã xuất hiện từ lâu, và các kỹ thuật mới đang giúp đẩy mạnh hiệu suất hoạt động của chúng. Tuy nhiên, chất lượng vẫn còn là vấn đề nan giải.

Bạn vào trang Language Tools của Google ( http://www.google.com/language_tools ) và thử làm như sau : Đánh vào ô Translate text câu hỏi “Automated language translation – is it an idea whose time has come?” (Dịch thuật tự động – Nó có là một ý tưởng mà thời của nó đã đến không ?) và cho chương trình dịch câu hỏi đó sang tiếng Pháp. Tiếp theo, dịch kết quả từ tiếng Pháp sang tiếng Đức. Và cuối cùng, dịch câu tiếng Đức có được trở lại tiếng Anh. Bạn sẽ có kết quả là “Did language translation automate – is it an idea, from which the time came ?” (Dịch thuật tự động hóa – Nó có là một ý tưởng mà thời gian đến từ đó ?).

Làm lại giống như vậy với câu “Reboot your computer and try again.” (Khởi động lại máy tính của bạn và thử lại lần nữa) bạn sẽ có kết quả cuối cùng là “Their computer and attempt still again load.” (Máy tính của họ và nỗ lực vẫn còn nhập vào lần nữa.) Ôi trời ! Đúng là “tam sao thất bản” !!! Có lẽ bạn sẽ thật sự ngán ngẫm nếu như những sách hướng dẫn sử dụng thiết bị có nhiều ngôn ngữ được dịch theo kiểu như thế này.

Tuy vậy, công bằng mà nói thì các công cụ dịch thuật cũng có những hỗ trợ tích cực ở một số mặt nào đó. Và các nhà nghiên cứu cho biết những cách tiếp cận mới sẽ mang lại nhiều cải thiện về cách thực hiện cho những công cụ dịch thuật.

Cập nhật cơ sở dữ liệu

Hãng xe hơi Ford đã bắt đầu sử dụng phần mềm dịch thuật (machine translation) từ năm 1998, và đến nay hãng này đã dịch được năm triệu câu hướng dẫn lắp ráp từ tiếng Anh sang tiếng Tây Ban Nha, Đức, Bồ Đào Nha và tiếng Tây Ban Nha của người Mexico. Các sách hướng dẫn lắp ráp bằng tiếng Anh được cập nhật mỗi ngày, và những bản dịch của chúng – khoảng 5.000 trang một ngày – được nhanh chóng chuyển đến các nhà máy của Ford trên khắp thế giới.

Nestor Rychtyckyj, chuyên gia về trí tuệ nhân tạo (Artificial Intelligence – AI) của hãng Ford, nói : “Bạn không thể làm toàn bộ công việc này một cách thủ công được.”

Hãng xe hơi này sử dụng phần mềm Enterprise Global Server của Systran Software, một công ty chuyên cung cấp các phần mềm dịch thuật có trụ sở ở San Diego, bang California. Bên cạnh đó, các kỹ sư của Ford cũng tự viết một chương trình AI để chuyển ngữ những câu hướng dẫn thuộc về chuyên môn ở cấp độ cao một cách chính xác và rõ ràng. Mỗi một câu hướng dẫn đều được lưu trữ vào cơ sở dữ liệu để dùng cho việc dịch thuật.

Hãng Ford cũng phải phát triển những từ điển thuật ngữ chuyên ngành xe hơi. Theo Rychtyckyj, duy trì những từ điển như thế dễ dàng hơn việc tìm kiếm một chuyên gia dịch thuật thông thạo các thuật ngữ. Ông nói : “Hầu hết những nỗ lực của chúng tôi là xây dựng các bảng thuật ngữ, và thường xuyên thay đổi chúng. Kết quả dịch thuật của bạn sẽ tốt hơn nhiều nếu bạn có sự chuẩn bị trước.”

Phần mềm của công ty Systran sử dụng một kỹ thuật đáng tin cậy gọi là dịch theo quy tắc (rules-based translation). Những hệ thống như thế sử dụng những từ điển song ngữ kết hợp với cơ sở dữ liệu về cách dùng từ và các quy tắc văn phạm. Các trình dịch thuật thương mại thường được bổ sung bằng các bảng thuật ngữ, hoặc những cơ sở dữ liệu lưu trữ những câu hoặc đoạn văn mẫu đã được dịch sẵn (translation memory). Những phần bổ sung này thường do người sử dụng lập ra trong quá trình dịch thuật. Nhờ vậy, phần mềm dịch thuật có thể đưa ra những từ hoặc câu dịch chính xác hoặc gần đúng nhất so với từ hoặc câu gốc để người dịch dễ dàng xem lại.

Huấn luyện phần mềm

Dịch thuật theo kiểu thống kê (statistical machine translation) là một kỹ thuật mới nhưng chưa được sử dụng rộng rãi. Kỹ thuật này sử dụng những văn bản gốc và bản dịch của chúng để “huấn luyện” phần mềm. Theo thời gian, những hệ thống này sẽ “học” được cách tạo ra một bản dịch tốt, rồi dùng phép tính xác suất và thống kê để chọn ra một từ hoặc cụm từ gần đúng nhất dựa trên ngữ cảnh.

Các hệ thống thống kê đòi hỏi phải có rất nhiều văn bản để huấn luyện các thuật toán, nhưng chúng không cần các quy tắc văn phạm, từ điển song ngữ hoặc translation memory. Chúng tự phát triển những quy tắc và tiếp tục tự điều chỉnh các quy tắc đó theo thời gian.

Hãng Google sử dụng phần mềm dịch theo quy tắc của công ty Systran, nhưng họ cũng phát triển những hệ thống dựa trên thống kê của chính họ để dịch từ tiếng Anh sang tiếng Ả-Rập, Nga, Hoa, Hàn, Nhật, và ngược lại. Theo chuyên gia nghiên cứu Franz Josef Och của Google, những ngôn ngữ này rất khó cho các phần mềm dịch thuật vì chúng khác với các ngôn ngữ Tây phương có gốc là tiếng Latin bình dân (Vulgar Latin).

Trong nhiều năm qua, hãng Microsoft đã đưa một phần mềm phân tích cú pháp dựa trên quy tắc văn phạm vào trình soạn thảo văn bản Word của họ. Gần đây, hãng này lại kết hợp các translation memory, các phần mềm dịch thuật dựa trên quy tắc và thống kê với sự hỗ trợ của con người để dịch các văn bản cho cơ sở dữ liệu về thông tin hỗ trợ khách hàng của họ. Steve Richardson, một nhà nghiên cứu cao cấp của Microsoft, nói : “Khuynh hướng mới trong cộng đồng các nhà nghiên cứu là xem con người có thể kết hợp những kỹ thuật thuần túy về thống kê này với một số kiến thức về ngôn ngữ ra sao.”

Khi được hỏi là sẽ có những đột phá trong việc dịch thuật không, ông trả lời : “Những đột phá đã xuất hiện trong quá trình nghiên cứu. Trên phương diện thực hành, sẽ có những đột phá trong việc tạo ra những hệ thống được tích hợp vào quá trình hoạt động của doanh nghiệp.”

Xu hướng trong tương lai là kết hợp các cơ sở dữ liệu lưu trữ những câu hoặc đoạn văn mẫu đã được dịch sẵn với các phần mềm dịch thuật dựa trên quy tắc hoặc thống kê, hoặc cả hai. Những hệ thống lai tạo như thế sẽ trở nên tinh vi và phức tạp hơn.

Tuy nhiên, những hệ thống dịch thuật hiện nay chưa thể đưa ra những bản dịch có chất lượng cao như là những dịch giả “siêu đẳng”, đặc biệt đối với những văn bản sử dụng ngôn ngữ bình dân. Theo Rychtyckyj của hãng Ford, những hệ thống lai tạo trở nên thông minh như thế nào không là vấn đề gì cả, chất lượng dịch thuật phụ thuộc vào việc xây dựng ngôn ngữ gốc một cách chuẩn xác.

Quy trình dịch thuật nói chung có hai công đoạn chính :

- Phân tích nguyên bản trong ngôn ngữ gốc để “hiểu” thật rõ tác giả “muốn nói” gì.

- Tái lập ý nghĩa mà tác giả muốn chuyển tải trong ngôn ngữ đích để có được một văn bản tương đương với nguyên bản.

Thoạt nhìn thì quy trình này có vẻ đơn giản nhưng đằng sau nó là cả một quá trình nhận thức phức tạp. Để “giải mã” ý nghĩa của văn bản gốc một cách chính xác, dịch giả phải phân tích và diễn giải tất cả các đặc tính của nó. Đây là một quá trình đòi hỏi một kiến thức sâu rộng về văn phạm, ngữ nghĩa, cú pháp, thành ngữ… của ngôn ngữ gốc, cũng như văn hóa của tác giả văn bản đó. Đồng thời, dịch giả cũng phải có một kiến thức tương tự như thế về ngôn ngữ mà họ sẽ chuyển đổi.

Vì vậy, thách thức đối với các phần mềm dịch thuật là lập trình như thế nào để máy tính có thể “hiểu” một văn bản như là con người.

(Theo TBVTSG)

Video nổi bật

Quá trình sản xuất điện thoại cỏ
00:00 / --:--

TIN Công Nghệ NỔI BẬT

Hướng dẫn xem YouTube trong khi làm việc khác trên thiết bị iOS

Hôm nay, Quản Trị Mạng sẽ hướng dẫn các bạn một mẹo đơn giản để có thể nghe nhạc trên Youtube, nhưng vẫn có thể làm việc trong một ứng dụng khác, trên các thiết bị sử dụng iOS như iPhone, iPad hay iPod touch.

Làm thế nào để bảo vệ máy tính trước Virus internet

Những nguy cơ thiết bị luôn bị tấn công bởi virus và các loại mã độc luôn khiến cho người dùng phải đau đầu. Nó có thể khiến cho thiết bị của bạn gặp phải những vấn đề mà bạn không ngờ tới. Đó có thể là máy tính hoạt động chậm hơn, không thể khởi động hơn hay nặng hơn là máy có thể bị hỏng. Ngoài những nguy cơ về hỏng thiết bị, dữ liệu cá nhân của bạn cũng đ

Phát hiện lỗi nặng trong iOS, đe dọa phá hỏng iPhone

Lỗi này đe dọa các thiết bị chạy OS. X 10.10 và iOS 8 từ chối dịch vụ kích hoạt từ xa, thậm chí là bị phá hỏng hoặc ảnh hưởng đến hệ thống mạng mà các thiết bị này kết nối vào.

5 cách sử dụng iPad siêu độc đáo có thể bạn chưa biết

Khi Steve Jobs công bố iPad vào ngày 27 tháng 1 năm 2010 tại một cuộc họp báo của Apple diễn ra ở San Francisco, không ai có thể đoán trước được những công dụng mà thiết bị này có thể mang đến trong suốt 5 năm sau đó. Ngoài việc đáp ứng nhu cầu giải trí cũng như làm việc của người sử dụng, iPad còn từng gây ấn tượng mạnh mẽ trong những tình huống vô cùng bất

Nhận xét tin Phần mềm dịch thuật trực tuyến: Cần quan tâm đến chất lượng

Ý kiến bạn đọc

Viết phản hồi

Bạn có thể gửi nhận xét, góp ý hay liên hệ về bài viết Phần mềm dịch thuật trực tuyến: Cần quan tâm đến chất lượng bằng cách gửi thư điện tử tới Lien He Bao Viet Nam. Xin bao gồm tên bài viết Phan mem dich thuat truc tuyen Can quan tam den chat luong ở dạng tiếng Việt không dấu. Hoặc Phần mềm dịch thuật trực tuyến: Cần quan tâm đến chất lượng ở dạng có dấu. Bài viết trong chuyên đề Kinh Nghiệm của chuyên mục Công Nghệ.

online software translation: Need quality care
in Rychtyckyj, Spain, the company Google, Franz Josef Och, Vulgar Latin, Steve Richardson, Editor documents, policy manuals, databases, correctly, assembly instructions, the researcher, the original language, the company's original text, translation, the company

The translation tool Automation has long appeared, and new techniques are helping to boost their performance. However, quality remains a problem. You go to Google Language Tools ...

CÓ THỂ BẠN QUAN TÂM
Xem tiếp: Công Nghệ


  • Thoi su tuan qua Can bo cam dau nhom toi pham
    Thời sự tuần qua: Cán bộ cầm đầu nhóm tội phạm

    Bộ Y tế đề xuất bổ sung 'quyền được chết'; Kinh hoàng Sapa: Khách sạn 3 sao chém 46 triệu ngủ đêm 30/4; Chi 120 triệu cho quản giáo để gọi điện trong tù; Hà Nội: Nữ giám đốc bị sát hại tại nhà; Hỗn loạn chưa từng có ngày công viên nước miễn phí; Cán bộ thuế cầm đầu ổ nhóm tội phạm...là những thông tin thời sự nổi bật tuần qua.

  • Thoi su 24h234 Dung chua benh kieu ban on
    Thời sự 24h(23/4): "Đừng chữa bệnh kiểu ban ơn!'

    Bộ Y tế đề xuất bổ sung 'quyền được chết'; Bê bết Phương Nam, Trầm Bê làm lớn ở Sacombank; Sai sót trong pano kỷ niệm ngày 30/4 tại Hà Nội; Chi 120 triệu cho quản giáo để gọi điện trong tù; Mất trộm 1,4 tỷ đồng trong két sắt siêu thị Maximart ...là những thông tin thời sự nổi bật trong ngày 23/4.

  • Thoi su 24h224 Can bo cam dau nhom toi pham
    Thời sự 24h(22/4): Cán bộ cầm đầu nhóm tội phạm

    Hà Nội: Đâm chết người giữa phố, xe khách bỏ chạy; Rúng động Hà Tĩnh: Vợ chồng 8X lừa đảo 120 tỷ; Bộ Y tế đề xuất bổ sung 'quyền được chết'; Nhóm thanh niên sàm sỡ tại CV nước Hồ Tây có thể bị xử lý; Xà cừ đổ trên phố Hà Nội, một nữ sinh bị thương; Bóc mẽ hoa hậu tự phong và người mẫu chém gió... là những thông tin thời sự nổi bật trong ngày 22/4.

  • Thoi su 24h214 Ke giet nu giam doc la chong
    Thời sự 24h(21/4): Kẻ giết nữ giám đốc là chồng

    Hà Nội tái khẳng định xét tuyển vào lớp 6; Danh sách người mẫu bán dâm cho đại gia… rất dài; Trang phục hở táo bạo của diva U50 Hồng Nhung; Xe chở bia gặp nạn, bia tràn ngập mặt đường; Đâm xe kinh hoàng tại Tây Nguyên, 6 người chết; Đường dây mua bán trẻ sơ sinh ở Sài Gòn lãnh án...là những thông tin thời sự nổi bật trong ngày 21/4.

  • Thoi su 24h204 Hon loan hiem co tai CV nuoc Ho Tay
    Thời sự 24h(20/4): Hỗn loạn hiếm có tại CV nước Hồ Tây

    Kể lại cảnh hỗn loạn hiếm có tại công viên nước Hồ Tây; Khánh Thi tự tin khỏa thân bên người tình trẻ; Liệt sĩ trở về sau 50 năm hy sinh; Hà Nội: Nữ giám đốc bị sát hại tại nhà; Hạ sát PGĐ ngân hàng vì bị sỉ nhục…không tìm được gái...là những thông tin thời sự nổi bật trong ngày 20/4.

  • Ket cuc buon cua thu uong ruou trong gioi tre
    Kết cục buồn của “thú” uống rượu trong giới trẻ

    Giữa mâm chỉ bày vỏn vẹn bát nước chấm, hai chục chiếc chân vịt luộc vừa được mua với giá 20 nghìn đồng nhưng chai rượu voodka cỡ lớn của Thủy (nam sinh trường Đại học Xây dựng Hà Nội) và nhóm bạn đã vơi đi phân nửa...

  • Hon loan o cong vien nuoc Ho Tay
    Hỗn loạn ở công viên nước Hồ Tây

    Chen lấn, xô đẩy, bất chấp nguy hiểm trèo rào chỉ vì được tắm miễn phí sẽ đem đến những bài học xấu xí cho trẻ nhỏ...

  • Tranh cai quy dinh nop tien de thoat an tu hinh
    Tranh cãi quy định nộp tiền để thoát án tử hình

    Nhận thức của xã hội và cả thẩm phán về mục đích áp dụng hình phạt là nhằm trừng trị, răn đe hơn là giáo dục phòng ngừa. ------------ Xem thêm: Tranh cãi quy định nộp tiền để thoát án tử hình, http://vietbao.vn/tp/Tranh-cai-quy-dinh-nop-tien-de-thoat-an-tu-hinh/10916606/ Tin nhanh Việt Nam ra thế giới vietbao.vn

  • Phi cong va tiep vien VNA bi bat tai Han Quoc
    Phi công và tiếp viên VNA bị bắt tại Hàn Quốc

    Cục Hàng không VN đang tiến hành rà soát lại tất cả các khâu soi chiếu an ninh tại Cảng Hàng không Quốc tế Nội Bài để lãm rõ nguyên nhân phi công và tiếp viên Vietnam Airlines có thể “qua mặt” anh ninh vận chuyển 6kg vàng từ..

  • Dieu chinh gia dich vu y te
    Điều chỉnh giá dịch vụ y tế

    Theo phân tích từ Bộ Y tế, việc điều chỉnh giá dịch vụ y tế, đối với người bệnh có thẻ bảo hiểm y tế (BHYT) được lợi đầu tiên vì được thụ hưởng dịch vụ y tế chất lượng tốt hơn...

  • Tin An ninh Phap luat tuan qua 1904 2504
    Tin An ninh - Pháp luật tuần qua (19/04 - 25/04)

    Tranh cãi quy định nộp tiền để thoát án tử hình; “Ngáo đá” và những hành vi cuồng loạn; Đại gia mua dâm người mẫu: Có gan chơi không có gan chịu; Cảnh báo: Trộm đột nhập đã vào “mùa”; Tử hình sát thủ tuổi 20 liên tiếp cướp, giết 3 người; Phút ăn năn của nữ sinh cầm dao đâm bạn để trả thù cho em gái;......là những tin đáng chú ý trong tuần.

  • Tong hop Doi song tuan qua 194 254
    Tổng hợp Đời sống tuần qua (19/4 - 25/4)

    Trào lưu nhắn tin "Em yêu anh" gửi chồng đang tạo nên cơn sốt khắp cộng đồng mạng; Vụ hỗn loạn ở CV nước Hồ Tây và những bài học rút ra cho các bậc phụ huynh; Những câu chuyện tình cảm động; Những tấm gương người tốt việc tốt trong đời sống; Nhiều câu chuyện đáng suy ngẫm cùng rất nhiều những thông tin an toàn thực phẩm đáng chú ý tuần qua...

  • Nghin le chuyen tuan qua 1904 2504
    Nghìn lẻ chuyện tuần qua (19/04 - 25/04)

    Hỗn loạn ở công viên nước Hồ Tây; Ngành Y kỳ vọng đổi màu trang phục để bác sĩ không bị oan; Bộ Y tế đề xuất bổ sung quyền được chết; Công bố đường dây nóng phản ánh giao thông dịp nghỉ lễ 30/4; Những hình ảnh lịch sử ngày 30/4... là những tin tức nổi bật được dư luận quan tâm trong tuần qua.

  • Su kien quoc te noi bat 194 254
    Sự kiện quốc tế nổi bật (19/4 - 25/4)

    Thảm họa lật thuyền khiến 900 người chết ở Địa Trung Hải; Thủ tướng Hàn Quốc, Lee Wan-koo đã tuyên bố từ chức; các hành động hung hăng của Trung Quốc trên biển Đông và phản ứng của Mỹ - Nhật.... là những tin tức chính trong tuần qua.

  • Toan canh kinh te tuan 1904 25042015
    Toàn cảnh kinh tế tuần 19/04 - 25/04/2015

    Thanh tra Tổng Cục Thuế vừa yêu cầu Metro phải giảm lỗ 335 tỷ đồng, truy thu thuế tới 62 tỷ đồng theo đó tổng giá trị vi phạm cần xử lý đã lên tới 507 tỷ đồng, người dân đang rất "sốc" khi nhận được hóa đơn tiền điện tháng 4 vì số tiền phải trả thêm quá nhiều tiền so với tháng trước dù cùng số tiêu thụ, năm 2014 ngành đường sắt thu được 400 tỉ nhưng chi lên tới 2.000 tỉ đồng/năm gấp 5 lần khoản thu, ------------ Xem thêm: Toàn cảnh kinh tế tuần 19/04 - 25/04/2015, http://vietbao.vn/Kinh-te/Toan-canh-kinh-te-tuan-1904-25042015/2147556119/47/ Tin nhanh Việt Nam ra thế giới vietbao.vn