Phần mềm dịch thuật trực tuyến: Cần quan tâm đến chất lượng

Phan mem dich thuat truc tuyen Can quan tam den chat luong

Những công cụ dịch thuật tự động đã xuất hiện từ lâu, và các kỹ thuật mới đang giúp đẩy mạnh hiệu suất hoạt động của chúng. Tuy nhiên, chất lượng vẫn còn là vấn đề nan giải.

Bạn vào trang Language Tools của Google ( http://www.google.com/language_tools ) và thử làm như sau : Đánh vào ô Translate text câu hỏi “Automated language translation – is it an idea whose time has come?” (Dịch thuật tự động – Nó có là một ý tưởng mà thời của nó đã đến không ?) và cho chương trình dịch câu hỏi đó sang tiếng Pháp. Tiếp theo, dịch kết quả từ tiếng Pháp sang tiếng Đức. Và cuối cùng, dịch câu tiếng Đức có được trở lại tiếng Anh. Bạn sẽ có kết quả là “Did language translation automate – is it an idea, from which the time came ?” (Dịch thuật tự động hóa – Nó có là một ý tưởng mà thời gian đến từ đó ?).

Làm lại giống như vậy với câu “Reboot your computer and try again.” (Khởi động lại máy tính của bạn và thử lại lần nữa) bạn sẽ có kết quả cuối cùng là “Their computer and attempt still again load.” (Máy tính của họ và nỗ lực vẫn còn nhập vào lần nữa.) Ôi trời ! Đúng là “tam sao thất bản” !!! Có lẽ bạn sẽ thật sự ngán ngẫm nếu như những sách hướng dẫn sử dụng thiết bị có nhiều ngôn ngữ được dịch theo kiểu như thế này.

Tuy vậy, công bằng mà nói thì các công cụ dịch thuật cũng có những hỗ trợ tích cực ở một số mặt nào đó. Và các nhà nghiên cứu cho biết những cách tiếp cận mới sẽ mang lại nhiều cải thiện về cách thực hiện cho những công cụ dịch thuật.

Cập nhật cơ sở dữ liệu

Hãng xe hơi Ford đã bắt đầu sử dụng phần mềm dịch thuật (machine translation) từ năm 1998, và đến nay hãng này đã dịch được năm triệu câu hướng dẫn lắp ráp từ tiếng Anh sang tiếng Tây Ban Nha, Đức, Bồ Đào Nha và tiếng Tây Ban Nha của người Mexico. Các sách hướng dẫn lắp ráp bằng tiếng Anh được cập nhật mỗi ngày, và những bản dịch của chúng – khoảng 5.000 trang một ngày – được nhanh chóng chuyển đến các nhà máy của Ford trên khắp thế giới.

Nestor Rychtyckyj, chuyên gia về trí tuệ nhân tạo (Artificial Intelligence – AI) của hãng Ford, nói : “Bạn không thể làm toàn bộ công việc này một cách thủ công được.”

Hãng xe hơi này sử dụng phần mềm Enterprise Global Server của Systran Software, một công ty chuyên cung cấp các phần mềm dịch thuật có trụ sở ở San Diego, bang California. Bên cạnh đó, các kỹ sư của Ford cũng tự viết một chương trình AI để chuyển ngữ những câu hướng dẫn thuộc về chuyên môn ở cấp độ cao một cách chính xác và rõ ràng. Mỗi một câu hướng dẫn đều được lưu trữ vào cơ sở dữ liệu để dùng cho việc dịch thuật.

Hãng Ford cũng phải phát triển những từ điển thuật ngữ chuyên ngành xe hơi. Theo Rychtyckyj, duy trì những từ điển như thế dễ dàng hơn việc tìm kiếm một chuyên gia dịch thuật thông thạo các thuật ngữ. Ông nói : “Hầu hết những nỗ lực của chúng tôi là xây dựng các bảng thuật ngữ, và thường xuyên thay đổi chúng. Kết quả dịch thuật của bạn sẽ tốt hơn nhiều nếu bạn có sự chuẩn bị trước.”

Phần mềm của công ty Systran sử dụng một kỹ thuật đáng tin cậy gọi là dịch theo quy tắc (rules-based translation). Những hệ thống như thế sử dụng những từ điển song ngữ kết hợp với cơ sở dữ liệu về cách dùng từ và các quy tắc văn phạm. Các trình dịch thuật thương mại thường được bổ sung bằng các bảng thuật ngữ, hoặc những cơ sở dữ liệu lưu trữ những câu hoặc đoạn văn mẫu đã được dịch sẵn (translation memory). Những phần bổ sung này thường do người sử dụng lập ra trong quá trình dịch thuật. Nhờ vậy, phần mềm dịch thuật có thể đưa ra những từ hoặc câu dịch chính xác hoặc gần đúng nhất so với từ hoặc câu gốc để người dịch dễ dàng xem lại.

Huấn luyện phần mềm

Dịch thuật theo kiểu thống kê (statistical machine translation) là một kỹ thuật mới nhưng chưa được sử dụng rộng rãi. Kỹ thuật này sử dụng những văn bản gốc và bản dịch của chúng để “huấn luyện” phần mềm. Theo thời gian, những hệ thống này sẽ “học” được cách tạo ra một bản dịch tốt, rồi dùng phép tính xác suất và thống kê để chọn ra một từ hoặc cụm từ gần đúng nhất dựa trên ngữ cảnh.

Các hệ thống thống kê đòi hỏi phải có rất nhiều văn bản để huấn luyện các thuật toán, nhưng chúng không cần các quy tắc văn phạm, từ điển song ngữ hoặc translation memory. Chúng tự phát triển những quy tắc và tiếp tục tự điều chỉnh các quy tắc đó theo thời gian.

Hãng Google sử dụng phần mềm dịch theo quy tắc của công ty Systran, nhưng họ cũng phát triển những hệ thống dựa trên thống kê của chính họ để dịch từ tiếng Anh sang tiếng Ả-Rập, Nga, Hoa, Hàn, Nhật, và ngược lại. Theo chuyên gia nghiên cứu Franz Josef Och của Google, những ngôn ngữ này rất khó cho các phần mềm dịch thuật vì chúng khác với các ngôn ngữ Tây phương có gốc là tiếng Latin bình dân (Vulgar Latin).

Trong nhiều năm qua, hãng Microsoft đã đưa một phần mềm phân tích cú pháp dựa trên quy tắc văn phạm vào trình soạn thảo văn bản Word của họ. Gần đây, hãng này lại kết hợp các translation memory, các phần mềm dịch thuật dựa trên quy tắc và thống kê với sự hỗ trợ của con người để dịch các văn bản cho cơ sở dữ liệu về thông tin hỗ trợ khách hàng của họ. Steve Richardson, một nhà nghiên cứu cao cấp của Microsoft, nói : “Khuynh hướng mới trong cộng đồng các nhà nghiên cứu là xem con người có thể kết hợp những kỹ thuật thuần túy về thống kê này với một số kiến thức về ngôn ngữ ra sao.”

Khi được hỏi là sẽ có những đột phá trong việc dịch thuật không, ông trả lời : “Những đột phá đã xuất hiện trong quá trình nghiên cứu. Trên phương diện thực hành, sẽ có những đột phá trong việc tạo ra những hệ thống được tích hợp vào quá trình hoạt động của doanh nghiệp.”

Xu hướng trong tương lai là kết hợp các cơ sở dữ liệu lưu trữ những câu hoặc đoạn văn mẫu đã được dịch sẵn với các phần mềm dịch thuật dựa trên quy tắc hoặc thống kê, hoặc cả hai. Những hệ thống lai tạo như thế sẽ trở nên tinh vi và phức tạp hơn.

Tuy nhiên, những hệ thống dịch thuật hiện nay chưa thể đưa ra những bản dịch có chất lượng cao như là những dịch giả “siêu đẳng”, đặc biệt đối với những văn bản sử dụng ngôn ngữ bình dân. Theo Rychtyckyj của hãng Ford, những hệ thống lai tạo trở nên thông minh như thế nào không là vấn đề gì cả, chất lượng dịch thuật phụ thuộc vào việc xây dựng ngôn ngữ gốc một cách chuẩn xác.

Quy trình dịch thuật nói chung có hai công đoạn chính :

- Phân tích nguyên bản trong ngôn ngữ gốc để “hiểu” thật rõ tác giả “muốn nói” gì.

- Tái lập ý nghĩa mà tác giả muốn chuyển tải trong ngôn ngữ đích để có được một văn bản tương đương với nguyên bản.

Thoạt nhìn thì quy trình này có vẻ đơn giản nhưng đằng sau nó là cả một quá trình nhận thức phức tạp. Để “giải mã” ý nghĩa của văn bản gốc một cách chính xác, dịch giả phải phân tích và diễn giải tất cả các đặc tính của nó. Đây là một quá trình đòi hỏi một kiến thức sâu rộng về văn phạm, ngữ nghĩa, cú pháp, thành ngữ… của ngôn ngữ gốc, cũng như văn hóa của tác giả văn bản đó. Đồng thời, dịch giả cũng phải có một kiến thức tương tự như thế về ngôn ngữ mà họ sẽ chuyển đổi.

Vì vậy, thách thức đối với các phần mềm dịch thuật là lập trình như thế nào để máy tính có thể “hiểu” một văn bản như là con người.

(Theo TBVTSG)

TIN Công Nghệ NỔI BẬT

5 tính năng mà Android nên học hỏi từ iOS

Android chắc chắn là hệ điều hành phổ biến nhất hiện nay, nó đồng thời cũng là nền tảng được tích hợp những bộ tính năng phong phú nhất thế giới. Mặc dù được nhiều nhà sản xuất đầu tư nghiên cứu và phát triển như vậy, nhưng Android không phải là quá hoàn hảo, nó vẫn cần được cải tiến và nâng cấp hơn nữa, đặc biệt là việc học hỏi từ chính những nền tảng đối t

Hướng dẫn bảo vệ smartphone Android khi bị thất lạc

Tình trạng mất điện thoại hoặc bị quên ở đâu đó thực sự là ác mộng với người dùng. Google đã cung cấp một số giải pháp để tìm thiết bị hoặc ít nhất xóa tất cả các dữ liệu và nội dung riêng trên những chiếc smartphone cài hệ điều hành Android của họ.

Tổng hợp những biện pháp tăng tốc iPhone iOS 8 cực hiệu quả

Chắc cũng không cần phải nói gì nhiều khi nhắc đến iPhone hiện nay. Đây là sản phẩm đẳng cấp và được đánh giá cao về hiêu năng. Tuy nhiên, bên cạnh những ưu điểm không thể so sánh thì bên cạnh đó vẫn có những nhược điểm xuất hiện, nhất là đối với những điện thoại đã qua một thời gian sử dụng. Đôi lúc bạn sẽ nhận thấy điện thoại của mình hoạt động chậm đi. Ng

Nhận xét tin Phần mềm dịch thuật trực tuyến: Cần quan tâm đến chất lượng

Ý kiến bạn đọc

Viết phản hồi

Bạn có thể gửi nhận xét, góp ý hay liên hệ về bài viết Phần mềm dịch thuật trực tuyến: Cần quan tâm đến chất lượng bằng cách gửi thư điện tử tới Lien He Bao Viet Nam. Xin bao gồm tên bài viết Phan mem dich thuat truc tuyen Can quan tam den chat luong ở dạng tiếng Việt không dấu. Hoặc Phần mềm dịch thuật trực tuyến: Cần quan tâm đến chất lượng ở dạng có dấu. Bài viết trong chuyên đề Kinh Nghiệm của chuyên mục Công Nghệ.

online software translation: Need quality care
in Rychtyckyj, Spain, the company Google, Franz Josef Och, Vulgar Latin, Steve Richardson, Editor documents, policy manuals, databases, correctly, assembly instructions, the researcher, the original language, the company's original text, translation, the company

The translation tool Automation has long appeared, and new techniques are helping to boost their performance. However, quality remains a problem. You go to Google Language Tools ...

CÓ THỂ BẠN QUAN TÂM
Xem tiếp: Công Nghệ


  • Thoi su 24h2901 Vu trom xang may bay cuc lon
    Thời sự 24h(29/01): Vụ trộm xăng máy bay cực lớn

    'Trực thăng chao đảo rồi chúi xuống đất'; Bắt băng trộm xăng máy bay cực lớn ở TP.HCM; 20 xác linh trưởng khô bốc mùi trên xe khách; Lời khai rúng động của học sinh giết nam ca sĩ; Trung úy cảnh sát bị nghi phạm buôn ma túy bắn chết... là những thông tin thời sự nổi bật trong ngày 29/1.

  • Thoi su 24h2801 Roi may bay 4 phi cong hy sinh
    Thời sự 24h(28/01): Rơi máy bay, 4 phi công hy sinh

    22 người vào quy hoạch Bộ Chính trị, Ban Bí thư; Trực thăng rơi ở TP.HCM, 4 phi công hy sinh; Bắt nguyên Chủ tịch HĐQT Ocean Bank; Hung thủ 15 tuổi giết hại nam ca sĩ ở Sài Gòn; Bắt lô ma túy 20 tỷ ở sân bay...

  • Thoi su 24h2701 Nam ca si bi sat hai da man
    Thời sự 24h(27/01): Nam ca sĩ bị sát hại dã man

    Xe cứu thương bỏ mặc thai phụ tử vong giữa đường?; Nam ca sĩ tử vong trong tình trạng khỏa thân; Vụ biệt thự trong rừng Hải Vân: Tướng công an xin lỗi; Mỹ Tâm nói gì về "người tình tin đồn" 70 tuổi?...

  • Thoi su 24h2601 Vu no rung dong ca pho
    Thời sự 24h(26/01): Vụ nổ rúng động cả phố

    Đà Nẵng có tân Chủ tịch UBND TP; "Nói không với nằm ghép: Dân lo bị xuất viện sớm; Nghệ An: Phát hiện xác hổ 140kg đang ướp lạnh; Không khởi tố vụ tai nạn thảm khốc 9 người chết; Bắt gần nửa tấn lòng thối đang trên đường tiêu thụ; Cựu phi công Việt Nam nói thật chuyện lương thưởng... là những thông tin thời sự nổi bật trong ngày 26/1.

  • Thoi su tuan qua Dai hy thanh dai tang sau tai nan
    Thời sự tuần qua: Đại hỷ thành đại tang sau tai nạn

    Tăng lương hưu và trợ cấp thêm 8%; Cục trưởng Cục Đường sắt chết trong phòng làm việc; Xử phạt VTV 40 triệu đồng vì sai phạm của Điều ước thứ 7; Thưởng Tết thấp nhất là 30 ngàn đồng; Xăng giảm tới 1.900 đồng/lít...

  • Tet xua Tet nay qua con mat nguoi tre
    Tết xưa - Tết nay qua "con mắt" người trẻ

    Một phim ngắn hết sức ý nghĩa cho Tết 2015 đang khiến cộng đồng mạng xôn sao và khiến người xem thật sự xúc động.

  • Tranh cai xung quanh Le hoi chem lon o Bac Ninh
    Tranh cãi xung quanh Lễ hội chém lợn ở Bắc Ninh

    Theo Lãnh đạo tỉnh Bắc Ninh Lễ hội sẽ vẫn được tổ chức nhưng việc chém lợn đã được bỏ từ 2 năm trước.

  • Hai Tet 2015
    Hài Tết 2015

    Nhiều chương trình hài tết, ca nhạc chào năm mới 2015 đã được đồng loạt ra mắt khán giả với nội dung hấp dẫn, đáp ứng nhu cầu giải trí của người dân trong dịp tết. Tuy nhiên, năm nay sức mua khá ảm đạm, tuy băng đĩa lậu ngày càng nhiều. ------------

  • Toi pham vi thanh nien Nguyen nhan va giai phap
    Tội phạm vị thành niên - Nguyên nhân và giải pháp

    Những cái xấu, cái ác đang ngày một gia tăng trong xã hội khiến nhiều người sợ hãi. Nhất là việc giảng đường đang dần trở thành nơi "tụ họp" của phần tử xấu.

  • Dau dau chuyen tim O sin ngay Tet
    Đau đầu chuyện tìm Ô sin ngày Tết

    Nỗi khổ vì bị người giúp việc (hay ô sin) nhân dịp cuối năm o ép không còn mới lạ, tuy nhiên có những chuyện thoạt nghe tưởng như hài nhưng lại…cười ra nước mắt.

  • Nghin le chuyen tuan qua 2501 3101
    Nghìn lẻ chuyện tuần qua (25/01 - 31/01)

    Toàn cảnh trực thăng quân sự rơi ở TP.HCM; Tai nạn thảm khốc ở Thanh Hóa khiến 10 người tử vong; Bé trai khôi ngô bị mẹ bỏ rơi vì sợ mang lại xui xẻo; Hà Nội bỏ dải phân cách cứng: 24 tỷ đồng ném qua cửa sổ;Vợ hoặc chồng không chung thủy bị phạt 1-3 triệu đồng... là những tin tức nổi bật được dư luận quan tâm trong tuần qua. ------------

  • Ban tin suc khoe tuan tu 25 311
    Bản tin sức khỏe tuần (từ 25 - 31/1)

    Nhiều dịch bệnh như ho gà, dịch sởi, dịch cúm gia cầm, rubella đang bùng phát mạnh và diễn biến khó lường; Bắt buộc mua thẻ BHYT theo hộ gia đình; Sai lầm nghiêm trọng khi ăn thịt chó "giải đen" ngày giáp Tết; Bệnh nhân ung thư vú không nên bật đèn khi ngủ; Lá lốt chữa bệnh; Giảm cân siêu nhanh bằng gia vị quen thuộc; Quan niệm sai lầm về sinh nở... là những tin sức khỏe nổi bật tuần qua.

  • Toan canh Showbiz tuan 2501 3101
    Toàn cảnh Showbiz tuần (25/01 – 31/01)

    Bảo Anh bị nghi hát nhép trong The Remix 2015, Quách Ngọc Ngoan phải trả 1 tỷ mới được Lê Phương chấp nhận ly hôn?, Đám cưới bình dân của Huỳnh Đông - Ái Châu, Những người tình tin đồn của Mỹ Tâm, Cường Đô la - Hà Hồ 'cơm lành canh ngọt' về sống chung một nhà?, ------------

  • Tin An ninh Phap luat tuan qua 2501 3101
    Tin An ninh - Pháp luật tuần qua (25/01 - 31/01)

    Tội phạm vị thành niên - Nguyên nhân và giải pháp; Phòng, chống tội phạm sử dụng Công nghệ cao; Tết sớm ở Trại giam Xuân Nguyên; Hài hước những tên trộm lười biếng nhất thế giới; 141 Hà Nội trấn áp tội phạm đường phố dịp cuối năm; Cái chết đầy bí ẩn của trùm giang hồ khét tiếng Đại Cathay;.......là những tin đáng chú ý trong tuần. ------------ Xem thêm: Tin An ninh - Pháp luật tuần qua (25/01 - 31/01), http://vietbao.vn/An-ninh-Phap-luat/Tin-An-ninh-Phap-luat-tuan-qua-2501-3101/2147533625/218/ Tin nhanh Việt Nam ra thế giới vietbao.vn

  • Nhin lai su kien Xa Hoi VN 2014
    Nhìn lại sự kiện Xã Hội VN 2014

    2014 là năm của tai nạn, hỏa hoạn với hàng trăm vụ cháy lớn trên phạm vi toàn quốc với những hậu quả thảm khốc về cả tài sản và tính mạng con người.