Phần mềm dịch thuật trực tuyến: Cần quan tâm đến chất lượng

Phan mem dich thuat truc tuyen Can quan tam den chat luong

Những công cụ dịch thuật tự động đã xuất hiện từ lâu, và các kỹ thuật mới đang giúp đẩy mạnh hiệu suất hoạt động của chúng. Tuy nhiên, chất lượng vẫn còn là vấn đề nan giải.

Bạn vào trang Language Tools của Google ( http://www.google.com/language_tools ) và thử làm như sau : Đánh vào ô Translate text câu hỏi “Automated language translation – is it an idea whose time has come?” (Dịch thuật tự động – Nó có là một ý tưởng mà thời của nó đã đến không ?) và cho chương trình dịch câu hỏi đó sang tiếng Pháp. Tiếp theo, dịch kết quả từ tiếng Pháp sang tiếng Đức. Và cuối cùng, dịch câu tiếng Đức có được trở lại tiếng Anh. Bạn sẽ có kết quả là “Did language translation automate – is it an idea, from which the time came ?” (Dịch thuật tự động hóa – Nó có là một ý tưởng mà thời gian đến từ đó ?).

Làm lại giống như vậy với câu “Reboot your computer and try again.” (Khởi động lại máy tính của bạn và thử lại lần nữa) bạn sẽ có kết quả cuối cùng là “Their computer and attempt still again load.” (Máy tính của họ và nỗ lực vẫn còn nhập vào lần nữa.) Ôi trời ! Đúng là “tam sao thất bản” !!! Có lẽ bạn sẽ thật sự ngán ngẫm nếu như những sách hướng dẫn sử dụng thiết bị có nhiều ngôn ngữ được dịch theo kiểu như thế này.

Tuy vậy, công bằng mà nói thì các công cụ dịch thuật cũng có những hỗ trợ tích cực ở một số mặt nào đó. Và các nhà nghiên cứu cho biết những cách tiếp cận mới sẽ mang lại nhiều cải thiện về cách thực hiện cho những công cụ dịch thuật.

Cập nhật cơ sở dữ liệu

Hãng xe hơi Ford đã bắt đầu sử dụng phần mềm dịch thuật (machine translation) từ năm 1998, và đến nay hãng này đã dịch được năm triệu câu hướng dẫn lắp ráp từ tiếng Anh sang tiếng Tây Ban Nha, Đức, Bồ Đào Nha và tiếng Tây Ban Nha của người Mexico. Các sách hướng dẫn lắp ráp bằng tiếng Anh được cập nhật mỗi ngày, và những bản dịch của chúng – khoảng 5.000 trang một ngày – được nhanh chóng chuyển đến các nhà máy của Ford trên khắp thế giới.

Nestor Rychtyckyj, chuyên gia về trí tuệ nhân tạo (Artificial Intelligence – AI) của hãng Ford, nói : “Bạn không thể làm toàn bộ công việc này một cách thủ công được.”

Hãng xe hơi này sử dụng phần mềm Enterprise Global Server của Systran Software, một công ty chuyên cung cấp các phần mềm dịch thuật có trụ sở ở San Diego, bang California. Bên cạnh đó, các kỹ sư của Ford cũng tự viết một chương trình AI để chuyển ngữ những câu hướng dẫn thuộc về chuyên môn ở cấp độ cao một cách chính xác và rõ ràng. Mỗi một câu hướng dẫn đều được lưu trữ vào cơ sở dữ liệu để dùng cho việc dịch thuật.

Hãng Ford cũng phải phát triển những từ điển thuật ngữ chuyên ngành xe hơi. Theo Rychtyckyj, duy trì những từ điển như thế dễ dàng hơn việc tìm kiếm một chuyên gia dịch thuật thông thạo các thuật ngữ. Ông nói : “Hầu hết những nỗ lực của chúng tôi là xây dựng các bảng thuật ngữ, và thường xuyên thay đổi chúng. Kết quả dịch thuật của bạn sẽ tốt hơn nhiều nếu bạn có sự chuẩn bị trước.”

Phần mềm của công ty Systran sử dụng một kỹ thuật đáng tin cậy gọi là dịch theo quy tắc (rules-based translation). Những hệ thống như thế sử dụng những từ điển song ngữ kết hợp với cơ sở dữ liệu về cách dùng từ và các quy tắc văn phạm. Các trình dịch thuật thương mại thường được bổ sung bằng các bảng thuật ngữ, hoặc những cơ sở dữ liệu lưu trữ những câu hoặc đoạn văn mẫu đã được dịch sẵn (translation memory). Những phần bổ sung này thường do người sử dụng lập ra trong quá trình dịch thuật. Nhờ vậy, phần mềm dịch thuật có thể đưa ra những từ hoặc câu dịch chính xác hoặc gần đúng nhất so với từ hoặc câu gốc để người dịch dễ dàng xem lại.

Huấn luyện phần mềm

Dịch thuật theo kiểu thống kê (statistical machine translation) là một kỹ thuật mới nhưng chưa được sử dụng rộng rãi. Kỹ thuật này sử dụng những văn bản gốc và bản dịch của chúng để “huấn luyện” phần mềm. Theo thời gian, những hệ thống này sẽ “học” được cách tạo ra một bản dịch tốt, rồi dùng phép tính xác suất và thống kê để chọn ra một từ hoặc cụm từ gần đúng nhất dựa trên ngữ cảnh.

Các hệ thống thống kê đòi hỏi phải có rất nhiều văn bản để huấn luyện các thuật toán, nhưng chúng không cần các quy tắc văn phạm, từ điển song ngữ hoặc translation memory. Chúng tự phát triển những quy tắc và tiếp tục tự điều chỉnh các quy tắc đó theo thời gian.

Hãng Google sử dụng phần mềm dịch theo quy tắc của công ty Systran, nhưng họ cũng phát triển những hệ thống dựa trên thống kê của chính họ để dịch từ tiếng Anh sang tiếng Ả-Rập, Nga, Hoa, Hàn, Nhật, và ngược lại. Theo chuyên gia nghiên cứu Franz Josef Och của Google, những ngôn ngữ này rất khó cho các phần mềm dịch thuật vì chúng khác với các ngôn ngữ Tây phương có gốc là tiếng Latin bình dân (Vulgar Latin).

Trong nhiều năm qua, hãng Microsoft đã đưa một phần mềm phân tích cú pháp dựa trên quy tắc văn phạm vào trình soạn thảo văn bản Word của họ. Gần đây, hãng này lại kết hợp các translation memory, các phần mềm dịch thuật dựa trên quy tắc và thống kê với sự hỗ trợ của con người để dịch các văn bản cho cơ sở dữ liệu về thông tin hỗ trợ khách hàng của họ. Steve Richardson, một nhà nghiên cứu cao cấp của Microsoft, nói : “Khuynh hướng mới trong cộng đồng các nhà nghiên cứu là xem con người có thể kết hợp những kỹ thuật thuần túy về thống kê này với một số kiến thức về ngôn ngữ ra sao.”

Khi được hỏi là sẽ có những đột phá trong việc dịch thuật không, ông trả lời : “Những đột phá đã xuất hiện trong quá trình nghiên cứu. Trên phương diện thực hành, sẽ có những đột phá trong việc tạo ra những hệ thống được tích hợp vào quá trình hoạt động của doanh nghiệp.”

Xu hướng trong tương lai là kết hợp các cơ sở dữ liệu lưu trữ những câu hoặc đoạn văn mẫu đã được dịch sẵn với các phần mềm dịch thuật dựa trên quy tắc hoặc thống kê, hoặc cả hai. Những hệ thống lai tạo như thế sẽ trở nên tinh vi và phức tạp hơn.

Tuy nhiên, những hệ thống dịch thuật hiện nay chưa thể đưa ra những bản dịch có chất lượng cao như là những dịch giả “siêu đẳng”, đặc biệt đối với những văn bản sử dụng ngôn ngữ bình dân. Theo Rychtyckyj của hãng Ford, những hệ thống lai tạo trở nên thông minh như thế nào không là vấn đề gì cả, chất lượng dịch thuật phụ thuộc vào việc xây dựng ngôn ngữ gốc một cách chuẩn xác.

Quy trình dịch thuật nói chung có hai công đoạn chính :

- Phân tích nguyên bản trong ngôn ngữ gốc để “hiểu” thật rõ tác giả “muốn nói” gì.

- Tái lập ý nghĩa mà tác giả muốn chuyển tải trong ngôn ngữ đích để có được một văn bản tương đương với nguyên bản.

Thoạt nhìn thì quy trình này có vẻ đơn giản nhưng đằng sau nó là cả một quá trình nhận thức phức tạp. Để “giải mã” ý nghĩa của văn bản gốc một cách chính xác, dịch giả phải phân tích và diễn giải tất cả các đặc tính của nó. Đây là một quá trình đòi hỏi một kiến thức sâu rộng về văn phạm, ngữ nghĩa, cú pháp, thành ngữ… của ngôn ngữ gốc, cũng như văn hóa của tác giả văn bản đó. Đồng thời, dịch giả cũng phải có một kiến thức tương tự như thế về ngôn ngữ mà họ sẽ chuyển đổi.

Vì vậy, thách thức đối với các phần mềm dịch thuật là lập trình như thế nào để máy tính có thể “hiểu” một văn bản như là con người.

(Theo TBVTSG)

Video được xem nhiều nhất

Bom nhiệt hạch tàn khốc thế nào?
00:00 / --:--

Video nổi bật

TIN Công Nghệ NỔI BẬT

Nhìn lại năm 2015 (Phần 1): Những cánh chim đầu đàn trong làng smartphone

Đây là thời điểm mà mọi thăng trầm trong năm 2015 của các hãng công nghệ đều đã có thể cân đong đo đếm cụ thể. Trước khi chờ đón những điều tuyệt vời ở năm 2016 thì chúng ta hãy cùng xem lại với những nỗ lực của mình, họ đã tạo được dấu ấn gì đáng nhớ trong năm vừa qua.

Hướng dẫn khắc phục khi điện thoại Android bị treo, đơ, lag khi sử dụng

Thiết bị chạy Android thường chạy chậm lại, thỉnh thoảng xảy ra hiện tượng treo ứng dụng sau một thời gian sử dụng. Đây là những hiện tượng khá bình thường sinh ra các nguyên nhân phần mềm và hoàn toàn có thể khắc phục được. Bạn có thể tham khảo các hướng dẫn của chúng tôi khi điện thoại Android (hay cả tablet Android) bị lag, giật, treo khi sử dụng.

3 điều cần xem xét trước khi chuyển sang Apple

Trong cuộc họp thường nên hồi cuối tháng 10 vừa qua, CEO Tim Cook của Apple vui mừng thông báo con số kỷ lục người dùng Android chuyển sang iOS, và cứ vào dịp cuối năm, Apple lại tung ra nhiều chương trình khuyến mại lớn nhằm cạnh tranh với Android. Vậy bạn có nghĩ rằng, việc chuyển từ Android sang Apple là một ý tưởng tốt?

Tránh mất tiền oan khi dùng ngân hàng trực tuyến

Bạn nghĩ rằng dùng ngân hàng trực tuyến (online banking) là rất an toàn? Chưa chắc! Ẩn sâu bên trong hệ thống giao dịch này là vô số những rủi ro có thể khiến bạn mất tiền oan mà không biết kêu ai. (Ngân hàng, thông tin, an toàn, trực tuyến)

Facebook ra tính năng cho phép đăng xuất tài khoản từ xa

Facebook chính thức ra mắt tính năng Kiểm tra Bảo mật (Security Checkup) giúp người dùng quản lý, bảo mật cho tài khoản an toàn hơn, có thể đăng xuất tài khoản đang được lưu ở bất kỳ thiết bị nào không mong muốn.

Nhận xét tin Phần mềm dịch thuật trực tuyến: Cần quan tâm đến chất lượng

Ý kiến bạn đọc

Viết phản hồi

Bạn có thể gửi nhận xét, góp ý hay liên hệ về bài viết Phần mềm dịch thuật trực tuyến: Cần quan tâm đến chất lượng bằng cách gửi thư điện tử tới Lien He Bao Viet Nam. Xin bao gồm tên bài viết Phan mem dich thuat truc tuyen Can quan tam den chat luong ở dạng tiếng Việt không dấu. Hoặc Phần mềm dịch thuật trực tuyến: Cần quan tâm đến chất lượng ở dạng có dấu. Bài viết trong chuyên đề của chuyên mục Công Nghệ.

online software translation: Need quality care
in Rychtyckyj, Spain, the company Google, Franz Josef Och, Vulgar Latin, Steve Richardson, Editor documents, policy manuals, databases, correctly, assembly instructions, the researcher, the original language, the company's original text, translation, the company

The translation tool Automation has long appeared, and new techniques are helping to boost their performance. However, quality remains a problem. You go to Google Language Tools ...

CÓ THỂ BẠN QUAN TÂM
Xem tiếp: Công Nghệ


  • Thoi su 24h0402 Virus Zika teo nao lay qua duong quan he
    Thời sự 24h(04/02): Virus Zika teo não lây qua đường quan hệ

    Những lần “trảm tướng” nhanh như chớp của Bộ trưởng Thăng; Hành trình vây bắt đối tượng có lệnh truy nã đặc biệt nguy hiểm; Hành lý của khách bị rạch ở sân bay: Thanh tra Bộ GTVT vào cuộc; Phá trọng án trong những ngày Tết nguyên đán đã cận kề;Câu chuyện giảm nghèo chưa bao giờ dừng lại;... là những tin tức thời sự nổi bật ngày 04/02/2016.

  • Thoi su 24h0302 Dot phao no co the bi tu den 7 nam
    Thời sự 24h(03/02): Đốt pháo nổ có thể bị tù đến 7 năm

    Sửa tàu Cát Linh-Hà Đông, Trung Quốc chưa nghe: Tội hình thức; “Ngáo đá” khống chế hai cháu bé, dọa dội nước sôi; "Choáng" với quy trình sản xuất chè Đinh 3 triệu đồng/kg; Sự thật sau lời đồn về cái chết bí ẩn của nam sinh trên cầu; Liên tiếp có nhiều trẻ em nhập viện vì ngộ độc chì trong thuốc cam;... là những tin tức thời sự nổi bật ngày 03/02/2016.

  • Thoi su 24h0202 sap bay lua doi 3 trieu lay 12 trieu
    Thời sự 24h(02/02): sập bẫy lừa đổi 3 triệu lấy 12 triệu

    3/14 mẫu thực phẩm phục vụ Tết không đạt chất lượng; 102 người đi bộ bị xử phạt trong ngày đầu: "Cần nhưng chưa đủ"?; Bị phát hiện bột ngọt từ nguyên liệu TQ, chốt cửa tẩu tán; WHO ban bố tình trạng khẩn cấp toàn cầu về virus Zika;

  • Thoi su 24h0102 Dao mo moi chon trom di 1 phan co the
    Thời sự 24h(01/02): Đào mộ mới chôn, trộm đi 1 phần cơ thể

    Kẻ gian đào mộ mới chôn, trộm đi một phần cơ thể; Đã tháo dỡ hết biển báo dưới 50km/h sau 10 ngày; CSGT trưng dụng tài sản cá nhân, tổ chức: Luật quy định thế nào?; "Người dân đừng trộm hoa ven hồ Gươm nữa"; Đã có kết quả xét nghiệm gạo từ thiện gây ngộ độc;... là những tin tức thời sự nổi bật ngày 01/02/2016.

  • Thoi su 24h2901 Nghi pham giet vo chong dai gia o TG
    Thời sự 24h(29/01): Nghi phạm giết vợ chồng đại gia ở TG

    Nghi “ăn gạo từ thiện… ngộ độc”: Hội nạn nhân chất độc da cam lên tiếng; Hành trình phá đường dây ma túy hội quý tử con nhà giàu; Việt Nam lên phương án đối phó với virus Zika gây teo não; Sân bay Nội Bài lên tiếng vụ "vòi vĩnh": Người tố trên Facebook nói gì?; Coi chừng lỡ chuyến tàu Tết vì... vé không hợp lệ!;... là những tin tức thời sự nổi bật

  • Tet binh than 2016
    Tết bính thân 2016

    Người Việt có thói quen quan tâm tới cuộc sống cá nhân của nhau. Nhưng điều này không phải phù hợp, thậm chí thành khiếm nhã. Tết là dịp điều này thể hiện rõ nhất.

  • Xu phat nguoi di bo vi pham giao thong o HN
    Xử phạt người đi bộ vi phạm giao thông ở HN

    Tai nạn giao thông chết người do người đi bộ gây ra ở TP.HCM và Hà Nội đáng báo động.

  • Hari Won Tran Thanh Yeu that hay PR
    Hari Won - Trấn Thành: Yêu thật hay PR?

    Showbiz Việt hôm qua (3/2) dậy sóng sau khi hình ảnh MC đắt show bậc nhất hiện nay "khóa môi", cõng người yêu cũ Đinh Tiến Đạt xuất hiện trên mạng.

  • Virus Zika gay tat dau nho o tre so sinh
    Virus Zika gây tật đầu nhỏ ở trẻ sơ sinh

    Mỹ vừa ghi nhận ca lây nhiễm virus Zika gây bệnh teo não đầu tiên không phải do muỗi đốt mà dường như từ quan hệ tình dục.

  • Tien gia cong khai rao ban tren facebook
    Tiền giả công khai rao bán trên facebook

    Lợi dùng lòng tham và sự nhẹ dạ cả tin của người dân, một số đối tượng đã dùng thủ đoạn đổi tiền thật lấy tiền giả để chiếm đoạt tài sản. ------------ Xem thêm: Tiền giả công khai rao bán trên facebook, http://vietbao.vn/tp/Tien-gia-cong-khai-rao-ban-tren-facebook/13583762/ Tin nhanh Việt Nam ra thế giới vietbao.vn

  • Su kien quoc te noi bat 31162
    Sự kiện quốc tế nổi bật (31/1-6/2)

    Lệnh Hoàn Thành tiết lộ cho tình báo Mỹ bí mật thâm cung của Bắc Kinh; Hoà đàm Syria tạm ngừng do giao tranh khốc liệt trên chiến trường; Bà Clinton chính thức giành chiến thắng 'sít sao nhất lịch sử'; Viễn cảnh nước Anh rời khỏi Liên minh châu Âu đã cận kề.... là những tin chính trong tuần qua.

  • Toan canh kinh te tuan 3101 06022016
    Toàn cảnh kinh tế tuần 31/01 – 06/02/2016

    Ngày 2/2/2016 diễn ra buổi họp báo Công bố giá thành sản xuất kinh doanh điện năm 2014, ông Đinh Quang Tri – Phó tổng giám đốc Tập đoàn Điện lực Việt Nam (EVN) khẳng định chưa có kế hoạch tăng giá điện, tuy nhiên tới mùa cao điểm, doanh nghiệp 'chưa nói trước được điều gì'. Cũng trong buổi họp này, tổng kết hoạt động kinh doanh của tập đoàn này, EVN lãi hơn

  • Nghin le chuyen tuan qua 0102 05022016
    Nghìn lẻ chuyện tuần qua 01/02 - 05/02/2016

    Xử phạt người đi bộ vi phạm giao thông ở HN; CSGT trưng dụng tài sản của dân gây tranh cãi; Đề xuất mua tàu Trung Quốc cũ; Hoa trang trí ở hồ Gươm bị ăn trộm; Các điểm bắn pháo hoa giao thừa Tết Bính Thân 2016 tại 64 tỉnh, thành... là những tin tức xã hội nổi bật được dư luận quan tâm trong tuần qua.

  • Tin An ninh Phap luat tuan qua 3101 0602
    Tin An ninh - Pháp luật tuần qua (31/01 - 06/02)

    Cảnh báo nạn trộm cắp, cướp giật dịp Tết; Phận tù 'mồ côi', Tết về rưng rưng nước mắt; Tiền giả công khai rao bán trên facebook; Rượu bia ngày Tết và những hệ lụy: Từ rượu giả đến tai nạn giao thông; Hành trình cảm động của người cha qua 15 tỉnh, thành đi tìm con; Phá án là trách nhiệm chứ không phải chiến công;.....là những tin đáng chú ý.

  • Ban tin Suc khoe tuan qua 311 62
    Bản tin Sức khỏe tuần qua (31/1 - 6/2)

    Thái Lan phát hiện virus Zika, Bộ Y tế Việt Nam họp khẩn; Ăn tiết canh ngày Tết, dễ chết như chơi; Trẻ nhập viện liên tiếp vì ngộ độc chì từ thuốc cam; Không biết bị lạc nội mạc tử cung: Nhiều phụ nữ vô sinh;... là những thông tin Sức khỏe được quan tâm nhất tuần qua.