Phần mềm dịch thuật trực tuyến: Cần quan tâm đến chất lượng

Bấm ngay Subscribe / Đăng Ký xem video hay mới nhất >>

Phan mem dich thuat truc tuyen Can quan tam den chat luong

Những công cụ dịch thuật tự động đã xuất hiện từ lâu, và các kỹ thuật mới đang giúp đẩy mạnh hiệu suất hoạt động của chúng. Tuy nhiên, chất lượng vẫn còn là vấn đề nan giải.

Bạn vào trang Language Tools của Google ( http://www.google.com/language_tools ) và thử làm như sau : Đánh vào ô Translate text câu hỏi “Automated language translation – is it an idea whose time has come?” (Dịch thuật tự động – Nó có là một ý tưởng mà thời của nó đã đến không ?) và cho chương trình dịch câu hỏi đó sang tiếng Pháp. Tiếp theo, dịch kết quả từ tiếng Pháp sang tiếng Đức. Và cuối cùng, dịch câu tiếng Đức có được trở lại tiếng Anh. Bạn sẽ có kết quả là “Did language translation automate – is it an idea, from which the time came ?” (Dịch thuật tự động hóa – Nó có là một ý tưởng mà thời gian đến từ đó ?).

Làm lại giống như vậy với câu “Reboot your computer and try again.” (Khởi động lại máy tính của bạn và thử lại lần nữa) bạn sẽ có kết quả cuối cùng là “Their computer and attempt still again load.” (Máy tính của họ và nỗ lực vẫn còn nhập vào lần nữa.) Ôi trời ! Đúng là “tam sao thất bản” !!! Có lẽ bạn sẽ thật sự ngán ngẫm nếu như những sách hướng dẫn sử dụng thiết bị có nhiều ngôn ngữ được dịch theo kiểu như thế này.

Tuy vậy, công bằng mà nói thì các công cụ dịch thuật cũng có những hỗ trợ tích cực ở một số mặt nào đó. Và các nhà nghiên cứu cho biết những cách tiếp cận mới sẽ mang lại nhiều cải thiện về cách thực hiện cho những công cụ dịch thuật.

Cập nhật cơ sở dữ liệu

Hãng xe hơi Ford đã bắt đầu sử dụng phần mềm dịch thuật (machine translation) từ năm 1998, và đến nay hãng này đã dịch được năm triệu câu hướng dẫn lắp ráp từ tiếng Anh sang tiếng Tây Ban Nha, Đức, Bồ Đào Nha và tiếng Tây Ban Nha của người Mexico. Các sách hướng dẫn lắp ráp bằng tiếng Anh được cập nhật mỗi ngày, và những bản dịch của chúng – khoảng 5.000 trang một ngày – được nhanh chóng chuyển đến các nhà máy của Ford trên khắp thế giới.

Nestor Rychtyckyj, chuyên gia về trí tuệ nhân tạo (Artificial Intelligence – AI) của hãng Ford, nói : “Bạn không thể làm toàn bộ công việc này một cách thủ công được.”

Hãng xe hơi này sử dụng phần mềm Enterprise Global Server của Systran Software, một công ty chuyên cung cấp các phần mềm dịch thuật có trụ sở ở San Diego, bang California. Bên cạnh đó, các kỹ sư của Ford cũng tự viết một chương trình AI để chuyển ngữ những câu hướng dẫn thuộc về chuyên môn ở cấp độ cao một cách chính xác và rõ ràng. Mỗi một câu hướng dẫn đều được lưu trữ vào cơ sở dữ liệu để dùng cho việc dịch thuật.

Hãng Ford cũng phải phát triển những từ điển thuật ngữ chuyên ngành xe hơi. Theo Rychtyckyj, duy trì những từ điển như thế dễ dàng hơn việc tìm kiếm một chuyên gia dịch thuật thông thạo các thuật ngữ. Ông nói : “Hầu hết những nỗ lực của chúng tôi là xây dựng các bảng thuật ngữ, và thường xuyên thay đổi chúng. Kết quả dịch thuật của bạn sẽ tốt hơn nhiều nếu bạn có sự chuẩn bị trước.”

Phần mềm của công ty Systran sử dụng một kỹ thuật đáng tin cậy gọi là dịch theo quy tắc (rules-based translation). Những hệ thống như thế sử dụng những từ điển song ngữ kết hợp với cơ sở dữ liệu về cách dùng từ và các quy tắc văn phạm. Các trình dịch thuật thương mại thường được bổ sung bằng các bảng thuật ngữ, hoặc những cơ sở dữ liệu lưu trữ những câu hoặc đoạn văn mẫu đã được dịch sẵn (translation memory). Những phần bổ sung này thường do người sử dụng lập ra trong quá trình dịch thuật. Nhờ vậy, phần mềm dịch thuật có thể đưa ra những từ hoặc câu dịch chính xác hoặc gần đúng nhất so với từ hoặc câu gốc để người dịch dễ dàng xem lại.

Huấn luyện phần mềm

Dịch thuật theo kiểu thống kê (statistical machine translation) là một kỹ thuật mới nhưng chưa được sử dụng rộng rãi. Kỹ thuật này sử dụng những văn bản gốc và bản dịch của chúng để “huấn luyện” phần mềm. Theo thời gian, những hệ thống này sẽ “học” được cách tạo ra một bản dịch tốt, rồi dùng phép tính xác suất và thống kê để chọn ra một từ hoặc cụm từ gần đúng nhất dựa trên ngữ cảnh.

Các hệ thống thống kê đòi hỏi phải có rất nhiều văn bản để huấn luyện các thuật toán, nhưng chúng không cần các quy tắc văn phạm, từ điển song ngữ hoặc translation memory. Chúng tự phát triển những quy tắc và tiếp tục tự điều chỉnh các quy tắc đó theo thời gian.

Hãng Google sử dụng phần mềm dịch theo quy tắc của công ty Systran, nhưng họ cũng phát triển những hệ thống dựa trên thống kê của chính họ để dịch từ tiếng Anh sang tiếng Ả-Rập, Nga, Hoa, Hàn, Nhật, và ngược lại. Theo chuyên gia nghiên cứu Franz Josef Och của Google, những ngôn ngữ này rất khó cho các phần mềm dịch thuật vì chúng khác với các ngôn ngữ Tây phương có gốc là tiếng Latin bình dân (Vulgar Latin).

Trong nhiều năm qua, hãng Microsoft đã đưa một phần mềm phân tích cú pháp dựa trên quy tắc văn phạm vào trình soạn thảo văn bản Word của họ. Gần đây, hãng này lại kết hợp các translation memory, các phần mềm dịch thuật dựa trên quy tắc và thống kê với sự hỗ trợ của con người để dịch các văn bản cho cơ sở dữ liệu về thông tin hỗ trợ khách hàng của họ. Steve Richardson, một nhà nghiên cứu cao cấp của Microsoft, nói : “Khuynh hướng mới trong cộng đồng các nhà nghiên cứu là xem con người có thể kết hợp những kỹ thuật thuần túy về thống kê này với một số kiến thức về ngôn ngữ ra sao.”

Khi được hỏi là sẽ có những đột phá trong việc dịch thuật không, ông trả lời : “Những đột phá đã xuất hiện trong quá trình nghiên cứu. Trên phương diện thực hành, sẽ có những đột phá trong việc tạo ra những hệ thống được tích hợp vào quá trình hoạt động của doanh nghiệp.”

Xu hướng trong tương lai là kết hợp các cơ sở dữ liệu lưu trữ những câu hoặc đoạn văn mẫu đã được dịch sẵn với các phần mềm dịch thuật dựa trên quy tắc hoặc thống kê, hoặc cả hai. Những hệ thống lai tạo như thế sẽ trở nên tinh vi và phức tạp hơn.

Tuy nhiên, những hệ thống dịch thuật hiện nay chưa thể đưa ra những bản dịch có chất lượng cao như là những dịch giả “siêu đẳng”, đặc biệt đối với những văn bản sử dụng ngôn ngữ bình dân. Theo Rychtyckyj của hãng Ford, những hệ thống lai tạo trở nên thông minh như thế nào không là vấn đề gì cả, chất lượng dịch thuật phụ thuộc vào việc xây dựng ngôn ngữ gốc một cách chuẩn xác.

Quy trình dịch thuật nói chung có hai công đoạn chính :

- Phân tích nguyên bản trong ngôn ngữ gốc để “hiểu” thật rõ tác giả “muốn nói” gì.

- Tái lập ý nghĩa mà tác giả muốn chuyển tải trong ngôn ngữ đích để có được một văn bản tương đương với nguyên bản.

Thoạt nhìn thì quy trình này có vẻ đơn giản nhưng đằng sau nó là cả một quá trình nhận thức phức tạp. Để “giải mã” ý nghĩa của văn bản gốc một cách chính xác, dịch giả phải phân tích và diễn giải tất cả các đặc tính của nó. Đây là một quá trình đòi hỏi một kiến thức sâu rộng về văn phạm, ngữ nghĩa, cú pháp, thành ngữ… của ngôn ngữ gốc, cũng như văn hóa của tác giả văn bản đó. Đồng thời, dịch giả cũng phải có một kiến thức tương tự như thế về ngôn ngữ mà họ sẽ chuyển đổi.

Vì vậy, thách thức đối với các phần mềm dịch thuật là lập trình như thế nào để máy tính có thể “hiểu” một văn bản như là con người.

(Theo TBVTSG)

Comment :Phần mềm dịch thuật trực tuyến: Cần quan tâm đến chất lượng
Viết phản hồi
Bạn có thể gửi nhận xét, góp ý hay liên hệ về bài viết Phần mềm dịch thuật trực tuyến: Cần quan tâm đến chất lượng bằng cách gửi thư điện tử tới Lien He Bao Viet Nam. Xin bao gồm tên bài viết Phan mem dich thuat truc tuyen Can quan tam den chat luong ở dạng tiếng Việt không dấu. Hoặc Phần mềm dịch thuật trực tuyến: Cần quan tâm đến chất lượng ở dạng có dấu. Bài viết trong chuyên đề của chuyên mục Công Nghệ
online software translation: Need quality care
in Rychtyckyj, Spain, the company Google, Franz Josef Och, Vulgar Latin, Steve Richardson, Editor documents, policy manuals, databases, correctly, assembly instructions, the researcher, the original language, the company's original text, translation, the company
The translation tool Automation has long appeared, and new techniques are helping to boost their performance. However, quality remains a problem. You go to Google Language Tools ...
Mathpix: Ứng dụng giải phương trình toán tuyệt vời cho iOS
Mathpix: Ứng dụng giải phương trình toán tuyệt vời cho iOS

Với Mathpix, bạn chỉ cần chĩa smartphone của mình vào các phương trình toán học và lời giải sẽ được đưa ra sau ít giây.

  • Thoi su 24h2306 Cha om con 28 thang tuoi nhay lau tu tu
    Thời sự 24h(23/06): Cha ôm con 28 tháng tuổi nhảy lầu tự tử

    Tai nạn thảm khốc trên đèo Prenn: Cấm xe lưu thông vào ban đêm; Nhân viên BV Bạch Mai "buôn" điện thoại: "Buôn" 4 phút; Cặp bồ với "chồng nhà người ta", cô gái trẻ bị lột áo ngay tại nơi làm việc; Thảm sát Bình Phước: Gian nan nộp tiền khắc phục hậu quả; Thanh Hoá: Phát hiện nhầm con sau 4 năm vì cha mẹ trắng trẻo, con ngăm đen

  • Thoi su 24h2206 Hung thu giet hai nu sinh lop 12
    Thời sự 24h(22/06): Hung thủ giết hại nữ sinh lớp 12

    Nhận đỡ đầu con của Đại tá Trần Quang Khải tới năm 18 tuổi; Đằng sau người đàn bà chạy xe ôm 'ghê gớm' ở bến xe Gia Lâm; Nữ sinh trường Cao đẳng Công thương mất tích bí ẩn hơn nửa tháng; Trục lợi từ video khoe thân qua Facebook Live ở Việt Nam; Tai nạn kinh hoàng, xe cứu thương nát đầu, 10 người thương vong

  • Thoi su 24h2106 100 dan choi phe ma tuy trong khach san
    Thời sự 24h(21/06): 100 dân chơi phê ma túy trong khách sạn

    Hàng loạt bé trai Hà Nội dưới 5 tuổi dễ trở thành “thái giám”; Phạt nặng xe không treo khẩu hiệu: Nặng bệnh hình thức; Đã có ‘vòng kim cô’, chủ dự án BOT hết thời ‘tay không bắt giặc’; TNGT 7 người chết: Hàng nghìn HS nghẹn ngào tiễn đưa 3 cô giáo; Hi hữu ở HN: Chủ say rượu ngủ giữa đường, chó nhất quyết đứng trông

  • Thoi su 24h2006 Co dau xinh dep mat tich khi tam
    Thời sự 24h(20/06): Cô dâu xinh đẹp mất tích khi tắm

    Máy bay CASA 212 bị nạn: Ngóng đợi tin các anh trở về đất Mẹ; Tai nạn ở đèo Prenn 7 người chết: Nhiều sai phạm cần khởi tố vụ án ; Vỡ hồ chứa nước đãi titan: Hàng loạt sai phạm chỉ được coi là "thiếu sót"?; Vụ đánh ghen tại bigc quận Hà Đông, Hà Nội: Hành vi “có tổ chức” sẽ bị xử lý nghiêm!;

  • Thoi su 24h1706 Phan no co giao tat bom bop vao mat tre
    Thời sự 24h(17/06): Phẫn nộ cô giáo tát bôm bốp vào mặt trẻ

    Máy bay chở chín người tìm Su-30MK2 mất tích; Nửa đêm, bị kẻ lạ mặt ném mắm tôm vào nhà "khủng bố" tinh thần?; Đã tìm được thi thể phi công Trần Quang Khải; Phẫn nộ clip cô giáo tát bôm bốp vào mặt bé trai 3 tuổi; Bùng nổ các vụ đánh ghen: Trước hả hê, sau hối hận; CSGT phạt lỗi lốp mòn, đèn mờ bằng... mắt: Bức xúc!

  • Thoi su 24h1606 Danh ghen kinh hoang o Ha Dong
    Thời sự 24h(16/06): Đánh ghen kinh hoàng ở Hà Đông

    CSGT phạt lỗi lốp mòn, đèn mờ bằng... mắt; Mẹ 9x bỏ xác con gái ở bụi keo: Bán xe máy, quay lại xin làm phụ hồ; Cuộc sống hiện tại của 3 cha con bé trai bị bỏ rơi ở quán phở; Hơn 1.000 người tìm phi công Su-30 từ Hà Tĩnh đến Thái Bình; Gia cảnh của mẹ trẻ bị tố giả khổ lên mạng xin sữa cho con rồi đem bán

  • Thoi su 24h1506 Con rai vang ma quanh dam cuoi bo
    Thời sự 24h(15/06): Con rải vàng mã quanh đám cưới bố

    Chốt hạn đường sắt Cát Linh-Hà Đông:Phi thường hay phi thực tế?; Dòi trong cơm KTX ĐHQG: Chắc nuốt vài chục con vào bụng rồi!; Sữa Meiji Nhật Bản ở Việt Nam có thể là hàng giả; "Cò" dịch vụ đăng ký xe máy: Đưa 3,8 triệu đồng, 30 phút sau có giấy tờ!; Bé trai bị cắn tím người: Hiệu trưởng trường MN đến tận nhà xin lỗi

  • Thoi su 24h1406 MB tiem kich Su30MK2 mat lien lac
    Thời sự 24h(14/06): MB tiêm kích Su30-MK2 mất liên lạc

    Đường sắt Cát Linh-Hà Đông lại thất hứa: Lỗi phía Việt Nam?; Phượt thủ người Anh mắc sai lầm gì khi leo núi ở Sa Pa?; Máy bay tiêm kích Su30-MK2 mất liên lạc trong khi bay huấn luyện; Nữ sinh tử vong sau truyền nước: Phòng khám Thành Mỹ chịu trách nhiệm?; Rò rỉ khí độc amoniac ở hãng nước đá, nhiều người chạy tán loạn;

  • Thoi su 24h1306 Co gai bi sat hai nhet trong bao tai
    Thời sự 24h(13/06): Cô gái bị sát hại, nhét trong bao tải

    Tranh cãi về chất phenol "cực độc" trên cá nục; Báo động giới trẻ hồn nhiên mua "bóng cười" bằng mạng sống; Chồng nổi máu ghen dùng dao kề cổ vợ gây náo loạn Hà Nội; Đã xác định nguyên nhân nữ sinh 20 tuổi tử vong sau khi truyền nước; Dân xếp hàng chờ nhân viên BV Bạch Mai "buôn" điện thoại

  • Nghin le chuyen tuan qua 1906 25062016
    Nghìn lẻ chuyện tuần qua 19/06 - 25/06/2016

    9 quân nhân trên Casa 212 đã hy sinh; Tai nạn thảm khốc ở đèo Prenn - Đà Lạt; An toàn hàng không sân bay Nội Bài bị uy hiếp vì tia lazer; Một giáo viên “phản pháo” việc tuyển dụng vợ phi công Khải; Những vụ đánh ghen lột trần tình địch giữa phố ... là những tin tức xã hội nổi bật được dư luận quan tâm trong tuần qua.

  • Ban tin Suc khoe tuan qua 196 256
    Bản tin Sức khỏe tuần qua (19/6 - 25/6)

    Căn bệnh cướp mạng gần 5.000 phụ nữ Việt mỗi năm; Sử dụng điều hòa quá lạnh làm tăng nguy cơ đột quỵ và tử vong; 10 thực phẩm Trung Quốc chuyên gia Mỹ khuyên tránh xa; Chuyên gia chia sẻ bài thuốc hạ sốt cho trẻ bằng cây nhà lá vườn;... là những thông tin Sức khỏe được quan tâm nhất tuần qua.

  • Su kien quoc te noi bat 196256
    Sự kiện quốc tế nổi bật (19/6-25/6)

    Người Anh lựa chọn rời EU; bão tử thần tấn công Trung Quốc, 898 người thương vong; Chủ tịch Kim Jong Un tự tin tên lửa Triều Tiên đã có thể đánh trúng Mỹ'; Tổng thống Indonesia họp kín bàn cách phá 'đường lưỡi bò'... là những tin đáng chú ý trong tuần này.

  • Ban tin Suc khoe tuan qua 126 186
    Bản tin Sức khỏe tuần qua (12/6 - 18/6)

    Cô gái 20 tuổi tử vong sau khi được truyền dịch; Cá nục nhiễm chất cực độc phenol; Bé gái 5 tuổi liệt mặt vì mẹ bật điều hoà suốt đêm; Con bị tật bẩm sinh, đừng chậm trễ... là những thông tin Sức khỏe được quan tâm nhất tuần qua.

  • Nghin le chuyen tuan qua 1206 18062016
    Nghìn lẻ chuyện tuần qua 12/06 - 18/06/2016

    Máy bay Su-30, CASA gặp nạn trên biển; Bé trai 2 tuổi bị bỏ rơi cùng lá thư tuyệt vọng; Cá nục nghi nhiễm chất Phenol cực độc; Hot girl bị đánh ghen lột đồ tại siêu thị Big C Hà Đông; Cô giáo tát bôm bốp vào mặt bé trai 3 tuổi... là những tin tức xã hội nổi bật được dư luận quan tâm trong tuần qua.

  • Tin An ninh Phap luat tuan qua 1206 1806
    Tin An ninh - Pháp luật tuần qua (12/06 - 18/06)

    Đánh ghen "hội đồng" trước BigC Hà Đông; Toàn cảnh vụ dùng ô tô truy sát, nã đạn ở Hải Dương; Những bí mật đường dây cá độ nghìn tỷ của chủ salon ôtô; Từ chối chuyện chăn gối, chồng bị vợ đánh đến chết; Thầy tu trẻ vướng chuyện ái tình đẫm máu và nước mắt;....là những tin đáng chú ý.

  • Su kien quoc te noi bat 56116
    Sự kiện quốc tế nổi bật (5/6-11/6)

    Trung Quốc ráo riết xây dựng hải đăng ở Trường Sa; Nga có thể đánh bại NATO trong 60 giờ; Tổng thống Obama hậu thuẫn mạnh mẽ cho bà Hillary Clinton; Trung Quốc sẽ xây trạm nghiên cứu khổng lồ dưới Biển Đông... là những tin đáng chú ý trong tuần qua.

  • Toan canh kinh te tuan 0506 11062016
    Toàn cảnh kinh tế tuần (05/06 - 11/06/2016)

    Bộ Tài chính tiếp tục yêu cầu BIDV, Vietinbank phải trả cổ tức bằng tiền mặt; Vinalines xin thanh lý 6 con tàu; Bầu Đức viết tâm thư xin cổ đông thời gian vượt khó; lãi suất cho vay mua nhà ở xã hộixuống còn 4,8%...Cùng với những thông tin về tài chính- ngân hàng, bất động sản, thị trường tiêu dùng..là những tin tức - sự kiện

  • Nghin le chuyen tuan qua 0506 11062016
    Nghìn lẻ chuyện tuần qua 05/06 - 11/06/2016

    Phượt thủ người anh tử nạn khi leo Fansipan; Chìm tàu du lịch trên sông Hàn; Cá chết nổi trắng hồ Hoàng Cầu; Cột điện mọc xuyên nhà dân giữa Hà Nội; Ớn lạnh thứ ma dược mới núp bóng thuốc lá thơm; Lộ diện đường dây mua chứng chỉ tiếng Anh có 1-0-2 tại Ninh Bình... là những tin tức xã hội nổi bật được dư luận quan tâm trong tuần qua.