vietbao

Phần mềm dịch thuật trực tuyến: Cần quan tâm đến chất lượng

Bấm ngay Subscribe / Đăng Ký xem video hay mới nhất >>

Phan mem dich thuat truc tuyen Can quan tam den chat luong

Những công cụ dịch thuật tự động đã xuất hiện từ lâu, và các kỹ thuật mới đang giúp đẩy mạnh hiệu suất hoạt động của chúng. Tuy nhiên, chất lượng vẫn còn là vấn đề nan giải.

Bạn vào trang Language Tools của Google ( http://www.google.com/language_tools ) và thử làm như sau : Đánh vào ô Translate text câu hỏi “Automated language translation – is it an idea whose time has come?” (Dịch thuật tự động – Nó có là một ý tưởng mà thời của nó đã đến không ?) và cho chương trình dịch câu hỏi đó sang tiếng Pháp. Tiếp theo, dịch kết quả từ tiếng Pháp sang tiếng Đức. Và cuối cùng, dịch câu tiếng Đức có được trở lại tiếng Anh. Bạn sẽ có kết quả là “Did language translation automate – is it an idea, from which the time came ?” (Dịch thuật tự động hóa – Nó có là một ý tưởng mà thời gian đến từ đó ?).

Làm lại giống như vậy với câu “Reboot your computer and try again.” (Khởi động lại máy tính của bạn và thử lại lần nữa) bạn sẽ có kết quả cuối cùng là “Their computer and attempt still again load.” (Máy tính của họ và nỗ lực vẫn còn nhập vào lần nữa.) Ôi trời ! Đúng là “tam sao thất bản” !!! Có lẽ bạn sẽ thật sự ngán ngẫm nếu như những sách hướng dẫn sử dụng thiết bị có nhiều ngôn ngữ được dịch theo kiểu như thế này.

Tuy vậy, công bằng mà nói thì các công cụ dịch thuật cũng có những hỗ trợ tích cực ở một số mặt nào đó. Và các nhà nghiên cứu cho biết những cách tiếp cận mới sẽ mang lại nhiều cải thiện về cách thực hiện cho những công cụ dịch thuật.

Cập nhật cơ sở dữ liệu

Hãng xe hơi Ford đã bắt đầu sử dụng phần mềm dịch thuật (machine translation) từ năm 1998, và đến nay hãng này đã dịch được năm triệu câu hướng dẫn lắp ráp từ tiếng Anh sang tiếng Tây Ban Nha, Đức, Bồ Đào Nha và tiếng Tây Ban Nha của người Mexico. Các sách hướng dẫn lắp ráp bằng tiếng Anh được cập nhật mỗi ngày, và những bản dịch của chúng – khoảng 5.000 trang một ngày – được nhanh chóng chuyển đến các nhà máy của Ford trên khắp thế giới.

Nestor Rychtyckyj, chuyên gia về trí tuệ nhân tạo (Artificial Intelligence – AI) của hãng Ford, nói : “Bạn không thể làm toàn bộ công việc này một cách thủ công được.”

Hãng xe hơi này sử dụng phần mềm Enterprise Global Server của Systran Software, một công ty chuyên cung cấp các phần mềm dịch thuật có trụ sở ở San Diego, bang California. Bên cạnh đó, các kỹ sư của Ford cũng tự viết một chương trình AI để chuyển ngữ những câu hướng dẫn thuộc về chuyên môn ở cấp độ cao một cách chính xác và rõ ràng. Mỗi một câu hướng dẫn đều được lưu trữ vào cơ sở dữ liệu để dùng cho việc dịch thuật.

Hãng Ford cũng phải phát triển những từ điển thuật ngữ chuyên ngành xe hơi. Theo Rychtyckyj, duy trì những từ điển như thế dễ dàng hơn việc tìm kiếm một chuyên gia dịch thuật thông thạo các thuật ngữ. Ông nói : “Hầu hết những nỗ lực của chúng tôi là xây dựng các bảng thuật ngữ, và thường xuyên thay đổi chúng. Kết quả dịch thuật của bạn sẽ tốt hơn nhiều nếu bạn có sự chuẩn bị trước.”

Phần mềm của công ty Systran sử dụng một kỹ thuật đáng tin cậy gọi là dịch theo quy tắc (rules-based translation). Những hệ thống như thế sử dụng những từ điển song ngữ kết hợp với cơ sở dữ liệu về cách dùng từ và các quy tắc văn phạm. Các trình dịch thuật thương mại thường được bổ sung bằng các bảng thuật ngữ, hoặc những cơ sở dữ liệu lưu trữ những câu hoặc đoạn văn mẫu đã được dịch sẵn (translation memory). Những phần bổ sung này thường do người sử dụng lập ra trong quá trình dịch thuật. Nhờ vậy, phần mềm dịch thuật có thể đưa ra những từ hoặc câu dịch chính xác hoặc gần đúng nhất so với từ hoặc câu gốc để người dịch dễ dàng xem lại.

Huấn luyện phần mềm

Dịch thuật theo kiểu thống kê (statistical machine translation) là một kỹ thuật mới nhưng chưa được sử dụng rộng rãi. Kỹ thuật này sử dụng những văn bản gốc và bản dịch của chúng để “huấn luyện” phần mềm. Theo thời gian, những hệ thống này sẽ “học” được cách tạo ra một bản dịch tốt, rồi dùng phép tính xác suất và thống kê để chọn ra một từ hoặc cụm từ gần đúng nhất dựa trên ngữ cảnh.

Các hệ thống thống kê đòi hỏi phải có rất nhiều văn bản để huấn luyện các thuật toán, nhưng chúng không cần các quy tắc văn phạm, từ điển song ngữ hoặc translation memory. Chúng tự phát triển những quy tắc và tiếp tục tự điều chỉnh các quy tắc đó theo thời gian.

Hãng Google sử dụng phần mềm dịch theo quy tắc của công ty Systran, nhưng họ cũng phát triển những hệ thống dựa trên thống kê của chính họ để dịch từ tiếng Anh sang tiếng Ả-Rập, Nga, Hoa, Hàn, Nhật, và ngược lại. Theo chuyên gia nghiên cứu Franz Josef Och của Google, những ngôn ngữ này rất khó cho các phần mềm dịch thuật vì chúng khác với các ngôn ngữ Tây phương có gốc là tiếng Latin bình dân (Vulgar Latin).

Trong nhiều năm qua, hãng Microsoft đã đưa một phần mềm phân tích cú pháp dựa trên quy tắc văn phạm vào trình soạn thảo văn bản Word của họ. Gần đây, hãng này lại kết hợp các translation memory, các phần mềm dịch thuật dựa trên quy tắc và thống kê với sự hỗ trợ của con người để dịch các văn bản cho cơ sở dữ liệu về thông tin hỗ trợ khách hàng của họ. Steve Richardson, một nhà nghiên cứu cao cấp của Microsoft, nói : “Khuynh hướng mới trong cộng đồng các nhà nghiên cứu là xem con người có thể kết hợp những kỹ thuật thuần túy về thống kê này với một số kiến thức về ngôn ngữ ra sao.”

Khi được hỏi là sẽ có những đột phá trong việc dịch thuật không, ông trả lời : “Những đột phá đã xuất hiện trong quá trình nghiên cứu. Trên phương diện thực hành, sẽ có những đột phá trong việc tạo ra những hệ thống được tích hợp vào quá trình hoạt động của doanh nghiệp.”

Xu hướng trong tương lai là kết hợp các cơ sở dữ liệu lưu trữ những câu hoặc đoạn văn mẫu đã được dịch sẵn với các phần mềm dịch thuật dựa trên quy tắc hoặc thống kê, hoặc cả hai. Những hệ thống lai tạo như thế sẽ trở nên tinh vi và phức tạp hơn.

Tuy nhiên, những hệ thống dịch thuật hiện nay chưa thể đưa ra những bản dịch có chất lượng cao như là những dịch giả “siêu đẳng”, đặc biệt đối với những văn bản sử dụng ngôn ngữ bình dân. Theo Rychtyckyj của hãng Ford, những hệ thống lai tạo trở nên thông minh như thế nào không là vấn đề gì cả, chất lượng dịch thuật phụ thuộc vào việc xây dựng ngôn ngữ gốc một cách chuẩn xác.

Quy trình dịch thuật nói chung có hai công đoạn chính :

- Phân tích nguyên bản trong ngôn ngữ gốc để “hiểu” thật rõ tác giả “muốn nói” gì.

- Tái lập ý nghĩa mà tác giả muốn chuyển tải trong ngôn ngữ đích để có được một văn bản tương đương với nguyên bản.

Thoạt nhìn thì quy trình này có vẻ đơn giản nhưng đằng sau nó là cả một quá trình nhận thức phức tạp. Để “giải mã” ý nghĩa của văn bản gốc một cách chính xác, dịch giả phải phân tích và diễn giải tất cả các đặc tính của nó. Đây là một quá trình đòi hỏi một kiến thức sâu rộng về văn phạm, ngữ nghĩa, cú pháp, thành ngữ… của ngôn ngữ gốc, cũng như văn hóa của tác giả văn bản đó. Đồng thời, dịch giả cũng phải có một kiến thức tương tự như thế về ngôn ngữ mà họ sẽ chuyển đổi.

Vì vậy, thách thức đối với các phần mềm dịch thuật là lập trình như thế nào để máy tính có thể “hiểu” một văn bản như là con người.

(Theo TBVTSG)

Comment :Phần mềm dịch thuật trực tuyến: Cần quan tâm đến chất lượng
Ý kiến bạn đọc
Viết phản hồi
Bạn có thể gửi nhận xét, góp ý hay liên hệ về bài viết Phần mềm dịch thuật trực tuyến: Cần quan tâm đến chất lượng bằng cách gửi thư điện tử tới Lien He Bao Viet Nam. Xin bao gồm tên bài viết Phan mem dich thuat truc tuyen Can quan tam den chat luong ở dạng tiếng Việt không dấu. Hoặc Phần mềm dịch thuật trực tuyến: Cần quan tâm đến chất lượng ở dạng có dấu. Bài viết trong chuyên đề của chuyên mục Công Nghệ
online software translation: Need quality care
in Rychtyckyj, Spain, the company Google, Franz Josef Och, Vulgar Latin, Steve Richardson, Editor documents, policy manuals, databases, correctly, assembly instructions, the researcher, the original language, the company's original text, translation, the company
The translation tool Automation has long appeared, and new techniques are helping to boost their performance. However, quality remains a problem. You go to Google Language Tools ...
Cách bảo vệ tài khoản iCloud để tránh bị kẻ xấu lợi dụng

Với người dùng iPhone thì tài khoản iCloud rất quan trọng, nó không chỉ chứa dữ liệu cá nhân mà còn là công cụ để tìm iPhone bị mất hay khóa máy từ xa. Một trường hợp nữa là có những kẻ xấu lợi dụng sơ hở của các cửa hàng để khóa iCloud iPhone, iPad gây rắc rối không nhỏ. Tình trạng bị "chơi khăm" như vậy trong thực tế không hề hiếm nên trong bài viết này mì

7 ứng dụng không nên bỏ lỡ trên iPhone
7 ứng dụng không nên bỏ lỡ trên iPhone

Rất nhiều ứng dụng thú vị mà có thể bạn bỏ lỡ vì chưa biết đến. Bài viết này sẽ giới thiệu tới các bạn một số ứng dụng được yêu thích trong lĩnh vực hỗ trợ học tiếng Anh, chia sẻ file, trò chơi cũng như quản lý các chuyến du lịch.

  • Thoi su 24h267 An mang dau long tu viec ly hon gia hoa that
    Thời sự 24h(26/7): Án mạng đau lòng từ việc ly hôn giả hóa thật

    Sự thật sốc về cô gái “hở bạo” tiếp thị Bệnh viện thẩm mỹ Kangnam; Mẹ nạn nhân bị cưa chân phản bác kết luận của Sở Y tế; Vụ trao nhầm con: Nước mắt vẫn chưa ngừng rơi!; Người đàn ông bỏ xe bánh mỳ, nhảy sông Đà vì bị truy sát?; Bệnh nhân phải đóng trước 220 nghìn mới được đi vệ sinh ở bệnh viện

  • Thoi su 24h257 Can bo hon nguc nang Biang
    Thời sự 24h(25/7): Cán bộ hôn ngực nàng Biang

    Kẻ "gạ tình" người mẹ liên quan gì đến vụ cháu bé bị mất tích ở Long Biên?; Vụ xả thải: Bộ TNMT thông báo nóng với Formosa; Ông bố đập sữa trước cửa siêu thị: "Đã mua chịu lại còn kiếm chuyện"; Cán bộ hôn ngực nàng Biang: Xử lý đúng quy trình; Ngày con dâu bỏ đi, bố mẹ chồng khóc cạn nước mắt thương 5 cháu nhỏ

  • Thoi su 24h217 Cong ly nao cho nguoi vo mang noi dau tot cung
    Thời sự 24h(21/7): Công lý nào cho người vợ mang nỗi đau tột cùng

    Đình chỉ hay khen thưởng CSGT "giơ chân" cản người phạm luật?; Xót xa những vụ tự tử vì bệnh tật và tận cùng nghèo khó; "Rác thải Formosa tràn lan, trách nhiệm chính thuộc xã, phường"; Vụ cô gái bị chồng thiêu: Công lý nào cho người vợ đang mang nỗi đau tột cùng?; Mổ nhầm chân: chuyên môn yếu kém hay tắc trách?

  • Thoi su 24h197 Dung sung bat tre em cuop taxi
    Thời sự 24h(19/7): Dùng súng bắt trẻ em, cướp taxi

    Phía sau bản án tử của Vũ Văn Tiến: Con dại một lần, mẹ đau một đời; Hà Nội sẽ trồng cây phượng hoa màu tím, nở quanh năm; Mưa xô ngã cầu bêtông tiền tỷ: Quy trình trách nhiệm; Vụ chất thải Formosa: Doanh nghiệp nói khác Sở TNMT?; Chiếu laser Nội Bài: Phát hiện thủ phạm nhưng khó xử lý

  • Thoi su 24h187 Lo duong day gai goi chan dong showbiz
    Thời sự 24h(18/7): Lộ đường dây gái gọi chấn động showbiz

    Thực phẩm bẩn: Nghịch cảnh con người đang âm thầm giết hại nhau; Vụ chất thải Formosa: Thêm nhiều mâu thuẫn giật mình; Ân hận của người mẹ mỗi đứa con sinh ra của... một ông bố khác nhau; Bác sĩ ra chợ quyên tiền cứu bệnh nhi: Đời xấu xa sao cây táo nở hoa?; Cá hồ chết bốc mùi thối, cả khu phố bịt khẩu trang suốt ngày

  • Thoi su 24h147 Bi ban than cua bo hiep dam den mang thai
    Thời sự 24h(14/7): Bị bạn thân của bố hiếp dâm đến mang thai

    Formosa tự đổi công nghệ luyện cốc: Hành vi tội ác; Uất ức lời kể 5 ngư dân bị tàu TQ đâm chìm tàu ở Hoàng Sa; Nghi án mẹ ép con gái uống thuốc trừ sâu để cùng chết; Bàng hoàng phát hiện suốt 3 năm nuôi nhầm con của 1 gia đình ở cách nhà mình 5 km; Tiếp viên ở quán karaoke ăn mặc mát mẻ, ngồi trên đùi khách rót bia

  • Thoi su 24h137 Chong thieu song vo vi bi can nhan
    Thời sự 24h(13/7): Chồng thiêu sống vợ vì bị cằn nhằn

    Thực hư chuyện 'bố đi hát karaoke gặp đúng con gái làm dịch vụ'; "Bảo kê" xe cấp cứu: Bộ trưởng Y tế vào cuộc quá chậm?; Vụ chôn rác thải Formosa trong trang trại của Giám đốc: Có sai luật?; Tạm giữ nhóm "quái xế" cùng 20 chân dài mặc mát mẻ phục vụ karaoke; 10 năm, gần 60 ngàn tỷ đồng tham nhũng nhưng chỉ thu hồi được 4,6 ngàn tỷ

  • Thoi su 24h127 Vo bop cua quy khien chong chet tuc tuoi
    Thời sự 24h(12/7): Vợ bóp của quý khiến chồng chết tức tưởi

    Phạt 100 triệu phòng khám "mạo danh" Sở Y tế HN "chặt chém" khách; Xe cứu thương ngoại tỉnh phải “mua” bệnh nhân ở Hà Nội?; Formosa lén lút chôn chất thải ở trang trại của Giám đốc Công ty Môi trường; Gây bức xúc lớn, các dự án giao thông BOT được Quốc hội đưa vào giám sát; Vụ gần 400 GV ở Thanh Hóa mất việc: 50-100 triệu đồng chạy làm GV hợp đồng?

  • Thoi su 24h117 Co gai tre xinh dep tu vong ben ve duong
    Thời sự 24h(11/7): Cô gái trẻ xinh đẹp tử vong bên vệ đường

    Sự cố môi trường Formosa: Xác định hàm lượng độc tố dưới đáy biển; Thuê giúp việc 6 triệu/tháng, chủ nhà phẫn nộ vì em bé bị véo tai, ăn tát; Nhà máy làm chết cá đầu nguồn sông Đà không có khu xử lý nước thải; Từ vụ chặn xe cấp cứu: Bảo vệ bệnh viện hay lực lượng..."bảo kê"?; Dọa đuổi ông lão xuống xe, nhân viên xe buýt bị đình chỉ việc

  • Nghin le chuyen tuan qua 1707 23072016
    Nghìn lẻ chuyện tuần qua 17/07 - 23/07/2016

    Đau chân trái bác sĩ mổ nhầm chân phải; CSGT giơ chân, người đi xe máy lao dải phân cách; Cán bộ giao thông trách mắng người dân vì tự ý vá đường; Bé gái 4 tuổi mất tích bất ngờ, gia đình kêu gọi giúp đỡ ... là những tin tức xã hội nổi bật được dư luận quan tâm trong tuần qua.

  • Su kien quoc te noi bat 177237
    Sự kiện quốc tế nổi bật (17/7-23/7)

    Khủng bố trung tâm mua sắm ở Munich làm 10 người thiệt mạng; Samsung xin lỗi vì những clip mua dâm của chủ tịch Lee; Trump chính thức nhận đề cử tổng thống; Trung Quốc ngang ngược tuyên bố tiếp tục cải tạo tại Biển Đông là những tin chính trong tuần qua.

  • Ban tin Suc khoe tuan qua 177 237
    Bản tin Sức khỏe tuần qua (17/7- 23/7)

    Bị thương chân trái, mổ nhầm chân phải: BV Việt Đức nói gì; Hai bé sơ sinh dính liền ở Hà Giang đã mất; Siêu âm thai bình thường, sinh con bị dị tật: Bài học nào cho bố mẹ; Vợ thờ ơ với 'chuyện ấy', lí do là ở chồng;... là những thông tin Sức khỏe được quan tâm nhất tuần qua.

  • Tong Hop Doi Song Tuan Qua 170724072016
    Tổng Hợp Đời Sống Tuần Qua (17/07-24/07/2016)

    Hàng loạt những sản phẩm kém chất lượng, ảnh hưởng nghiêm trọng đến sức khỏe người tiêu dùng được phát hiện . Bài toán chi tiêu gia đình, cùng những câu chuyện gia đình, vụ đánh ghen ầm ĩ làm ta giật mình trước lối sống ngày nay, là các thông tin nổi bật nhất tuần.

  • Toan canh kinh te tuan 1707 23072016
    Toàn cảnh kinh tế tuần (17/07 - 23/07/2016)

    'Đại án' 9000 tỷ đồng tại Ngân hàng Xây dựng, lương của các sếp tập đoàn gần nửa tỷ đồng, giá xăng điều chỉnh giảm mạnh, vấn nạn cà phể bẩn, tăng trưởng tín dụng tiếp tục có con số mới ... Cùng với những thông tin về tài chính- ngân hàng, bất động sản, thị trường tiêu dùng..là những tin tức - sự kiện kinh tế nổi bật tuầ

  • Nghin le chuyen tuan qua 1007 16072016
    Nghìn lẻ chuyện tuần qua 10/07 - 16/07/2016

    Formosa chôn 100 tấn chất thải tại Hà Tĩnh; Ngư dân bàng hoàng kể tàu TQ tông chìm tàu cá ở Hoàng Sa; Cô giáo Sài Gòn bị tố tán tỉnh nam sinh lớp 8; 3 năm nuôi nhầm con của 1 gia đình ở cách nhà mình 5 km ... là những tin tức xã hội nổi bật được dư luận quan tâm trong tuần qua.

  • Su kien quoc te noi bat 107167
    Sự kiện quốc tế nổi bật (10/7-16/7)

    Toà PCA ra phán quyết Trung Quốc không có chủ quyền lịch sử ở Biển Đông; Tân Thủ tướng Anh Theresa May công bố danh sách nội các mới; Khủng bố đẫm máu đúng Quốc khánh Pháp; Đảo chính thất bại ở Thổ Nhĩ Kỳ... là những tin chính trong tuần qua.

  • Ban tin Suc khoe tuan qua 107 167
    Bản tin Sức khỏe tuần qua (10/7- 16/7)

    Ổ bệnh bạch hầu đang bùng phát mạnh tại Bình Phước; Bác sĩ ra chợ xin từ thiện cứu 2 bé song sinh dính liền; Cảm động câu chuyện về sản phụ ung thư phổi quyết giữ thai nhi; Mách bạn bài thuốc điều trị sẩy thai từ hàng trăm năm trước;... là những thông tin Sức khỏe được quan tâm nhất tuần qua.

  • Toan canh kinh te tuan 1007 16072016
    Toàn cảnh kinh tế tuần (10/07- 16/07/2016)

    Lại nóng chuyện huy động 500 tấn vàng trong dâm, lãi suất tiêu dùng lên tới 70-80%/năm, EVN chiếm hơn 1/3 tổng số nợ mà Chính phủ phải bảo lãnh, nhiều ngân hàng báo lãi khủng trong quý II, kiểm tra xử phạt hàng loạt công ty đa cấp... Cùng với những thông tin về tài chính- ngân hàng, bất động sản, thị trường tiêu dùng..là nhữ