vietbao

Dùng chữ tiếng Việt bằng Unicode trong Windows

Bấm ngay Subscribe / Đăng Ký xem video hay mới nhất >>

Dung chu tieng Viet bang Unicode trong WindowsViệc chuyển đổi từ sử dụng các bảng mã riêng biệt sang dùng bảng mã chuẩn quốc tế để soạn thảo và thể hiện Việt ngữ đang gây ra không ít bối rối cho người dùng. Dưới đây là thông tin cơ bản về font chữ và cách xử lý tiếng Việt bằng font Unicode trong hệ điều hành Windows.

1. Bảng mã và font chữ

Bảng mã, Font và Unicode

Về mặt cơ bản, máy tính làm việc với con số. Bản thân mỗi chữ cái (mỗi ký tự) cũng được gắn cho một con số nào đó để máy tính có thể hiểu. Hệ thống các con số dùng để thể hiện tất cả các chữ cái và ký hiệu của một (hay nhiều) ngôn ngữ gọi là bảng mã.

Bảng mã chuẩn đầu tiên cho máy tính có tên là ASCII (American Standard Code for Information Interchange). ASCII chuẩn 7-bit cho phép hiển thị 128 ký tự (bao gồm chữ cái, số và các ký tự đặc biệt khác như “?”, “.”, “*” v.v.). Mỗi ký tự trong ASCII sử dụng một byte và khi tập hợp lại, ASCII cho phép hiển thị thêm 128 ký tự khác nữa (tổng cộng là 256 ký tự). Phần tập hợp này gọi là ASCII mở rộng (Extended ACSII) hay ASCII 8-bit.

Một tập hợp các chữ cái và ký hiệu thể hiện tất cả các ký tự trong một bảng mã với cùng một kiểu hiển thị được gọi là font. Nói cách khác, font là hình thức mà một bảng mã được thể hiện trên màn hình máy tính hoặc trên trang giấy khi in ra. Bất cứ điều gì thuộc về ký hiệu ngôn ngữ được thể hiện trên máy tính đều phải theo một font nào đó, thuộc một bảng mã nào đó. Thường font bao giờ cũng có khả năng thể hiện dưới 4 dạng khác nhau: bình thường, đậm, nghiêng và in hoa.

Unicode là một bảng mã mới (có thể gọi là dạng mở rộng (rất rộng) của bảng mã ASCII), sử dụng 2 byte cho mỗi ký tự và có khả năng thể hiện 65.536 ký tự khác nhau, cho phép biểu đạt mọi ký tự của tất cả các ngôn ngữ trên thế giới. Nói cách khác, với Unicode, mỗi ký tự của tất cả các ngôn ngữ trên thế giới sẽ có một con số riêng cho mình trong bảng mã. Các font chữ theo chuẩn Unicode được gọi là font Unicode.

Font tiếng Việt kiểu cũ

Có thể dễ dàng thấy ngay điểm yếu của ASCII, đó là chỉ hỗ trợ tốt bảng chữ cái của tiếng Anh. Để thể hiện nhiều thứ tiếng khác, lập trình viên phải tạo ra các bảng mã khác dựa trên ASCII 8-bit. Một số bảng mã tiêu biểu kiểu này đối với tiếng Việt là TVCN3 (ABC 2.1), VNI, BK HCM...

Các bảng mã trên giải quyết được vấn đề thể hiện các ký tự đặc biệt trong tiếng Việt (dấu, dấu móc và dấu mũ), tuy nhiên có cùng một nhược điểm rất lớn là không tương thích lẫn nhau và với các font có sẵn của các hệ điều hành. Cụ thể, một văn bản được soạn thảo bằng font .Vntime (của bảng mã TVCN3) trên máy tính A sẽ không được thể hiện một cách chính xác trên máy tính B, nếu máy tính B không có font .Vntime (hoặc tương tự) được cài đặt. Nhiều trường hợp ngay cả khi font này đã được cài đặt, việc thể hiện font vẫn không chính xác (như lỗi chữ “ư” phổ biến). Sở dĩ có sự không tương thích lẫn nhau giữa các bảng mã tồn tại là vì những người sáng lập ra các bảng mã đó không có sự đồng nhất trong việc sắp đặt chữ cái nào sẽ được con số nào thể hiện trong từng bảng mã.

Sự không tương thích trên khiến việc trao đổi thông tin (đặc biệt là giữa các miền và giữa trong và ngoài nước) gặp rất nhiều khó khăn, nhất là đối với những người không có chuyên môn về máy tính.

Cách giải quyết duy nhất là tất cả cùng sử dụng chung một bảng mã. Và việc sử dụng Unicode - bảng mã chuẩn quốc tế - để thể hiện tiếng Việt có thể nói là hợp lý và “hợp thời” nhất.

2. Gõ tiếng Việt với Unicode

Với font tiếng Việt kiểu cũ, để gõ được tiếng Việt cần có hai điều kiện: Font chữ và bộ gõ dành cho font chữ đó. Với font Unicode, thì chỉ còn cần bộ gõ thôi. Tuy nhiên, không phải phiên bản nào của hệ điều hành Windows cũng có sẵn font Unicode.

Các hệ điều hành Windows 2000 và Windows XP hỗ trợ rất tốt Unicode (hầu hết các font có sẵn trong hệ thống đều theo chuẩn Unicode). Với các hệ điều hành còn lại (Windows 98/95/NT) thì người dùng có thể tải font Unicode về rồi cài vào máy. Tuy nhiên, nếu có thể thì tốt nhất là nên sử dụng Windows 2000 hoặc Windows XP.

Về bộ gõ, hiện thời phổ biến nhất là Vietkey Unikey . Tuy nhiên, Unikey tốt hơn bởi một số lý do chính sau:

- Unikey miễn phí và mã nguồn mở. Người dùng có thể tải mã nguồn về và sửa chữa. Vietkey là chương trình thương mại và người dùng phải mua để sử dụng.

- Unikey có kèm phần mềm chuyển mã và cho phép chuyển đổi rất nhiều mã khác nhau

- Unikey (phiên bản 3.5) có tùy chọn để không sử dụng “clipboard” của Windows khi gõ tiếng Việt bằng font Unicode. Điều này tránh được lỗi cách chữ hoặc mất chữ mà Vietkey hay mắc phải.

Ngoài Unicode ra, cả Vietkey và Unikey đều hỗ trợ các bảng mã cũ khác. Tương tự như Vietkey, Unikey không yêu cầu “cài đặt”. Để sử dụng chỉ cần tải phần mềm này về và chạy file có tên UnikeyNT.exe. Hướng dẫn có thể được tìm thấy tại trang web của tác giả Phạm Kim Long.

Lưu ý:

- Khi gõ tiếng Việt sử dụng bộ mã Unicode, cần đảm bảo font chữ đang dùng phải là thuộc bảng mã Unicode. Tốt nhất là nên sử dụng các font “Arial” hoặc “Times New Roman”.

- Không sử dụng các bộ gõ cũ (dành cho các hệ điều hành 16-bit như DOS hay Windows 3x) cho các hệ điều hành 32-bit (Windows 9x/NT/2K/XP). Các bộ gõ cũ (ví dụ: ABC 2.1) khi cài đặt thường thay đổi font hệ thống của hệ điều hành (thường là Unicode) thành font hệ thống kiểu cũ (ASCII) và khiến hệ điều hành không hỗ trợ được Unicode nữa.

3. Đọc tiếng Việt trên mạng với Unicode

Để đọc tiếng Việt (được soạn thảo bằng font Unicode) trên mạng Internet cần có 2 điều kiện:

- Hệ điều hành hỗ trợ Unicode (xem phần trên).

- Trình duyệt (browser) hỗ trợ Unicode: Các trình duyệt phổ biến như Internet Explorer 5.x (hoặc mới hơn), Netscape 4.7 (hoặc mới hơn) hỗ trợ rất tốt Unicode. Trái lại, trình duyệt Opera hỗ trợ Unicode rất kém.

Nếu có cả hai điều kiện trên mà vẫn không đọc được thì cần chuyển trạng thái hiển thị hiện thời sang Unicode. Đối với Internet Explorer, cách làm như sau: Chọn menu “View” -> Encoding… -> More (nếu cần) -> Unicode (UTF-8).

Lưu ý: Ngày càng nhiều trang web thể hiện tiếng Việt bằng font Unicode, tuy nhiên vẫn có một số sử dụng font kiểu cũ. Trong trường hợp đó, cần cài thêm font kiểu cũ vào máy thì mới có thể xem được. Tuy nhiên, nếu trang web này bị lỗi (ví dụ: mất chữ “ư” ), thì cũng không nên sử dụng các phần mềm để sửa lỗi này. Sử dụng các phần mềm như vậy sẽ làm hỏng sự ổn định của hệ thống.

Để đọc được Unicode thông qua e-mail còn cần thêm một điều kiện nữa là chương trình e-mail (e-mail client) phải hỗ trợ Unicode. Ngoài ra, khi gửi thư, cần gửi dưới dạng Unicode. Nếu sử dụng Outlook Express, trình này sẽ hỏi về dạng font của thư trước khi gửi đi (chọn “Send as Unicode”).

Hiện thời, trong số các trình hội thoại trực tuyến (chat client) phổ biến thì chỉ có Windows Messenger (còn được gọi là MSN messenger) là hỗ trợ Unicode.

4. In tiếng Việt với Unicode

Hầu hết các máy in mới đều có thể in văn bản được soạn thảo bằng Unicode. Với những trường hợp không in được tiếng Việt bằng font Unicode thì nguyên nhân chủ yếu là do các máy này không “hiểu” font Unicode và tự động thay thế bằng một font khác có sẵn trong máy in.

Cách khắc phục khác nhau tùy theo từng máy in cụ thể, nhưng cũng có một số điểm chung. Trước hết cần làm như sau: Start -> Settings - Printers - > Bấm chuột phải vào biểu tượng của máy in -> chọn Properties. Tiếp theo, tại của sổ của Properties, di chuyển giữa các tab (thẻ) và thay đổi các thông số theo một hoặc tổng hợp những cách sau (nếu có):

- Chuyển giá trị của "Spooling data format" sang "RAW".

- Chọn và sử dụng chức năng "Always use True type Fonts".

- Chọn để máy in “Download font” từ máy tính trước khi in.

- Chọn để máy in không thay thế (Substitute) font trước khi in.

- Chọn chức năng “Print Text as graphics”.

Ngoài ra, tải về trình điều khiển (driver) mới nhất và cài lại cho máy in cũng sẽ giúp máy in hoạt động tốt với Unicode trong hầu hết các trường hợp.

Đông Ngô

Việt Báo
Điều hòa tự chế từ vỏ chai nhựa, giảm nhiệt tới 5 độ C
Comment :Dùng chữ tiếng Việt bằng Unicode trong Windows
Ý kiến bạn đọc
Viết phản hồi
Bạn có thể gửi nhận xét, góp ý hay liên hệ về bài viết Dùng chữ tiếng Việt bằng Unicode trong Windows bằng cách gửi thư điện tử tới Lien He Bao Viet Nam. Xin bao gồm tên bài viết Dung chu tieng Viet bang Unicode trong Windows ở dạng tiếng Việt không dấu. Hoặc Dùng chữ tiếng Việt bằng Unicode trong Windows ở dạng có dấu. Bài viết trong chuyên đề của chuyên mục Công Nghệ
Using the letters in Vietnamese by Unicode in Windows
operating system, called, on the computer is incompatible, Vietnamese, use, performance, character, support, may, fonts, unicode , code, tables, WINDOWS
The transition from the use of separate encoding encoding to use international standards to develop and demonstrate the Vietnamese language is causing confusion for many users. Here is basic information about fonts and font handling Vietnamese with Unicode ...
Dùng công nghệ cũ, các hãng hàng không sẽ còn gặp nhiều sự cố

Theo các chuyên gia hàng không, các hãng hàng không có thể còn gặp nhiều sự cố tương tự hãng Delta mới đây bởi không đầu tư đủ để cải tổ hệ thống đặt chỗ vốn đang sử dụng các công nghệ từ những năm 1960.

Top 9 ứng dụng Android chỉnh sửa ảnh tốt nhất
Top 9 ứng dụng Android chỉnh sửa ảnh tốt nhất

Càng ngày smartphone càng được cải tiến để thay thế máy ảnh. Các nhà phát triển cũng tận dụng cơ hội để cung cấp các ứng dụng chỉnh sửa ảnh trực quan và hiệu quả. Sau đây là 9 lựa chọn tốt nhất dành cho bạn… (ứng dụng, Android, chỉnh sửa ảnh)

  • Thoi su 24h298 Cau be 11 tuoi tu tu vi ko co quan ao moi
    Thời sự 24h(29/8): Cậu bé 11 tuổi tự tử vì ko có quần áo mới

    Có một đứa trẻ 11 tuổi vừa tự tử, thưa ông Giời; Kỳ lạ thùng niêm phong tôm tiêm tạp chất, trở thành "sạch" sau 1 đêm; Bàng hoàng thanh niên tay cầm điện thoại, chết ngồi bên đường; Bệnh nhân nhiễm HIV giật kéo đe dọa bác sĩ; Quảng Nam: Loa phát thanh xã nhiễu sóng tiếng Trung Quốc

  • Thoi su 24h258 Hanh ha con roi chup hinh gui cho vo
    Thời sự 24h(25/8): Hành hạ con rồi chụp hình gửi cho vợ

    Đi tìm lời giải cho cây chuối lạ cao 15 cm ra 6 bắp ở Huế; Những vụ tự sát thương mình và người thân để trục lợi bảo hiểm nổi tiếng; Quan Formosa xin rút kinh nghiệm, người Việt hào phóng bao dung; Hà Nội: Một tuần xử lý gần 200 ‘ma men’, người vi phạm bất ngờ; Xử phạt nồng độ cồn, nhân viên quán bia "mật báo" cho khách

  • Thoi su 24h248 Chat xac nguoi tinh bo bao tai o Sai Gon
    Thời sự 24h(24/8): Chặt xác người tình bỏ bao tải ở Sài Gòn

    Cứu một cụ bà trong đám cháy, thiếu úy CSGT nhập viện cùng nạn nhân; Cắt điện, nước của quán cà phê Xin Chào là sai quy định; Nhiều phi công xác nhận bị chiếu đèn laser khi hạ cánh xuống Tân Sơn Nhất; Sập hầm vàng ở Lào Cai: công bố danh tính 7 công nhân bị chết; Ẩn tình vụ vợ U60 thuê người đánh sảy thai cô giúp việc 19 tuổi

  • Nhung thong tin dang doc nhat trong tuan tu 2182782016
    Những thông tin đáng đọc nhất trong tuần (từ 21/8-27/8/2016)

    Vụ rơi máy bay quân sự làm một học viên phi công tử vong, tự thuê người chặt chân, tay mình để trục lợi bảo hiểm, đau đáu lòng ngư dân miền Trung câu hỏi bao giờ cá biển ăn được, hay vụ sập mỏ vàng ở Lào Cai đoạt mạng 7 người,... là những tin nóng được quan tâm nhất tuần qua.

  • Toan canh kinh te tuan 2108 27082016
    Toàn cảnh kinh tế tuần (21/08 - 27/08/2016)

    Tiền ở một loạt các ngân hàng lại "bốc hơi", vấn nạn thực phẩm bẩn bủa vây người Việt, áp lực thu ngân sách khiến giá xăng dầu tăng, những băn khoăn về việc mua điện từ Lào, CPI tháng 8 tăng 0,1% so tháng trướ ... Cùng với những thông tin về tài chính- ngân hàng, bất động sản, thị trường tiêu dùng..là những tin tức - sự kiện kinh tế nổi bật tuầ

  • Tong hop tin An ninh phap luat tuan 142082016
    Tổng hợp tin An ninh - pháp luật tuần (14-20/8/2016)

    Như một gáo nước lạnh tạt vào mặt khi dư luận còn đang bàng hoàng trước thảm án Lào Cai. Trọng án Yên Bái, 3 nạn nhân là những người đứng đầu cơ quan lãnh đạo tỉnh. Thảm án Hà Giang, mẹ giết 3 con ruột vì mâu thuẫn với chồng. Giết mẹ vợ và em vợ ở Thái Bình.Những vụ án như một chuỗi sự kiện tiếp diễn xảy ra trong một thời gian ngắn. Có thể nói tuần này là t