Slide


Mời Ba về ăn Tết với chúng con
  • kenny

  • kenny

Trang

Thứ Hai, 7 tháng 1, 2013

CHUYỂN CHỮ HOA - CHỮ THƯỜNG TRÊN BLOG


CHUYỂN CHỮ HOA - CHỮ THƯỜNG TRÊN BLOG
(Bài đưa từ blog Yahoo về)
Vào thăm blog của bạn SongvThu (đường link ở đây) thấy có bài thơ được trình bày bằng hai kiểu: phần đầu toàn chữ hoa, phần sau là chữ thường chỉ viết hoa chữ đầu dòng. Mới nghĩ đến chuyện tìm hiểu xem làm thế nào để biến cả một bài viết chữ hoa - chữ thường (hoặc ngược lại) nhanh mà không phải gõ (type) lại bài ấy lần nữa. Tìm hiểu mấy tuần mới thấy sơ sơ nguyên ủy kỹ thuật biến đổi nó, cũng xin mạnh dạn trình bày ra đây để các liền anh liền chị góp ý sửa chữa cho:

CÁC KIỂU PHÔNG (FONT) TIẾNG VIỆT

1) Font một byte: Đại diện phổ dụng của phông 1 byte là TCVN ABC. Tiêu chuẩn Việt Nam (TCVN 1, 2, 3) dùng mã kí tự 8 bit (1 byte)... Là loại font có các con chữ được thiết kế từ trước nên đẹp hơn font chữ 2 byte và font chữ tổ hợp, tuy nhiên do tiếng Việt có 146 ký tự Việt mà bảng mã 8 bit chỉ có 128 vị trí được phép dùng (còn 128 ký tự chuẩn không được phép xâm phạm) không đủ cho 146 ký tự Việt, do đó buộc phải xâm phạm các ký tự điều khiển hoặc chỉ thể hiện chữ Việt thường (không viết hoa) tức là mỗi bộ font chỉ dùng 1 nửa (73) ký tự được phép dùng, còn chữ Hoa sẽ được thể hiện bằng font khác (thường có đuôi là H hoặc U, ví dụ .VnTime là phông chữ thường, .VnTimeH là phông chữ hoa) như vậy chữ hoa và chữ thường có mã giống nhau, chỉ khác nhau về tên Font. TCVN 1, 2, 3 trong giai đoạn đầu phát triển máy tính ở Việt Nam đã góp phần tích cực truyền bá và giải quyết khó khăn về Gõ Tiếng Việt cho nhiều người, nhiều vùng, nhiều cơ quan, nhưng đến nay do nhu cầu phát triển của công nghệ thông tin và tiến bộ về kĩ thuật máy tính, tiêu chuẩn này trở thành ít phổ dụng. TCVN 1, 2, 3 (ABC) do không được Microsoft hỗ trợ, có những nhược điểm chính sau đây:
       a)  Chữ hoa và chữ thường không chuyển đổi qua lại được bằng các lệnh Change Case của Word do khoảng cách về mã của chữ hoa và chữ thường của một con chữ không phải là 32; Cũng vì lí do đó, không thể nhấn phím Shift hoặc Tab để gõ một chữ Việt viết hoa có dấu thanh. Người ta cứ viết thường,viết xong thì bôi đen chuyển sang font H. (Sau này Vietkey đã dùng một macro để chuyển đổi).
        b)   Không thể hiện được chữ Việt trong các ô ghi của hộp thoại trong các phần mềm thông dụng, trong diễn đạt tên tệp, trên blog như Yahoo Plus. Y!… vì vậy rất khó khăn trong sử dụng chính xác và thuận tiện các công cụ tiên tiến của Word và các trang mạng. Việc dùng các kí tự điều khiển cho chữ Việt đã khiến một số chữ (như chữ ơ; chữ ả) bị biến mất trong các hộp ghi của Word…)
     Việc giao lưu giữa người dùng với các kiểu phông chữ khác rất khó khăn.
     Các chương trình tiếng Việt khác cũng dùng font (phông) 1 byte là : VietKey, TCVN3 5712, VISCII, VIETWARE_F...

 2) Font chữ Việt 2 Byte: Các chương trình tiếng Việt sử dụng phông mã 2 Byte là: VNI-WIN, BK tp HCM2, VIETWARE_X... Phong chữ 2 Byte như VNI-WIN cũng có tác dụng tốt khi phông ABC và Unikey không thực hiện được (ví dụ ở Proshow gold và một số chương trình tạo hình và hình động).
Nhược điểm của font 2 byte là: font chữ có dấu không được thật đẹp, do các dấu được ghép vào chữ một cách tự động trong lúc gõ nên không thể đẹp và hợp lý bằng con chữ có chữ và dấu được thiết kế từ trước (lúc tạo font).
       Font 2 Byte không thể thực hiện được với font Bitmap (là các font hệ thống như MS Sans Serif hay dùng) hoặc font có độ rộng cố định (Fixed font). Khi xử lý (tạo các effect) các đoạn Text mã 2 byte bằng cách co, kéo chữ hoặc giãn cách tự động thì dấu và chữ thường bị tách rời nhau (vì chúng không là 1 thể thống nhất). Trong một số chương trình qui định rõ tổng số tối đa ký tự của các trường Text, dữ liệu mã 2 byte có thể vượt quá độ dài cho phép do có thêm các ký tự dấu.
  3) Phông mã tổng hợp: Tương tự như Font 2 byte, các chữ Việt là tổ hợp ghép lại giữa chữ cái tiếng Anh và dấu tiếng Việt, quá trình này được thực hiện ngay lúc gõ và được thực hiện bởi các trình quản lý font riêng biệt. Mã tổ hợp cần rất ít mã mở rộng, do chỉ dùng 1 mã cho các dấu (huyền, sắc, hỏi, ngã, nặng) cho tất cả chữ thường, chữ hoa, chữ có dấu mũ, dấu trăng; khác với Font 2 Byte thông thường riêng từng dấu (huyền, sắc, hỏi, ngã, nặng) có nhiều mã cho các chữ khác nhau. Mã tổ hợp giải quyết một cách trọn vẹn bài toán tìm kiếm và đánh chỉ số (Index) tiếng Việt, tuy nhiên kỹ thuật tổ hợp Font tương đối phức tạp nên hiện chưa có trong các hệ điều hành khác. Các chương trình tiếng Việt sử dụng phông mã tổng hợp là: Microsoft CP 1258, IBM CP 01129.
 4) Unicode: Unicode là bảng mã chuẩn quốc tế, bảng mã duy nhất vốn được thiết kế để dùng cho tất cả các ngôn ngữ khác nhau trên thế giới. Về nguyên tắc, Unicode cũng dùng 2 byte, nhưng khác với các bảng mã 2 byte của Việt Nam là Unicode là chuẩn quốc tế nên đã và sẽ được hỗ trợ trong các hệ điều hành và các chương trình ứng dụng. (Unicode đã được hỗ trợ ngay từ trong nhân của hệ điều hành Windows hiện đại và các trình duyệt Web tiên tiến). Unicode tỏ ra là giải pháp trọn vẹn cho vấn đề bảng mã tiếng Việt. Đặc biệt đối với các ứng dụng Internet việc sử dụng tiếng Việt Unicode ngày càng có ưu thế hơn so với các bảng mã tiếng Việt khác. Sau khi Unicode được sử dụng rộng rãi, chuẩn tiếng Việt được quy về một mối. Mặc dù UniKey vẫn hỗ trợ các bảng mã cũ nhưng nên sử dụng unicode trong mọi trường hợp, chỉ nên dùng các bảng mã khác khi không thể dùng unicode.
Các phím tắt dùng trong UniKey
CTRL+SHIFT+F1: Chọn bảng mã Unicode
CTRL+SHIFT+F2: Chọn bảng mã TCVN3 (ABC)
CTRL+SHIFT+F3: Chọn bảng mã VNI-Windows;
CTRL+SHIFT+F4: Chọn bảng mã VIQR.
CTRL+SHIFT+F5: Mởhộp điều khiển chính của UniKey.
CTRL+SHIFT+F6: Mở hộp công cụ của UniKey (Unikey Toolkit).
CTRL+SHIFT+F9: Thực hiện chuyển mã dùng clipboard với các lựa chọn đã đặt trong hộp công cụ.
  (Lưu ý: Khi chọn chế độ sử dụng Clipboard, Unicode dùng ở Word sẽ bị khoảng trống trước các nguyên âm có dấu, Vd: d_ấu (kí hiệu ­_ thể hiện một khoảng trống). Khi dùng UniKey từ phiên bản 3.55 trở đi, tuyệt đối không mở chế độ Thường xuyên sử dụng Clipboard).
   a) Unicode có ưu điểm là viết chữ Việt hoa chỉ cần nhấn Shift hoặc nhấn Tab, chữ có dấu thanh hay không đều biến được thành chữ hoa; nó được các hệ điều hành Windown hỗ trợ nên đánh tiếng Việt vào các cửa sổ con của Win, word đều được (ví dụ đánh tên file, đánh các từ khi tìm kiếm trên web và trong Word).
b) Khuyết điểm của Unicode là chữ hoa (chữ thường) đã đánh xong không thể chuyển thành chữ thường (chữ hoa) toàn vẹn khi dùng lệnh Change Case như đánh tiếng Anh. Các chữ viết hoa đầu dòng, chữ tên riêng đều bị biến đổi hết, sau đó ta phải tìm và sửa lại. Một số từ có nguyên âm kèm dấu thanh điệu sẽ không chịu biến đổi ví dụ: NGUYÊN ÂM CÓ DẤU THANH ĐIỆU thì có thể ấ và  không chuyển thành chữ hoa được.
Đây là vấn đề NoiLieu muốn bàn đến trong bài này.

CÁC CÁCH BIẾN ĐỔI CHỮ HOA - CHỮ THƯỜNG TRÊN BLOG
1. Cách biến đổi đơn giản nhất là gõ lại bài thơ bằng chữ thường (Phím Tab để ở vị trí tắt - off) nhưng gõ lại cả bài thì ngán quá. Cách đơn giản hơn nữa là đừng nhầm Tab để đến nỗi phải biến đổi phức tạp. (Thực hiện vô vi như Trang tử vậy)
2. Dùng Macro biến đổi chữ hoa - chữ thường của Vietkey để biến cả bài (chọn cả bài) thành chữ hoa hay chữ thường tương ứng.
Để thực hiện được việc này máy tính phải cài đặt chương trình tiếng Việt đầy đủ (VietKey có đủ các nội dung để cài đặt trong Microsoft Office (Word, Excel ...).
        Khi chương trình cài đặt VietKey làm việc đúng, trên thanh menu của Word có phím Vietkey (thường nằm sau phím windown). Khi nhấn vào phím này sẽ có một menu lệnh thả xuống, chọn lệnh Đổi chữ hoa - chữ thường để biến đổi theo ý muốn.
         (Cần lưu ý là khi dùng chức năng này, Vietkey sẽ biến cả bài thành chữ hoa hoặc thường, mặc cho bạn chỉ chọn một đoạn biến đổi thôi. Để tránh điều đáng tiếc sảy ra thì copy đoạn cần biến ra một file khác, biến xong đưa về văn bản gốc).
3. Biến đổi bằng cách convert (dùng tính năng của Unikey): Ở YahooPlus và Yahoo! phải dùng Word (được Unikey hỗ trợ tính năng chuyển đổi) làm công cụ trung gian. Với Blogger_Blogspot thao tác ở word là không cần thiết.

     a. Đưa bài (Text) vào cửa sổ viết bài mới (nhấn vào cái bút sửa trên trang blog) copy đoạn text có chữ hoa cần sửa, mở cửa sổ word để chuẩn bị dán kết quả biến đổi vào đấy, đưa con trỏ nằm lên biểu tượng Unikey có trên thanh tác vụ (Task Bar) nhấn chuột phải để mở menu bay của chương trình này, nhấn vào dòng lệnh “Công cụ” để mở hộp công cụ.

     b. Khi hộp (bảng) công cụ hiện ra, Ở “Bảng mã”, đặt mã của file nguồn và file đích đều là Unicode, đặt “Lựa chọn” ở chế độ “Sang chữ thường”, nhấn phím “Chuyển mã” nằm ở góc trái dưới cùng của hộp công cụ, chờ cho bảng thông báo “chuyển mã thành công” xuất hiện thì dán lại đoạn đã copy vào Word (Thanh tiêu đề của blog Y! và toàn trang Blogger cho phép dán thẳng vào bài, không dùng đến Word). Đoạn này đã được đổi toàn bộ sang chữ thường.

      c. Với bài viết trên trang viết bài của Y! cần copy kết quả đã chuyển đổi ở word đưa về dán vào cửa sổ viết bài ở blog. Cái mới sẽ dán đè lên cái cũ đang được bôi đen từ trước. Làm xong nhấn nút “Đăng” để trở về trang blog bình thường.
4. Có thể chương trình hoặc máy của cụ nào đó không hiện đại lắm, làm theo cách ở mục 3. không được thì làm theo cách sau (có dùng lệnh Change Case của Winword):

      a. Mở bài cần biến đổi, nhấn vào cái bút sửa bài có ở góc phải trên cùng của trang.
     b. Chọn toàn bài, copy, chuyển bài viết sang dán vào một trang trắng của word. 
     c. Chọn toàn bài trên trang word này (nhấn Ctrl + A). Mở lệnh Change Case trong menu Format của Word. Khi bảng lệnh Change Case hiện ra, chọn lệnh Sentence case hoặc lower case rồi nhấn OK. Toàn bộ phụ âm và các nguyên âm trên (dưới) nó không mang dấu thanh điệu của bài viết sẽ chuyển sang chữ thường. Riêng các chữ là nguyên âm có dấu thanh điệu trên (dưới) nó thì vẫn to (chữ hoa) như cũ. Cắt toàn bộ bài này (chọn toàn bài, nhấn Ctrl + X).
      d. Nhấn CTRL+SHIFT+F6: Mở hộp công cụ của UniKey (Unikey Toolkit). Chọn file nguồn là Unicode, file đích là TCVN 3 rồi đóng bảng này lại.
      e. Nhấn CTRL+SHIFT+F9: Thực hiện chuyển mã dùng clipboard với các lựa chọn đã đặt trong hộp công cụ ở bước d. nêu trên. Chờ cho bảng thông báo chuyển mã đã hoàn thành thì nhấn CTRL+SHIFT+F6: để đảo mã cho hộp công cụ: file nguồn là TCVN3, file đích lại là Unicode). Đóng bảng (hộp) công cụ lại, nhấn CTRL+SHIFT+F9 để chuyển bài đang có trong clipboad thành font Unicode. Chờ cho đến khi có bảng thông báo đã chuyển mã thành công thì về lại blog.
      g. Dán kết quả vừa biến đổi (convert) từ TCVN3 sang Unicode đang chứa trong Clipboad vào ô viết bài của trang blog của ta, thế là bài đã chuyển được từ chữ hoa sang toàn bộ chữ thường mà không phải đánh lại toàn bài.
Đọc hướng dẫn này thấy sao mà lắm bước thế, có thể có cụ chửi thầm cái thằng NL này viết nhí nhố nhưng nếu gặp hoàn cảnh bắt buộc phải chuyển chữ hoa chữ thương, làm quen thì rất nhanh và đơn giản nhiều.
Cụ nào không thích nhớ Short Cut Key (phím nóng) thì nhấn chuột phải vào biểu tượng Unikey trên thanh tác vụ và lưu ý đến dòng chữ lệnh trên menu bay tôi đã đánh dấu chữ V đỏ:
Công cụ … [CS+F6) phím nóng là Ctrl+Shift+F6;
Chuyển mã nhanh [CS+F9] phím nóng là Ctrl+Shift+F9 ...).
       
CÁC CÁCH BIẾN ĐỔI CHỮ THƯỜNG sang CHỮ HOA TRÊN BLOG
1. 2. Cách biến đổi cũng tương tự như chuyển chữ hoa sang chữ thường.
3. Dùng trình word hỗ trợ :
      a. Đưa bài (text) vào cửa sổ viết bài mới (nhấn vào cái bút sửa trên trang blog) copy toàn bài có chữ thường cần sửa, mở cửa sổ word để chuẩn bị dán kết quả biến đổi vào đấy (Với Blogger_Blogspot thao tác ở word là không cần thiết), đưa con trỏ nằm lên biểu tượng Unikey có trên thanh tác vụ (Task Bar) nhấn chuột phải để mở menu bay của chương trình này, nhấn vào dòng lệnh “Công cụ” để mở hộp công cụ.
     b. Khi hộp (bảng) công cụ hiện ra, Ở “Bảng mã”, đặt mã của file nguồn và file đích đều là Unicode, đặt “Lựa chọn” ở chế độ “Sang chữ hoa”, nhấn phím “Chuyển mã” nằm ở góc trái dưới cùng của hộp công cụ, chờ cho bảng thông báo “chuyển mã thành công” xuất hiện thì dán lại đoạn đã copy vào Word (Với Blogger_Blogspot thao tác ở word là không cần thiết, sau khi biến đổi dán ngay vào chỗ vừa copy ở trang viết bài). Đoạn này đã được đổi toàn bộ sang chữ hoa.
     c. Copy kết quả đã chuyển đổi ở word đưa về dán vào cửa sổ viết bài ở blog. Cái mới sẽ dán đè lên cái cũ đang được bôi đen từ trước. Làm xong nhấn nút “Đăng” để trở về trang blog bình thường.
Chúc các cụ thành công.
Lưu ý: 1. Mã tạo một Texbox ở bên trái (Phải) của trang để dán ảnh còn phần kia của trang thì đánh chữ bình thường:
<div style="width: 277px; height: 116px; float: left;"><table style="border: 1px solid #eaeaea;" border="0" cellSpacing="1" cellPadding="0" bgColor="#bfbfbf" align="left"><tbody><tr><td bgColor="#ffffff" align="center">
Texbox này có thể dán ảnh hoặc trang trí các chữ động... mà không ảnh hưởng đến phần chữ nằm ở phần bên kia của trang

SỰ TƯƠNG THÍCH CÁC PHẦN MỀM MÁY TÍNH VỚI CÁC HỆ FONT (CÁC CHƯƠNG TRÌNH GÕ TIẾNG VIỆT):  

        1) Unicode : Thích hợp với các chương trình chính thống windows và các phần mềm của Microsoft. Một số phần mềm của MS Office như PowerPoint có cài đặt ban đầu hạn chế số font sử dụng cho nên dù hỗ trợ Unicode nhưng nhiều Font Unicode sẽ không hiện được lên nếu nằm ngoài số font đã được quy định.
            Các chương trình tạo tệp tin nghe nhìn được Microsoft hỗ trợ như Format Factory, Picture Story (3) ... cũng sử dụng tốt font mã Unikey.
           Các trang mạng (blog Y! chẳng hạn) đều sử dụng font chữ Unicode với số lượng font hạn chế (6-8 loại font Unicode tiếng Việt).   
            Hiện nay đã có đầy đủ các font đẹp tiếng Việt dùng cho Unicode như các loại font ABC tiếng Việt trước đây. 
      2) VNI-WIN thích hợp cho chương trình nghe nhìn không có nguồn gốc từ Microsoft hoặc không được Microsoft hỗ trợ như Photoshop (7,8), CS2,3-5 và các trình bổ trợ của nó; Các phần mềm làm fim ảnh như Proshow Gold, các phần mềm xử lí ảnh flash như SWF Sothink Easy, SWF Sothink Quicker...
       3) Mã BK TPHCM (1,2) có nhiều font chữ đẹp nhưng không thích nghi với một số chương trình xử lí văn bản phi Microsoft như PDF Creator, Free iSpring... (nói chung là các trình xử lý của Adobe).
        Ghi lại vài điều như vậy để nhớ thực hiện mà thôi. Ai thực hiện không đương hoặc phát hiện có gì sai sót xin phản ánh ở comment này! 

Không có nhận xét nào:

Đăng nhận xét