GBBIG5トランスコーディングの原則の完全な分析



Full Analysis Gb Big5 Transcoding Principle



GB BIG5 トランスコーディングの原則の完全な分析

元のソース:leilycn.blog.163.comの有効期限が切れています。ここで再公開してください



香港と台湾のWindowsで使用されている言語コードはBig5エンコーディングであり、中国本土のWindowsはGB(GB)であるため、これらのプログラムテキスト言語がUnicodeエンコーディングに従って設計されていない場合、Windowsで文字化けの問題が発生しますGBになりますが、オペレーティングシステム内に自動的に認識される言語ソリューションの複数のセットが含まれているため、ここでは説明しません。

ここでは、BIG5コードとGBコードの違い、エンコード規則、漢字ライブラリなどについては説明しません。主に、ほとんどの中国人が使用しているGB簡体字中国語オペレーティングシステム、BIG5文字化けの理由、内部コード変換ソフトウェアのトランスコーディングの原則、ゲームプログラムのコンテキストでのテキストの正しい表示などについて説明します。注:この記事簡体字中国語の未亡人システム用です!



1.最初に次の例を見てみましょう。

BIG5 Windowsオペレーティングシステムでのテキスト表示:

例:「translation」ですが、GBコーディングを選択すると、「Lumu」になります。



注:Microsoft簡体字中国語環境で表示されますBIG5、言語システムを「中国の台湾」に設定することもできます直接することもできますIE対応するコードに設定されたアナログディスプレイでは、対応するシステムのディスプレイを見ることができます。実際、GBシステムは自動的に「簡体字中国語」として選択され、BIG5システムは自動的に「繁体字中国語」として選択されます。

上記の例は、コンピュータがどのように変換され、文字が文字化けするのかを正確に理解するのが難しい場合があります。ここにマシンコードの問題があります。単語の機械語は、上図の対応する関係に従って、GBシステムとBIG5システムでそれぞれ変更されていません。

異なるシステムで変換する場合、文字の16進コードは変更されません。つまり、コンピューターによって処理される内部コードは変更されません。変換中に文字が変更されたり、文字化けしたりする理由は、BIG5システムとGB5システムのエンコード規則が異なるためです。簡単に言えば、「出力文字ルールテーブルに対応する内部コード」が提供されている場合、2セットのエンコーディングルールテーブルは異なります。たとえば、BIG5システムでは、「CC4B」の対応する文字は「」ですが、GB5システムでは、対応する文字は「Su」であり、GBシステムでは「C8D8」、対応する文字は「Rong」ですが、 BIG5システムには対応する文字がありません。そのため、疑問符が表示されます。

次に、ワードプロセッシングソフトウェアやゲームプログラムなどの他のゲームの変換機能について説明します。

まず、プラットフォームとしてBIG5中国語オペレーティングシステムを使用する状況を理解し、ワードプロセッシングプログラムカーネルはGB言語でエンコードされます。

1、 BIG5の下のメモ帳にある「SuRongrong」はGBワードプロセッシングプログラムにコピーされ、「Lady?」と自動的に表示されます。 ? '。 'LadyでGB→BIG操作を行った後? ? '、「SuRongrong」と表示されます。

2、 GBワードプロセッシングプログラムで「SuRongrong」と入力し、「Su Rongrong」でBIG→GB操作を実行すると、「Lady?」と表示されます。 ? '。 「SuRongrong」をBIG5メモ帳にコピーすると、自動的に「Moqiu」と表示されます。

3、 GBワードプロセッシングプログラムで「Moqin」と入力し、「Moqin」でBIG→GB操作を実行すると「Su?」と表示されます。 ? '。

プラットフォームとしてのGBChineseオペレーティングシステムを見てみましょう。ワードプロセッシングプログラムカーネルはGB言語でエンコードされています。

1、 GBの下のメモ帳の「SuRongrong」はGBワードプロセッシングプログラムにコピーされ、表示は変更されません。 GB→BIG操作を実行すると、「MuQinQin」と表示されます。

2、 GBワードプロセッシングプログラムで「SuRongrong」と入力し、「Su Rongrong」でBIG→GB操作を実行すると、「Lady?」と表示されます。 ? '。 「SuRongrong」をBIG5メモ帳にコピーします。表示は変更されません。

3、 GBワードプロセッシングプログラムで「Mofan」と入力すると、「Mofan」でBIG→GB操作を実行すると「SuRongrong」と表示されます。

最後に、GB中国語オペレーティングシステムがプラットフォームとして使用され、ゲームプログラムカーネルがBIG5言語でエンコードされている状況に焦点を当てます。

1、 「GB入力方式」スーロンロン'、ゲームプログラムに入力すると、自動的に'になります彼ら1/51/5」。

2、 「GB入力方式」マグパイ'、ゲームプログラムに入力すると、自動的に'になりますスーロンロン」。

「GB入力方式」'、ゲームプログラムに入力すると、自動的に'になります鄭レイ」。

「GB入力方式」'、ゲームプログラムに入力すると、自動的に'になります朱レイ」。

「GB入力方式」ラクーン'、ゲームプログラムに入力すると、自動的に'になりますバギオ」。

3、 「GB拼音入力方式BIG5出力の下で」スーロンロン'、ゲームプログラムへの入力は'になりますスーロンロン'ですが、GBメモ帳では' 'と表示されますマグパイ」。

チップ :ゲームの拼音入力方法が手元にない場合は、BIG5ゲームに参加する:

必要な名前が 'の場合スーロンロン'、使用するGBワードプロセッシングソフトウェア、 GB 大きい 取得する'マグパイ'(通常は繁体字中国語)、ゲームに名前を入力し、繁体字中国語の拼音を使用して入力します'マグパイ'、ゲーム名ボックスに出力すると、自動的に'になりますスーロンロン'、オンOK

コードがC4AC BB54 BB54、次に、GBシステムに次のように表示されます。マグパイ、BIG5として表示スーロンロン。 GBルールテーブルとBIG5ルールテーブル間の対応ルールは、機能的な関係で変換することはできません。 GBの「SuRongrong」がBIGの「SuRongrong」に対応している場合は、ルールテーブルを検索することによってのみ見つけることができます。内部コード変換ソフトウェアがこれを行ってくれました。

3.内部コード変換ソフトウェアの動作原理

対応する関係図では、各文字のコードが異なります。 'を参照してください。 '指示。 GBの「SuRongrong」をBIG5コードに変換するために、ソフトウェアが行うのは「 ↓↓↓ 'プロセスは本質的に'CBD5 C8D8 C8D8'に'C4AC BB54 BB54'、変換されたコードはBIG5システムでOKになります。一部の文字は「?」を表示します'、コードにはルールテーブルの下に対応する文字がないため(コードは文字セットの範囲内にないか、他の特殊記号に対応します)。

GBでBIG5ゲームやプログラムを実行する場合も同様です。ほとんどの台湾の繁体字中国語のゲームプログラムは完了できないからです。 ↓↓↓ '処理するため、手動で入力するか(ヒントを参照)、ゲームの拼音入力方式を使用する必要があります。ゲーム拼音入力方式は、メモリ内での変換を完了するプロセスです。最初にBIG5出力に設定され、ハンド拼音「SuRongrong」、入力方式が完了します。 ↓↓↓ 'プロセス、' SuRongrong 'アドレスは' C4AC BB54 BB54 'にマップされます(これが重要なポイントであり、スマートABC、' SuRongrong 'アドレスなどの他の入力方法は'にマップされますCBD5 C8D8 C8D8')、従来のゲームのBIG5環境で' Su Rongrong 'として正しく出力できるように!

上記は個人的な調査です。間違いがあれば訂正してください。