名前
charmap - 文字符号化を定義するための文字シンボル
書式
文字集合記述 (charmap) は使用できる文字集合とその符号化を定義する。 サポートされる全ての文字集合は妥当なサブセットとして 共通文字集合 (portable character set) を持たなければならない。
文法
charmap ファイルは以下のキーワードからなるヘッダーで始まる:
<codeset> | |
はコードセットの名前を指定する。 | |
<mb_cur_max> | |
は複数バイト文字の一文字あたりの最大バイト数を指定する。 複数バイト文字は現在のところサポートされていない。デフォルトは 1 である。 | |
<mb_cur_min> | |
は一文字あたりの最低バイト数を指定する。この値は mb_cur_max 以下でなければならない。 もし指定されなければデフォルトは mb_cur_max と同じである。 | |
<escape_char> | |
ファイルの残りの部分でエスケープ・キャラクターとして使用する文字 を指定する。これで特殊な意味に解釈される文字をエスケープする。 デフォルトはバックスラッシュ (\) である。 | |
<comment_char> | |
はファイルの残りの部分でコメント・キャラクターとして使用する文字 を指定する。デフォルトではシャープ (#) である。 | |
charmap の定義そのものは第一カラムにキーワード
CHARMAP を置くことで始める。
以下の行は文字の符号化を定義するための二つの方法である: | |
<symbolic-name> <encoding> <comments> | |
これは一つの文字とその符号化を定義する。 | |
<symbolic-name>...<symbolic-name> <encoding> <comments> | |
この形式は複数の文字を定義する。これは複数バイト文字 (現在は実装されていない) のみで有用である。 | |
シンボル名
文字の シンボル名 (symbolic name) は 共通文字集合(portable character set) の文字のみを含んでいる。 この名前はかぎかっこ < > で挟む。 <escape_char> に続く文字はそれ自身として解釈される。例えば <\\\>> のような文字列は \> というシンボル名をかぎかっこで狭んで表現している。
文字符号化
符号化は以下の三つの形式のどれかで表す:
<escape_char>d<数字> | |
は 10 進の数値を表す。 | |
<escape_char>x<数字> | |
は 16 進の数値を表す。 | |
<escape_char><数字> | |
は 8 進の数値を表す。 | |
ファイル
/usr/share/i18n/charmaps/*
準拠
POSIX.2
関連項目
locale(1), localedef(1), localeconv(3), setlocale(3), locale(5)