[Subject Prev][Subject Next][Thread Prev][Thread Next][Subject Index][Thread Index]

[webdav-jp:0800] Re: glibc への CodePage 932 追加について (Re: Apache 2.0.46 へのパッチ適用に付いて)



森山です。

At Tue, 8 Jul 2003 20:52:13 +0900,
吉山 晃 さん:
> > 次のメッセージから始まるスレッド
> > 
> >   [glibc-2.2.1 iconv() prototype and eucJP/SJIS conversion tables]
> >   http://sources.redhat.com/ml/bug-glibc/2001-01/msg00113.html
> 
>   チェックしました。「これが正しい eucJP や SJIS だよ」と書いても説得は難
> しいでしょうね(Ulrich 達が言うように、現状の変換コードのマップが正しいと思
> われる)。「これが日本でのデファクトスタンダードの1つだよ。便利だから入れ
> て」という説得をしようと思います。

現実には、JIS規格を厳密に解釈して、sjis で JIS X 0201 の 0x5C を 
YEN SIGN U+00A5 に対応付けされても困ったりするのですが…

あと、Unicode.org の変換表で JIS関連のものは、OBSOLETE になって
いるとか、一部 JIS規格とは異なる対応付けが行われている文字(―)
があるので正式な規格に則っているとも言えなかったりします。

# Java は、比較的 JIS規格に忠実な方で、尚且つ現実的な変換が行わ
# れていると思います。

JIS規格準拠(?)の変換に関しては、日本規格協会などでコントロールし
てもらわない事には、なかなか混乱の収拾はつかないのかなと感じてい
ますので、特に修正するとかはしていません。

JIS規格準拠(Glibc,libiconv は Unicode.org 準拠) の変換と、MS 互
換の変換の 2 系統が用意されれば、必要に応じて使い分けが出来るよ
うになるので、良いかなと考えています。

> > あと、私の作成したパッチでの cp932 は以下のソフトでの変換と互換
> > 性がある事を確認しています。
> > 
> >   Java MS932
> >   Perl Encode 1.92 cp932 (Perl 5.8.0 付属の Encode は一部不具合アリ)
> >   Python JapaneseCodec MS932
> >   PostgreSQL SJIS⇔UNICODE 変換 (EUC_JP⇔UNICODE 変換は、eucJP-ms と同等)
> > 
> > 一応、この辺も説得材料として用意しておいた方がいいかもしれません。
> 
>   文章を足さないといけませんね。

PostgreSQL に関しては、一部不具合が合ったので自分でパッチを作っ
ていたのを忘れていました。具体的な内容は、以下に書いてあります。

http://www2d.biglobe.ne.jp/~msyk/cgi-bin/charcode/bbs.cgi?c=gr&n=68

Java MS932 については、MS の変換と同じである事が確認できています。
また、Perl Encode cp932 と Python JapaneseCode MS932 については、
MS の変換と同じになるようにしてもらっています。

という事で、完全に一致する事が確認されているのは、

  Java MS932
  Perl Encode 1.92 cp932
  Python JapaneseCodec MS932

となります。
よく確認せずに書いてしまい申し訳ありませんでした。

‖ 森山 将之 (MORIYAMA, Masayuki) 
‖ E-Mail: msyk@xxxxxxxxxxxxxxxxx