国際化URLをUnicodeで

 標準化団体のW3CIETFは26日、URI(URL)の国際化方法を定めたRFC 3986とRFC 3987を公表した。すでにドメイン名の国際化方式についてはRFCとして標準化されているが、さらにディレクトリ名やファイル名などの部分についても国際化の方式を定めた。これにより「http://日本語ドメイン名.jp/新着情報/」といったURLの利用が可能となる。

ということで、RFC3987(http://www.ietf.org/rfc/rfc3987.txt)に詳細がある。基本的にはURIを拡張してIRIという国際化されたものを定義している。Unicodeが使える。普及するのかどうかわからないけど、とりあえず時間があるときに読んでおこうと思ってメモ。コレまでの国際化URLのPunyCodeとかはどうなるのかと思ったら、どうも共存するっぽい。符号化方式はUTF-8を使うのか...? ちゃんと読もう。