検索で中国語のページばかりが引っかかる

先日も注目していると紹介した「パプアニューギニア通信(id:tama2)」の新しいエントリで以下のように書かれていました。

パプアで、Googleを利用していて、不思議な現象が起こることを発見したことがあります。英語OSを使うことがあるのですが、英語OSを使って、日本語入力をして、Googleで検索をしてみると、中国のホームページしか、検索結果に表示されなくなるのです。漢字が検索語に入っていると、(かな漢字混じりの文字でも)中国語として認識されてしまうようです。

基本的にGoogleUnicodeで日本と中国の感じはほぼ同じものとして扱われるため、そういう現象はあります。このあたり、Googleはしっかりやっているなあ、といつも思っています。

たとえば日本からGoogleで「中心」と入力すると(これは中国語でショッピングセンターとかの『センター』の意味)、中国語のページも多く引っかかる。Googleっていろいろな情報から検索した人が何語のページを探しているのかを判断しているっぽくて、たとえばブラウザの言語設定(IEなら「インターネットオプション」の「言語」)や、アクセスもとの国もチェックしているっぽいです。「中心」の例も、日本からだと昔に比べて日本語のページが上位に来る頻度が高くなっていましたが、海外のウェブプロキシを経由して試してみたら、海外からだと(国にもよると思いますが)、中国語のページが多くなるようでした。

でも、かな混じりでもそうなる、というのは不思議な感じです。