Google Japan Blog: 思いどおりの日本語入力 - Google 日本語入力

 面白そうではある。ATOK、というかジャストシステムの先行きが微妙に不透明な気がするこのタイミングとしてはなおさら。もっとも人柱をやる気はないし、Googleの発表直後の新サービスとなるとプライバシー的問題を気にせざるをえないし、IMEという常時システムよりで稼働するもののβ版なんてせっかく安定して使えてる環境に入れたくはないし、何より現時点で使用中のATOK 2008になんの不満も感じてないし、しばらくは様子見。
 あと、この件でいろんなサイトを見て回ったうちではっとしたんでメモっとく。確かにこういう視点はなかった。もちろんユーザーがかな漢字変換をしている途中の読みデータと、かな漢字変換を確定した後の漢字データを集めてきたってのは推測でしかないんだけど。

ユーザーが「かな」をどういう文脈の時にどういう漢字に変換するかという膨大な統計データを使うということはすばらしいと思うのだけど、そこでユーザーが入力したかな文字列と変換後の漢字文字列のセットは、実はユーザーが使っているかな漢字変換機能の辞書が吐き出したものなんですね。つまり、ユーザーを介して、間接的に他社のかな漢字変換の辞書の内容の一部を「ぶっこ抜いて」いるわけですわ。