google日本語入力がリリースされました
64bitバージョンもでたのでこれからと言うところです。
windowsの日本語入力は有名どころとして
標準のIME、ATOKが有名だと思います。
IMEは2003あたりから中国企業の開発になり、すごく頭が悪い子になっちゃったのは有名だと思います。
日本語入力はざっくりと2つの要素があると思います。
1つは変換する際に文章をどこで区切るべきかや、
文節が漢字にすべきかどうかを判断したりする部分です。
2つ目は膨大な辞書データにより、漢字と読み仮名を対比する部分です。
これには変換に必要な情報も含まれていますし、広辞苑のように
新しい言葉への対応も必要です。
1つ目の文章を解読する性能が悪いと文章の接続詞まで強引に漢字にしようとします。
atokはこの性能が非常に高く、人間の打ち間違えも少しは修正する機能もあります。
2つ目は辞書ですが、辞書は通常手で追加され、膨大なデータを蓄積していくそうです。
もちろん、辞書メーカーより購入する部分も多少はあると思いますが…
この部分に着目したのがgoogleです。
googleは毎日、ものすごい数の検索を処理しています。
もちろん、目的があるので言葉になっていますし、新しいこともどんどん検索されます。
この検索キーワードを統計や日本語分析のアルゴリズムにかけて自動で辞書データへ変換するそうです。(googleのもしかして機能の応用だそうです。)
常に新しいデータもあれば、分野を問わないので専門用語辞書がなくても、専門用語が変換できたりします。
ただし、無作為なのでいらない2ch用語なども入ってくるので、欠点もあります。
googleは無料と言うこともあり、atokには脅威かもしれません。
googleの変換プログラムはまだまだという感がありますが
少なくともIMEよりはマシと言うことで
興味のある方は試してみてください