Social IMEについてのメモ
ちょっと最近自分のTLではソーシャルIMEのことが話題になっている。
様々なIMEで予測変換する際のAPIとして採用されているのだが、中でも有名なのはAndroidのIMEであるSimejiやFlickwnnだ。
で、なんでこれが話題になっていたかというとSimejiでの「ほも」の予測変換で特定のTwitterユーザー名が変換候補に出てきてしまうという問題があったから。
URLではこうやると簡単に変換結果を取得できる。
http://www.social-ime.com/api2/predict.php?string=ほも
これはSocial IMEのAPIを採用しているIMEではどれも同じ変換結果が返ってくるのかな、と思ってSimejiの他にFlickwnnやWeb IME Mushroomなどで変換結果を見てみた。
するとどうやら結果が異なるようだ。
これがSimejiでの結果。
こっちがFlickwnnでの結果。
この通り被る候補もあるが出てこないものもある。
この違いは何か?その答えはWeb IME Mushroomが持っていた。
Social IMEにはふたつAPIがあるのだ。
http://www.social-ime.com/developer.html
APIの違いがこの変換結果の違いに反映されていると考えて良さそうだが、先程のようにURLでそれぞれを叩いてみると同じ結果が返って来てアレ……僕のやり方がおかしいのかな?
まあWeb IME Mushroomの設定画面での説明がそれぞれそのようになってるから合っているとは思う。うん。
で、これで結果の違いということには納得がいったのだけど、どちらにしてもTwitterのIDが変換候補に出てきてしまうのは間違いなく問題だよね。
大元としてはSocial IMEがこのような登録を除外しなくてはならないと思うのだけど、なんと驚くべきことにSocial IMEには変換候補に対するスパム報告機能がなく、ただ候補が登録されていく一方なのである。Twitterでも言ったけどこれは自浄作用のない欠陥品と呼ぶ他ない。
つまり大元から断つ方法はなさそう。じゃあSocial IMEのAPIを採用してるIMEがそれぞれ対応すればいいじゃんというのが自然な考えなんだけども、どうやらSimejiの公式アカウントさんはやる気なさそうにしてましたね(
変換候補からTwitter IDを除外するコードなんて1行か2行追加するだけで終わる話だと思うんですがねえ、文字列の処理とかプログラミングの基礎でしょうに。
まあ、結局ここまで現状の自分の理解を書き連ねただけなんだけども、私見を最後に言っておくと、ああいう態度の企業とは関わり合いたくないし製品も使いたくないですね。
あ、蛇足としてSocial IMEへの単語の登録は
ttp://www.social-ime.com/api/?method=dic_add&yomi=よみ&word=単語
でできますってよ奥さん。絶対悪用するなよ!絶対だぞ!
追記20130106
予測変換APIの開発者向け情報のページが公式からリンク外されていて、ページ自体はまだ生きていたのでURL貼っときます。