やっぱりか…と思ったのはきっと私だけではなかったでしょう。
クリスマスも終わり、そろそろ年明けに備えようかとしているこの年の瀬に、ドでかいニュースが舞い込んで来ました。
- 中国製の日本語入力ソフト 入力情報を無断送信 - NHKニュース
NHKニュースでは、以下の問題点を報道しています。
- 初期設定ではパソコンの情報を外部に送信しないと表示しているが、ほぼすべての入力情報を送信する仕組みになっていた
- パソコンで打ち込んだほぼすべての情報と、パソコン固有のID、メールや文書作成ソフトなど利用しているソフトの名前を送信していた
- 他社IMEは、初期設定で外部への送信はOFF、同意があっても全てを送信・記録していない
ただ、これだけではよくわからないので、ソース元のネットエージェントのBlogを見てみます。
- 入力情報を送信するIME - NetAgent Official Blog
クラウド入力OFF(,ログ情報送信ON)の場合、以下の情報が送信される・Simejiの場合
- 変換確定文字列
パスワードなど半角入力のみの場合は送信されず、クレジット番号や電話番号も変換しなければ送信されない- uid(コンピューターのセキュリティ識別子SID)
- アプリケーションのPath(これにはユーザー名が含まれる場合も)
- Baidu IMEのバージョン
クラウド入力OFF,ログ情報送信OFFの場合でも以下の情報が送信される
- 変換確定文字列
パスワードなど半角入力のみの場合は送信されず、クレジット番号や電話番号も変換しなければ送信されない- uid(UUIDによる個別端末識別子)
- 使用している端末名
- アプリのパッケージ名
- Simejiのバージョン
Simeji初回起動時の画面
Simeji初回起動時にログ情報を送信するか選択できます。
規約の内容は、Simeji利用規約にありますが、抜粋すると
当社で収集するモバイル固有の情報まーよくわかりませんw
モバイル向けサービスで収集される情報の多くは、デバイスの種類、OSおよびソフトウェアのバージョン、携帯通信会社、当社のサービスやツールの基本的な設定情報、それ自体では当社で個人を特定できないものですが、固有の情報である、個人的であると考えられる情報を構成する、または含む場合があります。
利用者によっては個人的な情報と考えられる情報も含めて、特定の情報がデバイス上に保存されることがあります。このようなローカルストレージの管理方法については、デバイスのマニュアルや利用ガイドをご覧ください。
収集する情報の中に入力した変換確定文字列も含まれるんでしょう。
Baidu IMEについては、よくあるご質問によると、
Baidu IMEは個人情報収集をしているの?ということで、これはネットエージェントの調査通りとなっています。
Baidu IMEインストール時、ログ送信を希望する旨にご自身でチェックを入れない限り、ログの送信は行われません。また他社製品と併せてインストールされる場合この画面が表示されない事がありますが、その際もログ送信は行われない設定になっています。
長くなりましたが、今回の問題点を整理すると、
- 初期設定で送信する仕組みになっていた(オプトアウト方式だった)
→利用前に規約に同意しているはずなので、それに同意した以上それは問題にはならない※ただし、オプトイン方式の方が好ましいことは言うまでもない - 他社製IMEとは異なり、入力した変換確定文字列が”ログ情報”として他の情報と一緒に送信されていた
→Google IMEやATOKとは異なり、Baidu製IMEは収集するログ情報に変換確定文字列を含んでいた。これは規約から明確に読み取ることができず、かなりグレーゾーン
※ただし、クラウド変換を利用している場合は、入力した文字列を送信することを前提とした仕組みなので、どのIMEを使っていても当然入力情報は送信される - Simejiの場合、クラウド入力OFF,ログ情報送信OFFの場合でもログ情報が送信されていた
→これが完全にアウト。ユーザーが明確に送信を拒否しているにもかかわらず、Baiduが情報を収集している状態は完全にクロ
つまり、グレーゾーンの2.と、真っ黒な3.が争点になるわけです。
これを受けて、午後にBaidu.jpからプレスリリースが発表されました。
- 一部の報道に対する弊社の見解 - Baidu.jp プレスリリース
- 入力情報無断送信について
ユーザーが入力した情報はログ情報で、それは同意したユーザーからしか収集しない。クレジットカード番号や住所などの個人情報はサーバーに保存していない。サーバー・データは日本国内にある - クラウド入力について
クラウド入力のデータ通信はSSL方式を採用し、データは厳重に機密性の高いレベルで管理している - 送信対象とするデータについて
ログセッション:変換精度向上やアプリ開発の基礎として活用(一定期間で破棄)
クラウド変換:送信された入力内容に対し変換候補を返す。サーバーに保存されない
- SimejiでログセッションOFFの場合でもログデータが送信されていた件
バグでした。2013年3月にリリースしたVer 5.6から発生した実装バグ。本日中に改善した最新バージョンを緊急リリースする。
→6.6.2が配信され、上記バグの修正がアナウンスされていますています
しかもログ情報にはuidも含まれますので、その気になれば特定uidによる入力情報の紐付け(による個人の特定等)が容易に可能になるわけです。
せめてこのリリースの内容は規約に明記しておく必要があるのではないでしょうか。
そして今後もSimejiを使い続けるユーザーはこのことを理解した上で利用する必要があります。
SimejiはAndroid黎明期からあった日本製IMEで、現在ATOKやGoogle IMEでも利用可能なマッシュルームの基となったアプリです。
そのアプリがBaiduに買収され、こういった問題を起こし、今後もログデータと称し入力データを収集し続けるのは非常に残念です。
とは言え、AndroidやWindowsはiOSとは違い、ユーザーが自由にIMEを変更することができます。
大きなメリットの1つですが、それは同時に入力した情報をそのアプリの製作元に収集される可能性があるというリスクを理解したうえで、信頼できるディベロッパーが作成したアプリを利用することが大切だと思います。
<追記>
Google IME・ATOKでは入力文字の収集はしていないと明言しています。
- AndroidはIMEインストール時に“警告”表示で注意喚起 Google日本語入力は「入力情報の送信はしていない」 - ITmedia ニュース