個人情報流出抑止アプライアンス「PIスキャナー」を開発しました

PIスキャナーのご紹介

この度、サニタイザーの姉妹製品として、個人情報流出抑止アプライアンス「PIスキャナー」を開発しましたのでお知らせします。

PIスキャナーはストップワード、日本語コーパス、人工知能(機械学習)の三つの手法で情報流出を抑止します。また顔識別技術を用いて、画像ファイル中の顔の部分にぼかし処理を加えて外部に送信することもできます。

なお、PIスキャナーは自治体、教育機関には無償提供いたします。

PIスキャナーの操作や機能について紹介したデモ動画がありますのでご覧ください。

PIスキャナーの機能(文書情報検知)

PIスキャナーは文書ファイル中に含まれる重要情報を検知し、外部に送信する前に確認を促す機能を有しています。
製品のキャッチコピーでは「個人情報流出抑止」とありますが、パラメータの設定、チューニングにより、個人情報に限らず、組織で重要とされる情報の検知に広く応用できる可能性があります。

Microsoft Officeファイル

Microsoft Office で作成できる、これらの形式のファイルから重要情報を検知します。

  • Wordファイル(.doc .docx .docmなど)
  • Excelファイル(.xls .xlsx .xlsmなど)
  • PowerPointファイル(.ppt .pptx .pptmなど)

重要情報を含む可能性があるファイルは、一旦保留され、確認・承認を経てから外部に出すことができるようになります。
サニタイズと異なり、マクロやスクリプトの削除は行いません。したがってファイルそのものを改変することもありません。

PDFファイル

PDFファイルにおいても同様に重要情報の検知を行います。
PDFファイルはテキスト抽出が行えない形式のものがありますが、そのような場合でも内部的にテキスト文書を識別・抽出して検知することができます。

DocuWorks形式ファイル

DocuWorks形式ファイルについては、一度内部でPDFファイルに変換して検知処理を行います。
したがって、PDFファイルで行う処理と同じように検知が可能です。

一太郎形式ファイル

一部の官公庁、教育現場などで多く用いられている、一太郎形式ファイルにおいても同様に重要情報の検知を行います。(花子、三四郎等のファイルも対応しています)

Open Document形式ファイル

Open Document形式(ODF)ファイルにおいても同様に重要情報の検知を行います。

テキストファイル

当然ですが、テキストファイルも同様に重要情報の検知を行います。

CADファイル

CADファイル(AutoCAD等)についても、可能性は低いですが同様に重要情報の検知を行います。

PIスキャナーの機能(画像情報検知)

PIスキャナーは画像ファイル中に含まれる人物の顔を検知し、外部に送信する前に確認を促す機能を有しています。
また、検知した人物の顔に対して画像処理を加えることにより、個人を識別できない状態にして外部に送信することができます。

JPEG、GIF、BMP、PNG等の画像ファイル

人物の顔を識別し、検知することができます。併せて画像処理を加えて送信することもできます。

PDFファイル

PDFファイル中の画像データを抽出し、同様に人物の顔を識別・検知することができます。

DocuWorks形式ファイル

DocuWorks形式ファイル中の画像データを抽出し、同様に人物の顔を識別・検知することができます。

PIスキャナーの機能(不正ファイル検知)

ウイルスチェック機能

PIスキャナーはClamAVというアンチウイルスソフトにより、ウイルスチェックを事前に行うことができます。既知のマルウェアについては有効な機能です。(連携するソリューションでアンチウイルス機能がある場合は、この機能を無効にすることもできます)

拡張子偽装への対応

PIスキャナーはファイルの拡張子ではなくファイルの内部情報を走査していますので、拡張子を偽装したファイルについても検知できます。

不正な形式のファイルの検知

詳細はお示しできませんが、明らかに不正な形式のファイルについても検知を行います。

不正な動きをするコード、オブジェクトが埋め込まれたファイルの検知

詳細はお示しできませんが、いくつかの手法でシェルコード、埋め込みオブジェクトの検知を行ってます。一見正常そうに見えるファイルでエラーが出る場合には、何かよろしくない要因が含まれている可能性があります。
なお、サニタイザーとは異なり、マクロやスクリプトの除去は行いません。

PIスキャナーの機能(ファイルの識別)

自治体の土木部門などでやり取りされている、CADソフトウェア等のファイルについても識別できます。

CALSで使われるSFC、P21形式ファイルに対応

導入予定の団体様の要望により、CALSで使われる SFC形式、P21形式のファイルを自動判別するようにしました。(SFCはISOで定義された形式、P21は国土交通省が定めた形式です)

画像ファイルや特殊なソフトウェアのデータ形式を判別

画像ファイルについて、特殊な処理をしているものがありますので、その識別処理を実装しています。
既にサニタイザーを導入していただいている自治体様からの要望に応じて、特殊なソフトウェアのファイルについても、メーカーからの協力を得ながら対応しています。その成果はPIスキャナーにも適用しています。

PIスキャナーの機能(アーカイブファイルの解凍)

メールの添付ファイル送受信で用いられることの多い、Zipファイル、LZHファイル、Cabファイルの解凍機能を有しています。

パスワード付きZipファイルのパスワード解除機能

パスワード付きZipファイルについて、PIスキャナー側でパスワードを解除して情報検知処理を行う機能を有しています。
PIスキャナー独自の機能として、あらかじめパスワードを解除して情報検知を行うのではなく、ファイル取り込み側(output側)からパスワード解除リクエストを送信して解除することができます。
動作のイメージがわかりづらいかと思いますので、動画を載せておきます。これはサニタイザーの動画ですが、PIスキャナーについても同じような動作となります。

解凍後のファイルの自動情報検知機能

PIスキャナーではアーカイブファイルを解凍すると、workフォルダに解凍後のファイルが配置されます。これらのファイルは、そのまま情報検知処理をさせることができます。
他社製のシステムでも同様のことはできますが、PIスキャナーは一連の処理の途中でエラーが発生した場合でも、その原因がつきとめられ、手動で情報検知処理ができるよう、一度目に見える形でファイルを置くようにしています。

PIスキャナーの機能(同一ネットワーク内のファイル受け渡し)

PIスキャナーは複数の利用者が同時に利用することで、利用者間のファイルの受け渡し、共有を行うことができます。(標準機能では利用者を一人だけに設定しています)
ファイル受け渡しや操作の記録は全てログに残りますので、証跡としてお使いいただくことも可能です。
Webブラウザによるドラッグ&ドロップでファイルを取り込むことができます。また、WebDAV形式に対応していますので、パソコン上に共有フォルダとしてマウント(連携)することもできます。

専用クライアントソフトを使ったフォルダ間連携

PIスキャナーのWebインターフェースは ownCloudというオープンソースのファイル管理システムを採用していますが、このownCloudにはWindows、MacOS、Linuxの専用クライアントソフトがあります。
この専用クライアントソフトを使い、PIスキャナーの input、output、workフォルダと庁内パソコンの特定のフォルダ、あるいは外部システムのディレクトリと同期処理を行うことができます。
動作の様子を動画にしていますので、ご覧ください。これもサニタイザーの動画ですが、PIスキャナーでも同様の挙動となります。

PIスキャナープロの機能(ネットワーク間のファイル受け渡し)

PIスキャナーの派生製品であるPIスキャナープロでは、異なるネットワーク間のファイルのやり取りも可能となります。(技術移転要)
ネットワーク間のファイル受け渡しに関する動作は下記の動画のとおり。これもサニタイザーの動画ですが、PIスキャナーでも同様です。
むしろ受け渡し時の承認を経るためには、ネットワーク間のファイル受け渡しの場面で使うべきかもしれません。

LDAP連携も対応していますので、庁内のActive Directory と連携して利用者情報を取り込むこともできます。(技術移転要)

PIスキャナーの標準機能ではできないこと

情報検知機能

  • パスワード付きのファイルは情報検知できません。しかし、設定により通過させることも、ブロックすることもできます。

ファイル受け渡し機能

  • 利用ユーザー情報をまとめてインポートする機能はありません。その代わりユーザ情報をまとめて登録するバッチファイルを作ることができます。(技術移転要)
    なお、LDAPとの連携ができますので、Active Directoryから利用者を取り込むことは可能です。(技術移転要)

PIスキャナーの費用

自治体、教育機関等に導入する場合は、PIスキャナーの製品としての価格は無料です。無償提供します。ただし、動作環境は自治体側でご準備ください。
また、製品としての動作には責任を持ちますが、保守対応をお約束するものではありません。そのため、現在お付き合いのあるベンダー様とPIスキャナーの導入委託契約及び保守契約を締結することをお勧めします。
当方はベンダー様に対して、PIスキャナー(PIスキャナープロを含む)の導入、保守業務を遂行するための技術移転を有償で行うこととしています。(当方が過剰な利益を得ようという意思はありません。無償ボランティアで動けるほどの私的な時間が無いので、再委託を含めた費用を想定しておきたいだけです)
民間企業等に導入する場合には、販売店契約をお願いすることになります。詳細はお問い合わせ下さい。

動作環境

仮想サーバによるバーチャルアプライアンス方式を採用しているので、動作のためにはWindows(Serverでもパソコンでも可。ただし64ビット版OSのみ)あるいはMacOS、Linuxサーバが必要です。
または、VMWare、Hyper-V等の仮想サーバが動作する環境であれば、その中にデプロイすることも可能です。(個別対応)

PIスキャナーを導入するためには

PIスキャナーを単体で自治体が導入するシーンは考えにくいので、まず現在お付き合いのあるベンダー、これから入札等で応札の可能性のあるベンダーに、この製品があることをお伝えください。
その上でベンダーから当方に問い合わせ、相談の連絡をするようにさせてください。(連絡先は下記に示します)
自治体側の事情でベンダーを介さずに直接導入したい場合、まずは詳しい話を聞きたいという場合には、個別にお時間をとってご説明することもできます。ただし現在の私は多忙を極めている状況なので、日程や手段、費用については調整させてください。
連絡先メールアドレス: sanitizer.japan[at]gmail.com
フリーメールで申し訳ありません。現在所属しているところのメールアドレスは、今のところ使わないでおこうと考えております。[at]の部分は@に置き換えてメールしてください。

PIスキャナー評価版

PIスキャナーをとりあえず使ってみたいという方向けに、評価版のセットアップ方法を下記に示します。なお、「評価版」としていますが、単独のパソコンの中でご利用いただくのであれば、このまま利用することもできます。
「PIスキャナー」評価版セットアップの手順(最新版 Ver.1.0.0)
また、要望にお応えして、ネットワーク間のファイル受け渡しを実現するPIスキャナープロも(不定期ですが)評価版としてリリースしています。ただし、PIスキャナープロは個別対応(技術移転)が必要となります。
(現在準備中です)

蛇足:本件における川口の立場は

いくつかのメディアに採り上げられる関係で、もしや誤解を与えそうな気がするので補足(蛇足)しておきます。
私は複数の行政機関に所属しておりますが、常勤雇用されている立場ではないため、地方公務員法に基づく兼業規制を受けていません。(職務専念義務はあります)
そのため事業主体として振る舞うこともできるのですが、今回は特にそれを望んでいません。どちらかというと万策尽きそうな自治体に対して、何らかの解決策を示して助けたいという思いのほうが強いです。
そのため無償提供であることが基本なのですが、一方で自治体の立場では「無償の製品=無責任」と受けとめられるのも事実です。そこで相応の責任を引き受けるためのコストを保守費用として計上していただくことを考えた次第です。普段お付き合いのあるベンダーが保守を引き受けられるのならば、その方が望ましいので、ご相談の際にはそれが実現できるような方法もお話させていただきます。
また、私が現在所属している機関がこの「PIスキャナー」を採用するかは未定です。本件は私的な活動であるため、所属機関とは一定の距離をとっています。製品採用を働きかけることは一切していません。(もちろん採用してもらえると嬉しいですが、その場合も直接取り引きをすることはないと思います)