Cato DLP サービスの画像内のテキスト識別(OCRスキャン)のサポートについてご紹介します。
Cato DLP サービスはデータ損失・流出防止ためのソリューションとして提供されています。しかし、これまでの対応コンテンツはテキストコンテンツのみで画像ファイルはサポートされていませんでした。
OCR Scanning for DLP Content Inspection
2024 年 1 月 1 日のPartner Updateにて画像内のテキスト認識を行うOCRスキャンがDLP サービスにEA(早期提供機能)として追加されたことが発表されました。これにより画像およびスキャンされたドキュメント内のテキストコンテンツの識別と監視が可能になります。
現時点では英語のみがサポートされ、画像からラテン文字を検出します。
次の画像タイプ:png、jpeg、tiff、bmp、pnm、webp、jpeg2000 をサポートしています。
サポートされるファイル サイズ 画像:10KB~20MB
動作検証
さっそくこちらのEA機能を利用申請し、弊社検証環境で有効化しました。
有効化するとDLP Configurationのプロファイル作成メニューに[OCR Scan Enabled]のチェックボックスが表示されます。
※EA機能はCatoへ利用申請を行ったアカウントでのみ有効化されます。
CMAのDLP Configurationにて検知するキーワードを定義します。今回"Secret"の文字列を定義しました。
[Validate Dictionary]をクリックすることでファイルをアップロードしてキーワードを検知するか簡易的にテストできますのでまずはこちらで試します。
以下の画像ファイル(.png)をアップロードしてスキャンします。
文字列を検知できることが確認できました。
(ちなみにこのあと少々意地悪をして文字を斜めにしたり画像の向きを回転させたファイルで試したところ残念ながら検知できませんでした)
このDLPプロファイルを使用したデータコントロールルールを定義しました。
実際にクラウドアプリケーションへ"Secret"の文字列を含む画像ファイルをアップロードしたときにブロックされるのか確認します。
Cato Cloudに接続した状態でSharepointに先ほどと同じ画像ファイルをアップロードしたところ、失敗しました。
イベントログからDLPルールによってブロックされたことが確認できます。
まとめ
画像およびスキャンされたドキュメント内のテキストコンテンツの識別と監視が可能になることでさらにセキュリティが強化され、DLP サービスの有効性が上がりました。
すでにDLP サービスを利用中のユーザーはチェックボックスを有効にするだけで展開が完了します。
現時点では英語のみのサポートとなっておりますが、今後に日本語を含む他の複数の言語のサポートが予定されています。
以上、Cato DLP サービスの画像内のテキスト識別(OCRスキャン)のサポートについてのご紹介でした。