top of page

Cato DLP サービスが画像ファイルのテキスト識別に対応(EA)

  • 執筆者の写真: フーバーブレイン Cato Cloud チーム
    フーバーブレイン Cato Cloud チーム
  • 2024年1月5日
  • 読了時間: 3分

Cato DLP サービスの画像内のテキスト識別(OCRスキャン)のサポートについてご紹介します。


Cato DLP サービスはデータ損失・流出防止ためのソリューションとして提供されています。しかし、これまでの対応コンテンツはテキストコンテンツのみで画像ファイルはサポートされていませんでした。


OCR Scanning for DLP Content Inspection

2024 年 1 月 1 日のPartner Updateにて画像内のテキスト認識を行うOCRスキャンがDLP サービスにEA(早期提供機能)として追加されたことが発表されました。これにより画像およびスキャンされたドキュメント内のテキストコンテンツの識別と監視が可能になります。


  1. 現時点では英語のみがサポートされ、画像からラテン文字を検出します。

  2. 次の画像タイプ:png、jpeg、tiff、bmp、pnm、webp、jpeg2000 をサポートしています。

  3. サポートされるファイル サイズ 画像:10KB~20MB


動作検証

さっそくこちらのEA機能を利用申請し、弊社検証環境で有効化しました。

有効化するとDLP Configurationのプロファイル作成メニューに[OCR Scan Enabled]のチェックボックスが表示されます。

ree

※EA機能はCatoへ利用申請を行ったアカウントでのみ有効化されます。


CMAのDLP Configurationにて検知するキーワードを定義します。今回"Secret"の文字列を定義しました。

[Validate Dictionary]をクリックすることでファイルをアップロードしてキーワードを検知するか簡易的にテストできますのでまずはこちらで試します。

ree

以下の画像ファイル(.png)をアップロードしてスキャンします。

ree

文字列を検知できることが確認できました。

ree

















(ちなみにこのあと少々意地悪をして文字を斜めにしたり画像の向きを回転させたファイルで試したところ残念ながら検知できませんでした)


このDLPプロファイルを使用したデータコントロールルールを定義しました。

実際にクラウドアプリケーションへ"Secret"の文字列を含む画像ファイルをアップロードしたときにブロックされるのか確認します。

ree

Cato Cloudに接続した状態でSharepointに先ほどと同じ画像ファイルをアップロードしたところ、失敗しました。

ree

イベントログからDLPルールによってブロックされたことが確認できます。

ree

まとめ

画像およびスキャンされたドキュメント内のテキストコンテンツの識別と監視が可能になることでさらにセキュリティが強化され、DLP サービスの有効性が上がりました。

すでにDLP サービスを利用中のユーザーはチェックボックスを有効にするだけで展開が完了します。


現時点では英語のみのサポートとなっておりますが、今後に日本語を含む他の複数の言語のサポートが予定されています。


以上、Cato DLP サービスの画像内のテキスト識別(OCRスキャン)のサポートについてのご紹介でした。


コメント


この投稿へのコメントは利用できなくなりました。詳細はサイト所有者にお問い合わせください。
bottom of page