HARファイルの機密情報をmaskする

やったこと

  • HARファイルに含まれるCookieをgithubにあるharsanitizer-dockerを使ってredact(機密情報の削除)した

背景

AWSのサポート問い合わせ時に、HARファイルの提出を求められ
さらに機密情報は削除した上で提出することが必要とのことで、どうにかHARファイルをダウンロードしたもののどれが機密情報なのか…
色々調べていると同じような壁にぶちあったている人がチラホラいるようで安心した
そんなこんなで、今回はこのページで紹介されているharsanitizer-dockerというツールを使ってみました

やったこと

docker imageをダウンロード

$ git clone https://github.com/scottmcmaster/harsanitizer-docker.git # cloneしなくてもよかったのかも...
$ docker run -d -p 8081:8080 scottmcmaster/harsanitizer:1.1 #8080は別で使っていたので8081にした

ブラウザからhttp://localhost:8081/にアクセス

LOAD HARを実行して、HARファイルを選択

HARに含まれている項目が一覧で表示されているようです

COOKIESの項目を全てON

ダウンロードを実行し、ファイルを保存
先頭1000行を切り取ってdiffを確認します

$split -l 1000 redacted_ap-northeast-1.console.aws.amazon.com.har redacted_split_1000line

cookie情報が全て[項目名 redacted]に置換されているようです

お、なんかいけてそう!

まとめ

redactedは(公表する文書から個人情報・機密情報などが)削除済みのって意味らしいです

とりあえず、こんな感じで対応しました、の報告でした