AWS

AWS

Amazon EMR – Hive

SQLみたいな言葉でビッグデータを扱える仕組みだよ。“SELECT”で巨大なデータを読んだり集計したりするから、普段SQLに慣れている人でも大規模データ分析に挑戦しやすい。EMRがあれば構築がシンプルなんだ。
AWS

Amazon S3 Glacier – Encryption

アーカイブを秘密の暗号に包んでおくから、誰かが金庫を盗んでも鍵なしでは読めない。S3と同じように自動で暗号化してくれるから、気づかずに大事なデータが漏れるのを防げて、とても安心なんだ。
AWS

Amazon EMR – Pig

読みやすいスクリプトを書いて大きなデータを加工する仕組みだよ。SQLほど厳密じゃない言い回しで操作できる。EMRでPigジョブを走らせると、一気に大量のファイルを処理して、自動でクラスタが増えたり減ったりしてくれる。
AWS

Amazon S3 Glacier – Archive

Glacierに入れる1つ1つの“箱”のような単位だよ。書類の束や写真のフォルダなどをまとめて、1つのアーカイブとして扱う。Vaultの中には複数のアーカイブが入っていて、取り出すときはこの単位で操作するんだ。
AWS

Amazon EMR – Presto

超高速でSQLクエリを実行できる“分析エンジン”だよ。大量のデータでもすぐに結果を返してくれることが多く、あちこちに散らばったデータソースにも対応しやすい。EMRならすぐクラスタを作って使い始められるんだ。
AWS

Amazon S3 Glacier (Amazon S3の一部)

ほとんど使わない昔の写真アルバムや大事な書類を、ものすごく安い値段でしまっておける“長期保存用の部屋”だよ。必要なときに取り出せるけど、すぐには出せないこともある。タイムカプセルみたいにずっと保管したいデータにぴったりなんだ。
AWS

Amazon S3 Glacier – Vault

Glacierの“金庫”にあたる保管場所だよ。ここにアーカイブを入れておくと、普段は鍵をかけて奥深くにしまっておける。めったに開けない書類を一括管理するのに役立つし、中を開けるまでに少し時間がかかるのが特徴なんだ。
AWS

Amazon S3 Glacier – Vault Lock

“この金庫のルールは二度と変えられません”と施錠する仕組みだよ。たとえば法的に一定期間は消しちゃダメな書類を保管するときなどに使う。いったん固めると後からゆるめられないから、本当に大事な守り方をしたいときに有効なんだ。
AWS

Amazon S3 Glacier – Access Policies

Vaultに対して“誰が入れるか”をまとめて書いた看板みたいなルールだよ。読み取りだけOKにするか、まったく触れないようにするかなど、細かい権限を設定して、金庫を安全に管理できる仕組みになっているんだ。
AWS

Amazon EBS – Monitoring

CloudWatchでEBSの“読み書き回数”や“遅延”などをモニタリングできるよ。もしディスクへのアクセスが滞っていたり、性能が足りなくなったりしているなら、グラフを見て早めに改善策を考えられる。