AWS

AWS

Amazon S3 Glacier – SNS Notifications

アーカイブの取り出しが完了したら“できたよ!”と通知を送ってくれる仕組み。人間がずっと待ってなくても、メッセージを受け取ったら次の作業を自動化できるし、時間がかかる取り出し処理にも対応しやすくなるんだ。
AWS

Amazon EMR – Spark

メモリを活用してとても速い分析ができるフレームワークだよ。繰り返しの処理やリアルタイム分析に強い。EMR上でSparkを動かすと、自分で面倒な設定をしなくても必要なサーバーが用意されてスイスイ動かせるんだ。
AWS

Amazon S3 Glacier – Tagging

アーカイブやVaultに“ラベル”を付けて管理しやすくする機能だよ。たとえば“領収書”“写真”などタグをつければ、後でまとめて確認したり、どのジャンルがどれくらい容量を使っているか分析するのに役立つ。
AWS

Amazon EMR – Hive

SQLみたいな言葉でビッグデータを扱える仕組みだよ。“SELECT”で巨大なデータを読んだり集計したりするから、普段SQLに慣れている人でも大規模データ分析に挑戦しやすい。EMRがあれば構築がシンプルなんだ。
AWS

Amazon S3 Glacier – Encryption

アーカイブを秘密の暗号に包んでおくから、誰かが金庫を盗んでも鍵なしでは読めない。S3と同じように自動で暗号化してくれるから、気づかずに大事なデータが漏れるのを防げて、とても安心なんだ。
AWS

Amazon EMR – Pig

読みやすいスクリプトを書いて大きなデータを加工する仕組みだよ。SQLほど厳密じゃない言い回しで操作できる。EMRでPigジョブを走らせると、一気に大量のファイルを処理して、自動でクラスタが増えたり減ったりしてくれる。
AWS

Amazon S3 Glacier – Archive

Glacierに入れる1つ1つの“箱”のような単位だよ。書類の束や写真のフォルダなどをまとめて、1つのアーカイブとして扱う。Vaultの中には複数のアーカイブが入っていて、取り出すときはこの単位で操作するんだ。
AWS

Amazon EMR – Presto

超高速でSQLクエリを実行できる“分析エンジン”だよ。大量のデータでもすぐに結果を返してくれることが多く、あちこちに散らばったデータソースにも対応しやすい。EMRならすぐクラスタを作って使い始められるんだ。
AWS

Amazon S3 Glacier – Archive Description

アーカイブにメモ書きできる“自己紹介文”みたいなもの。見返すときに“これは何の資料だったかな?”とすぐわかるように、簡単な説明や日付を載せておける。大量のアーカイブを整理する手助けになるんだ。
AWS

Amazon EMR – Ganglia

クラスターの動きをグラフで見られる監視ツール。EMRの内部でどのノードがどれだけ負荷を受けているか一目でわかる。もし処理が遅かったら原因を探しやすいし、調整や拡張のヒントにできる優れものなんだ。