AWS

AWS

Amazon EMR – Encryption

HadoopやSparkが使うデータを暗号化して、安全に保管したり通信できるようにする機能。こっそり盗み見られても鍵がないと中身がわからない。ログや一時データも含めて守れるから、センシティブな情報を扱うときに必須だね。
AWS

Amazon Redshift – AQUA

S3からデータを読み取るとき、追加の専用ハードウェアで“キャッシュやフィルタ”をしてさらに高速化する仕組み。Redshift SpectrumでS3を参照するときのスピードをアップさせる新しい取り組みなんだ。
AWS

Amazon EMR – Managed Scaling

EMRが自動でクラスターの大きさを考えてくれて、“最適な台数”に調整してくれる機能。自分で細かくルールを書かなくても、使用状況を見て無駄を減らしつつ速度を保つから、手動管理よりラクでコスパも良くなるんだ。
AWS

Amazon Redshift – Backup and Restore

大切なデータをスナップショットに保存し、間違って消したときに元通りにできる機能だよ。自動スナップショットもあり、履歴をとっておけば過去の状態への巻き戻しもOK。データ破損のリスクをぐっと減らせるんだ。
AWS

Amazon S3 Glacier – Region Replication

遠くのリージョンにも同じアーカイブをコピーできて、災害や障害への備えに使えるんだ。万が一一方の地域がダメになっても、別の地域のコピーを呼び出せるから、長期保管だけじゃなくリスク分散も実現できるんだ。
AWS

Amazon S3 Glacier – Object Lock (via S3)

ファイルを“一定期間絶対に消せない状態”にする仕組み。法律で定められた文書の保管などで使える。GlacierとS3のObject Lockを組み合わせることで、誤って削除や改ざんが起きないようガチッと固められるんだ。
AWS

Amazon S3 Glacier – Monitoring

Glacierの取り出しリクエストや容量をCloudWatchなどでチェックして、全体の動きを把握できる仕組みだよ。どれだけのデータを入れているか、取り出しが頻繁に行われていないかを見て、予算や運用を調整しやすくなる。
AWS

Amazon S3 Glacier – Data Retrieval Policies

取り出しリクエストの速度や回数をどうコントロールするかを決める仕組み。急いで大量に取り出すとコストが高くなる場合もあるから、この設定で“大急ぎ”にするか“のんびり”にするか、使用頻度や予算に合わせられるんだ。
AWS

Amazon EMR

大量のデータを分割して同時に処理する“Hadoop”などの仕組みをクラウドで簡単に使えるサービスだよ。いっぱいの人手がいる引っ越しみたいに、大きな荷物(ビッグデータ)でも手分けして素早く分析したりできるんだ。
AWS

Amazon S3 Glacier – Inventory

金庫の中に何が入っているか一覧を作って確認できる“在庫リスト”機能だね。普段は中身を簡単に見られないけど、このリストを使えばどんなアーカイブがしまってあるかを把握しやすい。大掃除をするときにも便利なんだ。