AWS Amazon Redshift – Encryption データをディスクに書くときも暗号化しておけば、もしディスクが盗まれても中身が読めない。転送中も暗号化できるから、社外に通信が漏れてしまっても安全。機密情報を扱う大企業にとって必須級の仕組みだよ。 2025.02.22 AWS
AWS Amazon Redshift – Federated Query RDSやAuroraなどのデータベースにあるテーブルを、Redshiftから直接SQLで読める機能。いちいちコピーしなくても、まとめて分析できるから、データがバラバラでも統合して簡単にクエリできて便利なんだ。 2025.02.22 AWS
AWS Amazon Redshift – Data Sharing 別のRedshiftクラスターとデータをリアルタイムで共有できる仕組みだよ。コピーを作らずに直接テーブルを見せ合うから、最新情報をすぐ参照できてストレージの無駄も少ない。チーム間で連携がしやすくなるんだ。 2025.02.22 AWS
AWS Amazon Redshift – Table Restore 一部のテーブルだけ“スナップショット”から復元できるから、全部を巻き戻す必要がない。間違えて削除したテーブルだけ元に戻すなんてことが可能で、大規模データを扱うほどこの部分的リストアが助かるんだ。 2025.02.22 AWS
AWS Amazon Redshift – Cross-Region Snapshot Copy スナップショットを別のリージョンにも自動転送して保管する仕組み。地震や停電などでメインリージョンが使えなくなっても、遠くのリージョンで復元できる。大事なデータを世界規模で守りたいときに役立つんだ。 2025.02.22 AWS
AWS Amazon Redshift – Dedicated Admin Queries ユーザーの重いクエリでいっぱいでも、管理用のコマンドは別枠で動かせる仕組み。クラスタが詰まっていても管理者が状態をチェックしたりテーブルの変更をしたりできるから、トラブル対応がスムーズになるんだ。 2025.02.22 AWS
AWS Amazon EMR – Pig 読みやすいスクリプトを書いて大きなデータを加工する仕組みだよ。SQLほど厳密じゃない言い回しで操作できる。EMRでPigジョブを走らせると、一気に大量のファイルを処理して、自動でクラスタが増えたり減ったりしてくれる。 2025.02.22 AWS
AWS Amazon EMR – Presto 超高速でSQLクエリを実行できる“分析エンジン”だよ。大量のデータでもすぐに結果を返してくれることが多く、あちこちに散らばったデータソースにも対応しやすい。EMRならすぐクラスタを作って使い始められるんだ。 2025.02.22 AWS
AWS Amazon EMR – Ganglia クラスターの動きをグラフで見られる監視ツール。EMRの内部でどのノードがどれだけ負荷を受けているか一目でわかる。もし処理が遅かったら原因を探しやすいし、調整や拡張のヒントにできる優れものなんだ。 2025.02.22 AWS
AWS Amazon EMR – EMRFS S3をHadoopのファイルシステムっぽく扱う仕組みだよ。わざわざHDFSにデータをコピーしなくてもS3に置いたまま分析できるから、ディスクが足りなくなる心配も減るし、大容量のファイルも楽に扱えるんだ。 2025.02.22 AWS