AWS

AWS

Amazon Redshift – Table Restore

一部のテーブルだけ“スナップショット”から復元できるから、全部を巻き戻す必要がない。間違えて削除したテーブルだけ元に戻すなんてことが可能で、大規模データを扱うほどこの部分的リストアが助かるんだ。
AWS

Amazon Redshift – Clusters

Redshiftで動くサーバーの集まりだよ。リーダーノードとコンピュートノードに分かれて、大量のデータを手分けして保存・処理する。必要に応じてノードを増やすと、一気にパワーアップできるんだ。
AWS

Amazon Redshift – Cross-Region Snapshot Copy

スナップショットを別のリージョンにも自動転送して保管する仕組み。地震や停電などでメインリージョンが使えなくなっても、遠くのリージョンで復元できる。大事なデータを世界規模で守りたいときに役立つんだ。
AWS

Amazon Redshift – Spectrum

S3にしまってあるデータを、わざわざRedshiftに全部コピーしなくても“直接SQLで読める”機能だよ。必要な部分だけS3から取り出して分析できるから、膨大なファイルでもコストや時間を節約できるんだ。
AWS

Amazon Redshift – Dedicated Admin Queries

ユーザーの重いクエリでいっぱいでも、管理用のコマンドは別枠で動かせる仕組み。クラスタが詰まっていても管理者が状態をチェックしたりテーブルの変更をしたりできるから、トラブル対応がスムーズになるんだ。
AWS

Amazon Redshift – Concurrency Scaling

同時にアクセスが殺到したら“追加のスピンオフサーバー”を用意して処理を分担してくれる機能。例えば多くの人が同時にクエリを投げても、メインの処理を圧迫せずスムーズに結果を返せるんだ。
AWS

Amazon Redshift – RA3 Nodes

“計算する頭(コンピュート)”と“データをしまう場所(ストレージ)”を切り離して効率よく使える新しいノードタイプだよ。必要なときは計算力だけ増やすなど柔軟に拡張でき、データも安めに保管できるメリットがあるんだ。
AWS

Amazon EMR – Auto Scaling

データ処理が増えたら“まとめて手伝いに来る人”を増やし、減ったら帰ってもらうみたいにクラスターのノード数を自動で調整する機能。これで処理が必要なときだけサーバーを増やし、コストを抑えられるんだ。
AWS

Amazon Redshift – Columnar Storage

データを列ごとにまとめて保存するから、大量データを分析するときに速くなるのが強みだよ。必要な列だけ読み込めばいいので無駄が減り、集計やフィルタが得意。これがRedshiftの高速性の大きな要因なんだ。
AWS

Amazon S3 Glacier – Standard Retrieval

基本的な取り出しモードだね。Expeditedほど急ぎでもなく、Bulkほどゆっくりでもない中間くらいのスピード。費用とスピードのバランスを取りたいときに選ばれる。数時間程度で取り出し可能なイメージなんだ。