AWS

Amazon Comprehend – Encoding Support

テキストの文字コード(UTF-8など)に対応していて、日本語や英語など幅広い文字もOK。文字化けしにくく、大量の言語ファイルを混在させても解析が進められる。
AWS

Amazon Comprehend – Confidence Scores

どれくらい確信を持って“これはポジティブ”と判断しているか、数値でわかる。高ければ信用度が高いし、低いなら人間の再チェックが必要かもしれない。仕分けラインを設定するときに使える。
AWS

Amazon Comprehend – IAM Policies

誰がこの分析を呼び出せるか、どのモデルをカスタム学習できるかなどを制限できる。大量データを間違って分析しちゃったり、他人のモデルを上書きしたりしないよう守れるんだ。
AWS

Amazon Comprehend – AWS Lambda Integration

テキストがアップされたらすぐロボット(Lambda)を呼んで分析→結果を保存といった自動化が簡単。新しいレビューや投稿が来たらリアルタイムに感情判定するなどの仕組みを組みやすい。
AWS

Amazon Comprehend – Output to S3

分析結果をJSONなどの形式でS3に保存することが可能。後から別のツールで集計したり、レポートを作ったりする場合に便利。大規模バッチ分析をさらに加工したい時に合うんだ。
AWS

Amazon Comprehend – Personal Identifiable Information (PII) Detection

文章から電話番号や住所などの個人情報を見つけてマスキングできる。個人情報を含むテキストを安全に保管・共有するための前処理として使うと、プライバシー保護に役立つんだ。
AWS

Amazon Comprehend – Medical (Comprehend Medical)

医療分野の特別用語や診断情報を抽出してくれる派生サービス。患者のカルテや処方箋に書かれた薬名、症状などを正確に分けて取り出せる。医療現場のデータ整理に強いんだ。
AWS

Amazon Comprehend – Real-time Analysis

1文や少量の文章に即座に結果を返すAPIモード。チャットやメールをリアルタイムに感情分析するなど、すぐにレスポンスが必要なシナリオで便利。オンデマンドに呼び出せるんだ。
AWS

Amazon Comprehend – Batch Processing

大量の文書を一度に送って“まとめて分析”してもらえる。数千~数万件の文章があっても一括処理できるから、夜中に走らせて翌朝には結果を受け取るようなバッチ分析に向いてるね。
AWS

Amazon Comprehend – Topic Modeling

たくさんの文章を自動でグループ化し、どんな話題(トピック)があるかを見つける機能。大規模アンケートの回答をざっくり分類するなど、データから見えないパターンを掘り起こせるんだ。