proxmox.blog

AWS

Amazon Comprehend – Encoding Support

テキストの文字コード(UTF-8など)に対応していて、日本語や英語など幅広い文字もOK。文字化けしにくく、大量の言語ファイルを混在させても解析が進められる。

2025.02.22

AWS

どれくらい確信を持って“これはポジティブ”と判断しているか、数値でわかる。高ければ信用度が高いし、低いなら人間の再チェックが必要かもしれない。仕分けラインを設定するときに使える。

2025.02.22

AWS

誰がこの分析を呼び出せるか、どのモデルをカスタム学習できるかなどを制限できる。大量データを間違って分析しちゃったり、他人のモデルを上書きしたりしないよう守れるんだ。

2025.02.22

AWS

テキストがアップされたらすぐロボット(Lambda)を呼んで分析→結果を保存といった自動化が簡単。新しいレビューや投稿が来たらリアルタイムに感情判定するなどの仕組みを組みやすい。

2025.02.22

AWS

分析結果をJSONなどの形式でS3に保存することが可能。後から別のツールで集計したり、レポートを作ったりする場合に便利。大規模バッチ分析をさらに加工したい時に合うんだ。

2025.02.22

AWS

文章から電話番号や住所などの個人情報を見つけてマスキングできる。個人情報を含むテキストを安全に保管・共有するための前処理として使うと、プライバシー保護に役立つんだ。

2025.02.22

AWS

医療分野の特別用語や診断情報を抽出してくれる派生サービス。患者のカルテや処方箋に書かれた薬名、症状などを正確に分けて取り出せる。医療現場のデータ整理に強いんだ。

2025.02.22

AWS

1文や少量の文章に即座に結果を返すAPIモード。チャットやメールをリアルタイムに感情分析するなど、すぐにレスポンスが必要なシナリオで便利。オンデマンドに呼び出せるんだ。

2025.02.22

AWS

大量の文書を一度に送って“まとめて分析”してもらえる。数千～数万件の文章があっても一括処理できるから、夜中に走らせて翌朝には結果を受け取るようなバッチ分析に向いてるね。

2025.02.22

AWS

たくさんの文章を自動でグループ化し、どんな話題(トピック)があるかを見つける機能。大規模アンケートの回答をざっくり分類するなど、データから見えないパターンを掘り起こせるんだ。

2025.02.22

AWS