AWS

AWS

Amazon Comprehend – Custom Entities

自分の業界用語や特殊単語を学習させて、独自の固有名詞を抽出できるようにする機能。例えば薬品名や部品名などを“製品”として識別したいときに使う。特別な専門領域に対応できるんだ。
AWS

Amazon Textract – Output in JSON

解析結果をJSON形式で受け取れるから、プログラムで後処理しやすい。どこがテーブルでどこがフォームかもタグで付いてくるので、2次加工やデータベース登録を自動化できるんだ。
AWS

Amazon Comprehend – Custom Classification

独自のラベルを定義して文章を分類できる。例えば“クレーム”“要望”“褒め言葉”など、自社独自のカテゴリを使って仕分け可能。事前にモデルを学習させておけば精度の高い分類ができるんだ。
AWS

Amazon Textract – Confidence Scores

“どれくらい正しく読めたか”を数値(信頼度)で示してくれる。たとえば90%なら大体合ってる、75%ならちょっと怪しいかも…と判断して、人間が再チェックする基準にできる。
AWS

Amazon Comprehend – Topic Modeling

たくさんの文章を自動でグループ化し、どんな話題(トピック)があるかを見つける機能。大規模アンケートの回答をざっくり分類するなど、データから見えないパターンを掘り起こせるんだ。
AWS

Amazon Textract – Key-Value Pairs

フォームの“項目名(キー)”と“答え(バリュー)”を自動ペアにして抜き出す。申込書の氏名、住所、電話番号…みたいにまとめて取れるから、後から探して関連づける苦労がいらないんだ。
AWS

Amazon Comprehend – Batch Processing

大量の文書を一度に送って“まとめて分析”してもらえる。数千~数万件の文章があっても一括処理できるから、夜中に走らせて翌朝には結果を受け取るようなバッチ分析に向いてるね。
AWS

Amazon Textract – Security & Encryption

処理するデータは安全に暗号化され、AWS内部で機械が読み取るだけ。書類がインターネットに流出しないよう配慮していて、機密情報も安心して任せやすい。
AWS

Amazon Comprehend – Real-time Analysis

1文や少量の文章に即座に結果を返すAPIモード。チャットやメールをリアルタイムに感情分析するなど、すぐにレスポンスが必要なシナリオで便利。オンデマンドに呼び出せるんだ。
AWS

Amazon Textract – IAM Policies

誰がTextractを使っていいか、処理ジョブを実行できるかを細かくコントロール可能。誤って大量の書類を読み取って料金がかさんだり、機密データを見られたりしないよう守れるんだ。