AWS

AWS

AWS DeepLens – Device Console

ウェブ上でカメラを管理し、どのモデルを使うか設定する画面。ファームウェアの更新やWi-Fi接続設定などもここから簡単にできる。複数台をまとめて管理するのも楽だね。
AWS

Amazon Lex – Monitoring

CloudWatchなどでボットがどれだけ会話されているか、何回成功/失敗しているかをグラフで確認。調子が悪いときはログを見て調整できるし、ユーザーが多いときは性能を気にしてスケールも考えられる。
AWS

Amazon Polly – AWS CLI/SDK

プログラムやコマンドラインでポリを呼び出して、音声ファイルを生成できる。大量文章の自動生成やリアルタイム読み上げなど、自分のサービスに組み込むのが簡単にできる。
AWS

Amazon Lex – Automatic Speech Recognition (ASR)

音声を文字に変える技術がLexに組み込まれている。通常はAmazon Transcribeを使う形だけど、Lexがまるっと管理してくれるからセットアップが楽。音声チャットボットの中核になるんだ。
AWS

Amazon Polly – Real-Time Streaming

テキストを少しずつ送り、ポリがそれに合わせて連続した音声を生成してストリーム配信できるモード。大量テキストでも途切れにくく、長い読み上げをリアルタイムで行いたい時に便利。
AWS

Amazon Lex – Lambda Hooks

会話の途中でLambda関数を呼んで、データベースを参照したり外部APIを叩いたりできる。ユーザーからの入力内容を使って処理したり、返す返事を動的に作ったりと柔軟な応答が可能になるよ。
AWS

Amazon Polly – Speech Synthesis Task

長い文書を一括で合成して結果をS3に保存する。再生時間が長いオーディオブックやeラーニング教材を作りたいときに便利。バッチ処理的にまとめてやれば操作がシンプルになる。
AWS

Amazon Lex – Session Attributes

会話の途中で一時的な情報を保存しておく領域。たとえばユーザーIDや途中で入力された好みの設定などを保持して、次の発話で使えるんだ。コンテキスト管理に重要な仕組みだね.
AWS

Amazon Polly – Custom Vocabulary

難しい固有名詞や特別な言葉を正しく読んでほしいなら、独自辞書に追加できる。業界用語や人名の読み間違いが減り、音声コンテンツの品質が向上するんだ。
AWS

Amazon Polly

テキストを読み上げる“音声合成”サービス。文章を渡すと人間っぽい声でしゃべってくれるから、読み上げアプリや案内放送などに活用できる。いろんな言語と声の種類があるよ。