スポンサーリンク
Apple社のSiri(シリ)とは
Appleのデバイスで使える人工知能型アシスタントです。
“Hey Siri”でおなじみですね(^^)
「勝利に導く美しい女性」を意味するとのこと。
女神っぽいイメージですね!
この技術は自然言語と音声認識が使われいますので、今回はその知識をご紹介します!
Siriの仕組み(概要)
Siri単体のプログラムだけでは音声を認識できません。
音声を認識した後に音声データを言語データに変換して、その言語を解釈して返答をしているのです!
ざっくりと書くと以下のような図になります。
ではまず音声データを言語に翻訳する手順をみていきます!
スポンサーリンク
音声認識の流れ
では具体的な音声認識の流れをみてみましょう!
- 人の声を見極め ※老若男女の音声データを波形に変換
- ノイズ排除 ※絶音が多いと人の声を理解できませんので、不要な音声を外す処理
- 音波より音の特徴を抽出、数値化
- 数値化した音が何かを分析評価 ※どの文字の特徴と合うか計算する
- 特徴にあった文字を繋ぎ合わせて言語化
音声認識の仕組みをまとめます!
音声認識のポイント
- 雑音は精度を下げる
- 音波より1文字ずつ分析・計算する
では次に自然言語の分析を説明します。
スポンサーリンク
自然言語処理の流れ
流れは4ステップが基本です。
自然言語処理のステップ
- 形態素解析(単語を最小単位にする)
- 構文解析(単語の関係性を知る)
- 意味解析(適切な修飾語が選択されているか)
- 文脈解析(複数の文での指示語が解釈できるか)
図で書くと以下のような感じです。
自然言語の全体の流れ
まとめ
今回Siriの仕組みということでまとめてみました。
音声認識と自然言語の流れは理解できたでしょうか?
AIアプリとは複雑な計算をすることと膨大なデータから特徴をつかむこと精度がよくなる技術です。
そのため、データの使い道を考えるとAIアプリがより進化できるかもしれません。
それでは今日はここまで。