Spresense - エッジコンピューティングを低消費電力で

Spresense で乾電池でも動く本格的なエッジコンピューティングを体験してみませんか?

最新情報はこちら

AI技術が活用される分野とは?AI技術の基礎から事例紹介まで詳しく解説!

人工知能であるAIは、近年目覚ましい成長を遂げ、色々な業界から注目を集めています。幅広い業界で技術を応用できるようになったので、人手不足の解消や省人化を図るために、AI技術の導入を検討している人も多いのではないでしょうか。本記事では、AI技術について解説していきます。AIを導入する際の参考にしてください。

目次

AIについて

以下ではAIの名称、技術や概念、歴史について深掘りしていきます。

AIの名称について

略称であるAIの呼び名が定着していますが、正式名称は「Artificial Intelligence」です。直訳するとArtificialは“人工的な”、Intelligenceは“知能や思考力”という意味ですが、日本では人工知能を指す言葉として用いられています。

AI技術・概念

AIは様々な業界で注目されている技術ですが、具体的に何に取り組めば良いのかピンと来ない人も多いのではないでしょうか。

それもそのはずで、AIとは技術や概念を指す言葉で、具体的な方法を指し示す言葉ではありません。

人間に代行する知能、人間には成しえないスピードで情報を処理する技術こそがAIの骨頂で、導入時はAIに何をさせたいのか考える必要があります。

AIがあれば実現可能な施策を従業員間で共有すると、導入に踏み切りやすくなるでしょう。

AI技術と歴史

近年注目を集めているAI技術ですが、実はブームが到来するのは歴史上3回目の出来事で、1956年には既に「人工知能」が誕生しています。AIの歴史を振り返ると、より深い知識を身につけるのに役立ちます。

ルールベース技術

「人工知能」という言葉が誕生したのは1956年のことで、米国東部で開催されたダートマス夏期研究会で発表されました。当初は推理と探索が主な機能で、指示通りに場合分けを繰り返し、答えを見つけるという動きに特化していました。

その後、改良が繰り返されますが、1980年代までは前提条件にもとづいて答えを判断する“ルールベース”の技術開発に力が注がれています。1980年頃には2回目のAIブームに突入し、膨大な知識の中からより正確な答えを探すプログラムへと変化を遂げています。

機械学習技術

3回目のAIブームが到来したのは、2012年の「Googleの猫」が発端だといわれています。猫の膨大なデータをインプットさせたニューラルネットワークをもとに、AIが猫の画像を判別できるようになったというものです。

従来までの画像をただ分類するだけのAIとは異なり、人間の思考回路の構造を真似てつくられているのが特徴です。猫の写真をいくつもの要素に分類して、重みづけをすることで精度の高い判断を下せるようになりました。後の深層学習の原型となる、画期的な機械学習技術として注目されました。

深層学習(ディープラーニング)

ディープラーニングとは、ニューラルネットワークで数段階に分けていた層を、さらに数段階深く掘り下げた学習方法です。中間層の多層化、ディープニューラルネットワークを築くことで、より精度の高い判断を下せるようになっています。

画像の特徴量を人が設定していたときとは異なり、自動で特徴量を何層にも細かく分類してくれるので、誤判断が少なく時間を削減できます。つまり、ディープラーニングとは、AIが教師なし学習で自動分類して答えを導きますが、最終的には教師あり学習で正誤を人が判断する学習法です。正解した特徴量からさらに精度を突き詰めていくことで、人が判断しなくても正解を導けるようになります。

AI技術の構成要素と流れ

AI技術の構成要素は、インプット・解析・アウトプットの3つです。大量の知識をインプットさせ、データの解析方法を与えて、答えをアウトプットするまでが一連の流れとなっています。

インプット

AI技術では、解析対象となる膨大なデータをインプットする必要があります。POSデータ・株価・Web・アクセスログなどの構造化データ、画像・動画・音声・テキストなどの非構造化データを用いて解析させます。どのような結果を得たいのか、アウトプットを考慮したデータをインプットして学習させることが大事です。

解析方法

解析方法は、ルールベース・機械学習・深層学習といった具合に年々進化しています。どの解析法を取り入れるかは、広範囲なデータから精度の高い情報を抽出したいのか、狭い範囲から特定の情報を取り出したいのかによって異なります。人間に判断がつかない最適解を導き出す解析方法を望むなら、「深層強化学習」を使うのも一つの手です。

アウトプット

アウトプットはAI技術の利用方法のことで、分類・予測・制御など様々な分野に応用されています。身近なところでいうと、ロボット掃除機の自動制御や車の自動運転技術、チャットボットや商品のレコメンド機能に使われています。

さらに、2021年の秋には、国内で初めて医療用人工知能の医療機器承認を目指して臨床試験が行われるなど、幅広い業界に活用されているのが特徴です。

AIの種類

以下に、AIの種類について解説していきます。AI技術を導入する際の目安にしてください。

特化型AI

個別の領域に特化しているAIを、特化型AIと呼びます。専門的な分野で力を発揮するため、画像認識・自動運転技術・囲碁や将棋などのゲームの対戦相手・音声や文書の言語認識に活用されています。実用化されているAIは、今のところ全て特化型です。

汎用型AI

汎用型AI、通称AGIはまさに今研究がなされている分野で、1つのシステムで複数の知的作業をこなせる汎用人工知能です。とはいえ、膨大なニューラルネットワークが必要となるので、60年以上前から研究されていますが、実現するにはまだ時間がかかるといわれています。

エッジAI技術の普及

エッジAIは、エッジコンピューティングとAIを掛け合わせたもので、端末に搭載されたAIのことを指しています。従来のクラウドAIではネット上で処理をしなければならないので、膨大なデータを解析できる反面、負荷が大きく実現が難しい場面もありました。

しかし、エッジAIなら手元で瞬時に正誤を判断してくれるため、従来よりも時間を短縮できるというメリットが得られます。

【AI技術①】画像解析

ここからは、AI技術の画像解析について、さらに深掘りしていきます

AIの画像解析技術とは

AIの画像解析技術とは、画像から様々な情報を抽出して、統計的なデータを獲得する方法です。機械学習を利用することで、決められた前提条件をもとに、解析から結論までを一貫して処理できます。ただし、人が特徴量の抽出を行うと膨大な時間がかかるので、深層学習を使って特徴量の抽出を自動化させる方法もあります。

AIの画像解析の活用例

不良品検知

AIの画像解析を使って不良品の検知をさせるなら、まずは良品の画像を徹底的にインプットさせます。良品の特徴量を抽出し、条件に合わない物を不良品として判断させれば、不良品を自動検出することが可能です。深層学習を使って精度を高めていけば、不良品の検査に割く人員を削減できるでしょう。

侵入検知

人・車・動物などを瞬時に判断できるAIの画像解析を使えば、侵入検知として活用することも可能です。まずは進入禁止エリアの画像をインプットさせます。人や動物が侵入し、あらかじめインプットさせた情報と異なる状態になった際は、AIが自動的に検知・通報してくれます。警備にかける人員やコストを削減できます。

人の識別

AIの画像解析は、事前に登録した人物との照合にも用いられています。入退出管理はもちろん、防犯対策にもなります。入退出管理をする受付業務の効率化が図れます。

【AI技術②】音声認識

ここからは、AI技術の音声認識について解説していきます。

AIの音声認識技術とは

AIの音声認識技術とは、音声を解析して、言葉の内容・文脈から多種多様な情報を抽出する技術のことです。ディープラーニングを用いれば、画像解析と同様に音響分析で特徴量を抽出して、予測を付けて文字起こしも可能です。録音データ・リアルタイムの音声どちらも解析ができます。

AIの音声認識の活用例

キーワードによる機器の制御

AIの音声認識を活用すると、特定の単語あるいは短い文章を検出し、音声だけで機械に特定の動きをさせることが可能です。天気予報を聞き出したり、音楽を流したりと操作を簡単にできます。既に、エッジAI技術と組み合わせて、音声操作を可能にしたスマホやパソコンも普及しています。クラウドAIで音声認識を活用するよりも負担が軽く、時間や消費電力を削減できて便利です。

音声解析による異常検知

AIの音声解析で、人の聴覚に近い判断基準を組み込むと、異常検知に活用できます。正常な状態の情報をインプットすれば、機械やモーターの故障といった異常音が検出されたときだけ、異常事態だと判断させることが可能です。

早期に故障を発見できるほか、予防保守にも役立ちます。エッジAIで機械自体に異常検知を組みこむと、リアルタイムで検知できるので作業の効率化が図れるでしょう。

音声のテキスト化

音声解析の技術を使うと、スピーチや会話といった音声データを文字起こしできます。既に、コールセンターで顧客とのやり取りを文字起こしするのに使用されたり、会議の議事録作成に役立てられたりしています。

人の感情を認識

AIの音声技術で、大規模な音声のデータをもとに、トーンなどの特徴量から感情のラベリングを行うと、人の感情を予測することが可能です。カウンセリングやコールセンターなどで用いると、接客の向上に繋がります。

話者を識別

話者の音声データを解析しておけば、複数人で会話しても、発言者を識別できるようになります。インタビュー・会議の文字起こしも楽にできるので、コアな業務に時間を割くことが可能です。

【AI技術③】自然言語処理

これより先は、AI技術の自然言語処理を掘り下げていきます。

AIの自然言語処理とは

AI技術を使えば、人が自然に用いる言葉を解析できます。多言語でも解析が可能で、多少誤字脱字があっても言葉を予測して翻訳してくれます。また、インプットした情報をもとに前後関係や意味を予測し補完するので、膨大な文書の要約や分類はもちろん、チャットボットにも使用することが可能です。

AIの自然言語処理の活用例

応答や回答

AIで自然言語処理を行えば、あらかじめインプットさせたマニュアルをもとに、顧客の質問に自動で回答できるようになります。多少ニュアンスが異なっても、FAQのデータを引っ張れるため、コールセンターの問い合わせ数を減らすのに役立ちます。カスタマーセンターや受付業務の省人化が図れるでしょう。

自動翻訳

AIの自然言語処理を用いると、異なる言語でも自動で翻訳できます。従来は単語ごとに翻訳していましたが、さらに細かく特徴量を見つけるので、自然な文書へと翻訳することが可能です。語順や文書に誤りがあっても補完するため、言語の異なる人とも円滑なコミュニケーションが取れるようになります。ディープラーニングにより、ますます精度は向上しています。

必要な情報を抽出

AIの自然言語処理により、発注書や請求書の情報抽出が容易になります。特定言語を抽出して分類する作業を自動化できるため、バックオフィスの業務効率が良くなり、属人化を防止できます。

エッジで活用されるAI技術

近年、サーバーやクラウドを用いたAI技術では負荷が大きいことや、現場でリアルタイムに対応したいなどのモチベーションにより、エッジAIが求められ始めています。これらのエッジAIにも上記のAI技術は活用されています。端末に画像解析や音声認識などのAI技術を搭載することで、サーバーやクラウドとのやり取りを削減し、M2Mなどによりリアルタイム応答が可能になります。

まとめ

AIは人工知能の技術や概念を指すだけなので、画像・文書・音声など何を解析したいのかは具体的に指示を出す必要があります。方向性が決まってAIを導入する際は、ソニーセミコンダクタソリューションズの「Spresense」を用いると、Arduino IDE で手軽にマルチコアプログラミングを楽しめます。また、「Neural Network Console」と連携を図れば、難易度の高いエッジAIシステムも簡単に構築することが可能です。「Spresense」については、下記からお試しください。

Spresenseドキュメントサイトはこちら