重要：Spresenseウェブサイト移転のお知らせ。詳細はこちらへ

日頃、Sony's Developer Worldをご愛顧いただきありがとうございます。

Spresenseプロジェクトのウェブサイトは2026年1月16日にSony Semiconductor Solutionsのドメインへ移転いたします。新しいウェブサイトのURLは後日ご案内いたしますので、続報をお待ちください。

重要：Microsoft Windows10のサポート終了に関するお知らせ。詳細はこちらへ

現在、SpresenseのWindows開発環境はWindows10およびWindows11をサポートしておりますが、
MicrosoftのWindows10のサポート終了に伴い、Windows10環境のサポートは終了し、以後Windows11のみのサポートとなります。

今後のサポート環境

Arduino Spresenseボードパッケージ：Windows11
Spresense SDK：Windows11（WSL2）

AI画像処理でできること｜画像処理に活用される技術・具体例

AIによる画像処理の活用事例が増えています。現在、AIを活用した画像処理に興味を持っている人も多いことでしょう。この記事はAIによる画像処理とは何か、どのような技術が用いられているか、メリット、活用事例などを解説しています。自社の課題解決の参考にしてください。

AIによる画像処理とは？

ここではAIによる画像処理とは何か、どのような目的に活用されるかを解説します。

そもそも画像処理とは？

画像処理とは、画像を解析して意味を理解するパターン認識技術の1つです。画像処理の技術・目的は大きく分けると、画像の「分類（または認識）」と「検出」の2種類です。

プログラミングによる画像処理においても、AIによる画像処理においても、この定義と目的は変わりません。

AIによる画像処理の技術1：分類（認識）

画像処理の技術の1つである分類（認識）は、さらに「物体認識」と「シーン認識」に分類できます。

物体認識とは、たとえば画像の生物が犬なのか猫なのか判別することです。AIによる画像認識では、カメラ画像から人の年齢・性別を判定したり、手書きの文字をテキストデータに変換したりする製品・アプリケーションが実用化されています。

また、シーン認識とは、たとえば、芝生・ボール・ゴール・2種類の服を着た複数の人物が写っている写真から、サッカーという全体のシーンを認識することです。この技術は、SNSに投稿された写真を自動分別する機能などで活用されています。

AIによる画像処理の技術2：検出

検出という画像処理技術は、物体検出と領域検出に分けられます。

物体検出とは、目的の物体を検出して位置を特定する技術です。たとえば監視カメラの画像から人間を検出すると、その人物を追尾して記録し続ける機能などに応用されています。

領域検出とは、画像内にある物体の境界線を見つけ出す技術です。たとえば文書のなかで手書きの記入欄の範囲を特定して、領域を切り出すなどの例が挙げられます。

物体検出と領域検出では、形や色、動作のパターンなどさまざまな特徴によって画像処理を行います。

画像処理で用いられるAIの技術

ここでは、AIの画像処理に用いられている「ニューラルネットワーク」「機械学習」「ディープラーニング」について紹介します。

機械学習

AIたとえば、数字や文字の特徴を機械学習することで、手書き文字を検出できるようになります。また、工場で製造した商品の不良品を検出する機能なども実現可能です。

ニューラルネットワーク

ニューラルネットワークは人間の脳神経回路を数学的なモデルにしたものです。たとえば手書きで書かれた「A」という文字を認識する際は、縦線、横線などの情報を、重みづけを変えて「入力層→隠れ層（中間層）→出力層」と受け渡すことで、画像を認識します。

AIによる画像処理の学習には、膨大な画像データが必要です。そのため、機械学習で画像情報を入力する手間を省くために、重要な情報を失わずに学習しやすい形式に変換する画像処理技術が使われることもあります。

ディープラーニング

ディープラーニングは機械学習の一種に含まれますが、より複雑な処理を可能にした手法です。機械学習では人が特徴を定義して教える必要があるのに対し、ディープラーニングは自ら特徴をみつけ出せます。

ディープラーニングによって、たとえば猫とライオンの赤ちゃんの分類など、定義づけが難しい画像処理も行えるようになりました。

ディープラーニングのAIを画像処理に活用するメリット

ディープラーニングのAIは、機械学習よりも精度の高い画像処理が可能であること、チューニングの労力を減らせることがメリットです。それぞれについて解説します。

特徴が違う物体の画像処理もできる

ディープラーニングは特徴を自ら学習します。したがって、同じAIでも、人間による定義づけなしで、特徴が違う物体の画像処理ができるようになります。たとえば、良品と不良品の違いには、傷や欠け、汚れ、シールの貼り忘れなどさまざまなパターンがあるでしょう。これらすべてに同じAIで対応できます。

近年はベンダーが開発したAIを用いる事例も増えました。既存のAIを活用することで、画像処理システムの開発は、比較的容易になっています。

チューニングにかかる負担が少ない

AIなしの画像処理では、プログラムやアルゴリズムの修正に多くの手間がかかります。機械学習においても、人間による定義づけや学習用データの作成に多くの労力が取られます。一方、ディープラーニングのAIは自律的に学習を続けるため、チューニングにかかる技術者の負担が少ないことが特徴です。

ただし、学習用データを大量に集めることが負担になる場合があることに注意が必要です。たとえば工場向けのAIの学習初期で一般的な画像を使うことがあるのは、特定の種類の画像を大量に用意するのが難しいからです。

AIによる画像処理の具体例

ここからは、製造業や農業、医療業など、各分野のAIによる画像処理の具体例を紹介します。

AIによる画像処理1：工場での品質検査

産業用途でとりわけ需要が高いのは、製造品の品質検査、検品です。不良品を画像処理で検出してファクトリーオートメーションが実現できれば、業務効率が高まるうえ、人件費削減にもつなげられるからです。

また、生産設備の検査を行うことで、品質を高める技術も実用化されています。たとえば、画像処理と音など複数のセンサーを用いて機器の不調を検知したり、未然に故障を警告したりするAIが実用化されています。

AIによる画像処理2：スマート農業

スマート農業とは、IT技術やIoTを活用した農業のことです。たとえば、ドローンに搭載したカメラで作物の状態をモニターし、害虫が発生した場所だけに農薬を散布するなどが行われています。

スマート農業におけるAIでは、主に色による分類が活用されています。作物の害虫や病気、果実の熟れ具合などは、色の特徴によって画像処理しやすいからです。

AIによる画像処理3：新型コロナウイルス肺炎をAIによる画像解析で解析

CT画像をAIで解析して新型コロナウイルス肺炎を検出する技術も登場しています。現状では、人による診断よりも正確な判断が可能になっているということです。

このようなAIによる画像処理が可能になった要因の1つは、膨大なデータが用意できたことです。AIの学習用データとして、世界中の1億6千万以上のCT画像が入力されたといいます。

AIによる画像処理4：特徴量抽出による顔生成

画像認識と画像生成を組み合わせる技術が注目を集めています。たとえば、生成モデルの1つである「GAN」では、存在しないアイドルの顔を生成できます。また、人の写真からアニメのキャラクターを作り出すことも可能です。

GANには、敵対的生成ネットワークという技術が用いられています。GANはジェネレータという本物に似た偽物を作る処理と、ディスクリミネイターという本物と偽物を見抜く処理を分離していることが特徴です。いわば怪盗と探偵が敵対するように学習することで、従来のディープラーニングでは実現できなかった、高度な画像生成が可能になりました。

AIによる画像処理5：車やドローンの自動運転

自動車やドローンの自動運転には、AIによる画像処理が不可欠です。たとえば人や障害物を認識して正しい走行ルートを選ぶために、画像処理が活用されています。また、自動衝突回避機能は、高級車だけでなく一般的な車に搭載されるほど普及しました。

このようなAI×IoTデバイスの活用事例は広がっています。解析用AIとセンサーが一体型になっていることで通信によるタイムラグが生じず、コスト面や小型化の観点からもメリットが多いからです。

たとえば、「Spresense」にはGPS受信機能や加速度、地磁気、気圧センサーが搭載されています。これらと学習済みAIが連携することで、ドローンの姿勢制御、衝突予測などを含めて、エッジ（端末）でリアルタイムに自動運転が可能です。

AI画像処理システムを効率的に開発するには？

AIやIoT活用の基盤を自社で一から開発するのは難しいことです。高度な技術が要求されるため、自社の人材育成からスタートしなければならない企業も多いでしょう。

最近では、Neural Network Consoleのようにプログラミング技術を持っていなくても、手軽にAIを作成できるツールなども充実してきました。また、簡単にAIやIoTを試せるようなシングルボードコンピュータのようなHWもたくさん発売され、かなり手軽にAI画像処理システムを構築できるようになってきました。

SpresenseとNeural Network Consoleを用いれば、AIについて深い知識がなくても、さまざまな課題を解決する画像処理が実装できます。

まとめ

AIによる画像処理の活用範囲は広がっています。工場での品質検査やスマート農業、ドローンの自動運転など、すでに実用化されている事例は多数あります。画像処理用AIを開発するには、既存のソフトウェアやハードウェアをベースにすることが効率的です。

「Spresense」は、センシングカメラやドローン、スマートスピーカーなどのIoT端末の活用に興味がある人におすすめです。IoT向けスマートセンシングプロセッサ搭載ボード「Spresense」は、省電力と高い信頼性、演算能力を備えています。複数マイクでの集音など各種センサーとの連携も可能で、精度の高い画像処理が可能です。

Spresenseドキュメントサイトはこちら