説明可能な AI
AI ビジョンを見て理解して、評価する
人工知能による画像処理である AI ビジョンは、さまざまな議論がなされているテーマです。しかし産業用途などの多数の分野で、新しいテクノロジーはまだ完全には導入されていないため、長期的な経験値が不足しています。市場には AI を産業環境で使用できる組み込みビジョンシステムもありますが、多くの施設事業者は、このようなプラットフォームのいずれかを購入してアプリケーションをアップグレードするには二の足を踏んでいます。しかし、AI はすでに先駆的な新しい可能性を開拓しており、このような分野はルールベースの画像処理のルールでは対処しきれず、現在まで解決方法がありません。それでは、新しいテクノロジーの迅速な普及を妨げている要因は何でしょうか。
今や、誰もが自分の AI ベースの画像処理アプリケーションを、人工知能や、これもやはり必要なアプリケーションプログラミングの特殊知識がなくても、すでに設計できる時代になっているからです。人工知能は多数の作業プロセスを高速化し、エラーの発生源を減少させますが、エッジコンピューティングによっても、高価な産業用コンピューターや高速画像データ転送に必要となる複雑なインフラストラクチャを排除することができます。
新しい強み
しかし、AI や機械学習 (ML) は、従来のルールベースの画像処理とはまったく異なる方法で機能します。それに従い、画像処理タスクのアプローチや処理方法も変化します。結果の品質は、以前のように、画像処理の専門家によって手動で開発されたプログラムコードの成果ではありません。そうではなく、適切な画像データを使用したニューラルネットワークの学習プロセスによって決定されます。言い換えると、検査に関連する物体の特徴は、事前定義されたルールで事前に決定されず、トレーニングプロセスにおいて AI がそれ自身で認識するように学習させる必要があります。トレーニングデータのばらつきが大きければ、後の運用において ML アルゴリズムで実際に関連する特徴を認識する確率が高くなります。簡単に思われることでも、十分な知識と経験がなければ望ましい目標を達成できません。正しい画像データに対する熟練した検査眼がなければ、ここでもエラーが発生します。つまり、機械学習手法を運用するための主要な能力は、ルールベースの画像処理とは同じではないのです。しかし、何もないところから実体を理解して、新しい能力を構築する時間や人的資源が誰にでもあるわけではありません。それこそが、新しい物事に関する問題で、すぐには生産性を発揮できないのです。実際にあまり労力をかけずに良い結果を出せたとしても、明確には再現できないため、確信や信頼することは困難です。
複雑さと誤解
合理的に考えるなら、この AI ビジョンの動作の仕組みを知りたいと思うでしょう。しかし、認識でき、理解できる説明がなければ、結果の評価は困難です。新しいテクノロジーにおける確信はスキルと経験に基づいて得られますが、この確信を築くには数年がかかり、テクノロジーで何ができるか、どのように動作するか、どのように使用し、どのように制御するかを知るのはその後になります。さらに物事を複雑にするのは、AI ビジョンは確立したシステムに対して設定されているという点で、このシステムには近年、知識、ドキュメント、トレーニング、ハードウェア、ソフトウェア、開発環境により、適切な環境条件が整備されています。一方で AI は、荒削りで手付かずな状態と思われています。既知のメリットや AI で達成できる高精度にもかかわらず、エラーの診断は困難であることがよくあります。動作の仕組みが不明確だったり、結果が説明できないという面もあり、アルゴリズムの普及を阻んでいます。
ブラックボックス (ではない)
ニューラルネットワークの動作方法は一般に、どのように決定したのか理解できないブラックボックスと誤解されています。「DL モデルは間違いなく複雑ですが、ブラックボックスではありません。むしろ、ガラスボックスと呼ぶほうが正確です。文字通り中を見て、各コンポーネントが何をしているのか確認できるのですから」 [「The black box metaphor in machine learning」からの引用]。ニューラルネットワークの推論決定は理解できる従来のルールをベースとしておらず、その人工ニューロンの複雑な相互作用は人間には簡単にはわかりませんが、数学的システムの結果であるため、再現可能で分析可能です。まだ足りないのは、私たちをサポートする適切なツールです。AI のこの分野では、改善の余地がまだまだあります。これは、市場のさまざまな AI システムが今後の開発によってユーザーをうまくサポートできることを意味します。
ソフトウェアで AI を説明可能にする
この理由から、IDS Imaging Development GmbH はこの分野で、関係機関や大学との共同研究および共同作業により、これらのツールの開発に取り組んでいます。IDS NXT Experience Kit 推論カメラシステムにはすでにこの協力の成果が含まれています。いわゆる混同行列を使用する統計分析により、トレーニング済みニューラルネットワークの品質を決定し、理解できます。トレーニングプロセスの後、既知の結果を持つ、以前決定された一連の画像でネットワークを検証できます。期待された結果と推論によって実際に決定された結果が、テーブルとして比較されます。トレーニング済みの各物体クラスで、テスト物体が正しく認識されたか、認識されなかったか、頻度を明確に確認できます。このヒット率から、トレーニング済み CNN の全体的な品質がわかります。さらに、認識精度が実稼働で使用するにはまだ低すぎる領域が、行列からはっきりと見て取れます。ただし、その理由は示されません。
この混同行列はネジを分類する CNN を表わしており、さらに多くの画像で再トレーニングして識別品質を向上できる部分を示しています。
ここでアテンションマップを使用して、ニューラルネットワークからの反応が最も高く、決定に影響を及ぼす領域または画像コンテンツをハイライトする、一種のヒートマップを示します。IDS lighthouse でのトレーニングプロセスにおいて、このような視覚化形式の作成が、トレーニング中に生成された意思決定パスに基づいてアクティブ化され、分析中にこのようなヒートマップを各画像からネットワークで生成できます。これにより、AI による重要な決定や説明が困難な決定の理解が容易になり、結果として、ニューラルネットワークの産業環境での受け入れが高まります。
データのバイアスの検出と回避にも使用できます (図「アテンションマップ」を参照)。バイアスがあると、ニューラルネットワークが推論中に誤った決定を下しかねません。これが、ニューラルネットワークだけではスマートにはなれない理由です。入力品質が低いと、出力も低くなります。AI システムがパターンを認識して予測するためには、「正しい振る舞い」を学習できるデータを利用します。使用される用途を表現していないデータによるラボ条件で AI が構築されていたり、データのパターンにバイアスがあったりすると、システムはこうしたバイアスに沿って調整されます。
このヒートマップは従来のデータバイアスを示しています。ヒートマップはバナナの「Chiquita」ラベルに向けられた高い注目を視覚化し、データバイアスの好例となっています。バナナの誤った画像や正しく表現していない画像のトレーニングにより、使用された CNN はこの「Chiquita」ラベルはいつもバナナを指していることを学習しました。
これらのソフトウェアツールを利用して、ユーザーは IDS NXT AI の動作と結果を直接トレースしてトレーニングデータセット内での弱点を突き止め、的を絞った方法で修正できます。これにより、AI の挙動がさらに説明可能になり、誰にとっても理解しやすくなります。つまるところ、基本的には数学と統計なのです。数学の解釈と理解は簡単ではないこともありますが、混同行列とヒートマップは、決定を下すツールと、決定を視覚化して理解できるようにする根拠となります。
まだ始まったばかり
正しく使用すると、AI ビジョンには多数のビジョンプロセスを向上させる可能性があります。しかし、ハードウェアの提供だけでは、AI を業界に全面的に普及させるには不十分です。メーカーは、ユーザーフレンドリーなソフトウェアと組み込みプロセスとして、専門知識をユーザーと共有してサポートするという課題を抱えています。数年掛けて進化し、固定顧客ベースと大量のドキュメント、知識転移、多数のソフトウェアツールで構築されているベストプラクティスと比較すると、AI にはまだやるべきことがたくさんありますが、すでに開発作業は始まっています。標準と認定も現在作成中で、受容度と説明可能性解を強化し、AI を幅広く普及させようとしています。IDS がそのお手伝いをします。IDS NXT Experience Kit では、組み込み AI システムをすでに利用でき、産業ツールとしてすばやく容易にできます。総合的でユーザーフレンドリーなソフトウェア環境により、機械学習、画像処理、アプリケーションプログラミングの深い知識がなくても、どのようなユーザーグループも便利に使用できます。
詳細情報
- IDS NXT 組み込みビジョン AI プラットフォームの詳細を、製品 Web サイトでご確認ください。
- IDS NXT Experience Kit 推論カメラソリューションでディープラーニングテクノロジーに容易に参入する方法を、技術記事「あらゆる人のための AI」で紹介しています。
- deep ocean core をカメラプラットフォームの FPGA ソリューションとするメリットの詳細は、技術記事「持続可能なエッジインテリジェンス」をお読みください。