AI - おもちゃか産業ツールか

これは現在よく議論されている疑問です。答えは一般に、人によって異なります。認知され、最終的に使用されるためには、技術が何を達成すべきか、どのような機能を提供すべきか、ユーザーごとに期待が異なるからです。いずれの場合も、生産的で効率的な用途に向けて必要なハードウェアは存在しています。マシンビジョンハードウェアの多くのメーカーではこのことを理解しています。さまざまなクラスのパフォーマンスを発揮する AI プラットフォームが、着実に増加しています。それでも当初の問題がまだ残ります。ハードウェアだけを提供しても不十分です。思考方法を変えることが必要です。

AI に足りないものは何でしょうか。

AI や機械学習 (ML) がルールベースの画像処理とはまったく異なる方法で動作し、ビジョンタスクのアプローチと処理も異なることは、動かしがたい事実です。結果の品質も、手動で開発されたプログラムコードの製品ではなく、適切な画像データによる学習プロセスによって決定されます。簡単に思われることから、十分な知識と経験による望ましい目標が導かれます。正しいデータでトレーニングしなければミスが頻発し、ML 手法が誤って適用されることになります。テストにより、同じタスクに対して、さまざまなユーザーが作成した人工ニューラルネットワーク (ANN) の品質が大きくことなることがわかっています。この理由の一部が、重要性の低いコンテンツの過多、露出不足、ぼやけ、さらには誤ったラベルを持つ画像がトレーニングに使われていることです。

ML 手法を扱うために重要な能力は、ルールベースの画像処理とは異なり、専用に構築しなければなりません。今、操作、テスト、調査に割ける時間とリソースを持っていれば、経験を積んで落とし穴を知ることができます。これが比較的新しく若い会社が目下取り組んでいる理由と思われます。こうした企業には過去がなく、既存のプロセスにとらわれず、時には遊び心を取り入れながら実験的な試みを大いに取り入れ、従来の画像処理では今のところ解決策がないようなタスクに挑んでいます。しかし、大手企業が新テクノロジーを全面的に顧客に導入せず、強力な事例がまだないうちは、知識と信頼がありません。これは顧客側にとっても同じです。「熟練者」を心地よい状態から動かすには、何かを変えなければなりません。AI は確立されたシステムに対面しており、このシステムには適切な環境条件が近年作成されているからです。知識、ドキュメント、トレーニング、ハードウェア、ソフトウェア、開発環境、顧客認知度、需要が成熟するまで、長い時間がかかりました。一方で AI は、荒削りで手付かずな状態と思われています。AI を習得したというと賞賛や感嘆の対象となりますが、懸念や無理解に対面することもあります。

もう 1 つの重要な面は、新しいターゲットグループです。業界誌『inVISION』の編集長でこの分野の専門家である Dr.-Ing. Peter Ebert は、次のように語っています。「将来のビジョンコミュニティは従来の画像処理の専門家だけで構成されるのではなく、IoT 分野からの人材で成長していきます」。 新しいユーザーグループにより、さまざまなユースケースと既存テクノロジーの使用に対する要件が生まれることは明らかです。従来のプログラミング SDK では不十分な場合もあります。古いルールは壊さなければなりません。

パイオニアとしてのソフトウェア

適切なハードウェアは十分にあります。効率的に動作する AI アクセラレーターにより、小型の低消費電力組み込みビジョンシステムや、すでに個々のメーカーから提供されている完全統合された推論カメラプラットフォームなどへの ML の活用の可能性が生まれます。しかしこれだけでは、業界での新テクノロジーが持つ初期問題を解決できません。AI はテスト、検証、再トレーニングを経て、最終的に本番用ワークフローであるアプリケーションに統合する必要があります。それでは、これを誰が実行できるのでしょうか。このすべては実際には同じ反復タスクです。しかし、プロトタイプ開発よりも高いレベルの他の能力が必要です。通常は、これらのツールを特定のプラットフォーム向けにプログラムできるシステムプログラマーがさらに必要です。

IDS では、IDS NXT プラットフォームで別のアプローチを採用し、自信を持っています。適切な調整されたツールがあれば、どのユーザーグループでも、実際には独自の AI アプリケーションの実装に必ずしも必要ではない新しいコアコンピテンシーの構築に長い時間や大金を費やすことなく、AI ビジョンプラットフォームの可能性を存分に活用できます。これはどのような意味を持つのでしょうか。ニューラルネットワークのトレーニングと独自アプリケーションのプログラミングに関する特殊知識を、多数のシンプルな AI ワークフロー向けのツールに搭載できます。このようにすると、どのユーザーも、専門家からなる独自のチームを構成しなくても、個々の要件に合わせて実現できます。ソフトウェアにより、各ユーザーグループはそれぞれのタスクと作業方法に適したツールを使用できます。

画像処理アプリケーションは、複数の特定の個別タスクをアプリケーション固有のシーケンスにまとめて、ミスなく効率的に実行するためのものです。従来、このタスクは開発者が、C++ などのプラットフォームに適したプログラムコードでプログラミングしていました。市場に登場してきた新しい AI プラットフォームについても、状況はそれほど変わりありません。SDK (ソフトウェア開発キット) には、各プラットフォームのハードウェア関連のプログラミングに必要なソフトウェアインターフェースと既存の AI アクセラレーターが備えられています。多くの場合、アプリケーション開発者にとって各自のプロセスソリューション向けに自由にプログラムできる主なプラットフォームとなります。動作を把握している人にとって、創造性を限定するものはハードウェアパフォーマンスと SDK だけです。IDS NXT 推論カメラは、固有の画像処理アプリケーションを AI アクセラレーター deep ocean でビジョンアプリの形式で設計したい開発者にとってのオープンプラットフォームであり、対応する SDK と多数の C++ ソースコードサンプルを備えています。

アプリケーションウィザード

しかし、画像処理アプリケーションの大多数は、比較的シンプルなプロセスで動作します。すなわち、画像の撮影 → 画像の分析または特長の抽出 (画像処理) → プロセスの意思決定 → アクションの開始です。製品のシンプルな認識や分類で、その後、マシン制御や仕分けシステムのさまざまなインターフェースを通じて情報を通知または転送する処理が該当します。これらは基本的な機能で、細部が多少異なるだけです。このため、毎回再プログラミングする必要はないものです。ただし、「分類」や「物体認識」などのディープラーニング (DL) の使用例の中には、プロジェクトの入口としてはあまりにも抽象的すぎて、データ取得やビジョンアプリ構成に必要なアクションステップをさらに派生できないこともよくあります。

このため IDS では、AI ビジョンのパスをたどりやすくして、IDS NXT 推論カメラを大勢にとって使いやすくしています。プログラマー、画像処理プロフェッショナル、マシンオペレーター、熟練した担当者など、どのユーザーグループもアプリケーションを作成できなければなりません。この点で、クラウドベースの ANN (人工ニューラルネットワーク) トレーニングソフトウェア IDS NXT lighthouse を次回のアップデートで拡張し、ユーザーの実際の問題への重視を強め、適切な動作手順をサポートするウィザードが追加されます。ウィザードはターゲットグループのアクションの幅を容易に広げ、マシンビジョン用途の個々のあらゆるタスクに対応するようになりました。「何をしますか」という質問から始めて、IDS NXT lighthouse はアプリケーションに沿った問題について、「物体の計数」、「存在の有無の確認」、「検査ポイントの確認」などの選択肢を提供します。アシスタントはバックグラウンドで適切な DL ユースケースのアプリベースを選択し、必要な情報を収集するためにユーザーにその後のアクションを提示します。さらに、便利なヒント、ビデオ、手順が提示され、ユーザーに必要なバックグラウンド知識を提供します。このような「ガイド付きアプリケーション作成」からは、従来のアプリケーション開発のチュートリアルよりも多数の提案を受けられます。最終的には、完全にカスタマイズされたビジョンアプリをダウンロードできます。ユーザーはこれを有効化して IDS NXT カメラで起動するだけです。

プログラミングではなく「パズル化」

より複雑なプロセスを作成する場合でも、C++ やその他のテキストベースのプログラミング言語に頼る必要はありません。関数ライブラリが視覚的ブロックにパッケージされ、ビジュアルエディターが追加されている場合、プロセスをパズルのピースのようにして組み合わせることができ、個々のプログラミング言語の正確なコマンドに苦戦する必要はありません。Blockly は、まさにこの目的で作成された Google のプロジェクトです。IDS は Blockly を使用し、独自の機能を調整して、カメラの推論タスクを一種の組み立てキットに任意の複雑な順序にまとめられるようにします。

Blockly により、複数の ANN を使った多段階の検査も、1 つのプログラミングシーケンスに非常に容易に取り込めます。
Blockly により、複数の ANN を使った多段階の検査も、1 つのプログラミングシーケンスに非常に容易に取り込めます。

Blockly Editor のユーザーインターフェースは直感的なので、初心者や素人でもすぐにうまく使用できるようになります。アプリケーションウィザードに比べてこのモジュール式システムによる視覚的プログラミングのメリットは、ユーザー独自のシーケンスを作成できることです。この方法で、数学的演算と条件付き if/else ステートメントまたはループによる反復処理による論理的なリンクを使って、変数、パラメーター、AI の結果を容易にリンクできます。これにより、物体の 2 段階検査および複数のニューラルネットワークを使う、より複雑なワークフローを利用できるようになります。たとえば物体認識器は、各種の部品に対して事前に基本的な仕分けを行い、その後、2 番目の分類器で詳細な欠陥分析を行い、部品をさらに細かく分類します。このようなプロセスは、VAC (Vision App Creator) や C++ のプログラミング知識がなければ、実現できませんでした。

パズルに似せたアプリケーションのもう 1 つのメリットは、非常にダイナミックに利用できることです。Python と同様に、Blockly によるビジョンアプリプログラミングでは、「コード」を直接実行でき、複雑なクロスコンパイルは不要です。IDS NXT lighthouse で作成されたアプリケーションを、カメラで初期テストを行った後、さらにカメラで直接、インタラクティブに簡単にプログラミングできます。ビジョンアプリをここで直接設計することもできます。この点から、試行錯誤の段階から運用まで、ビジョンアプリエディターは理想的なツールとなります。

完全に自動化されたアプリケーションコンフィグレーターから、直感的な視覚的インターフェースを持つビジョンアプリ構築キット、従来の SDK による自由なプログラミングまで、IDS NXT にはあらゆる知識レベルのユーザーに適したツールを揃っています。人工知能を搭載した個々の画像処理アプリケーションの始動およびセットアップ時の時間とコストが節約されます。

説明可能な結果

AI と使用される ANN の高精度をわかっているという既知のメリットがあっても、障害発生の診断はやはり困難な場合があります。動作の仕組みが不明確だったり、結果が説明できないという面もあり、アルゴリズムの普及を阻んでいます。一般に、ANN は、どのように決定したのか理解できないブラックボックスと誤解されています。「DL モデルは間違いなく複雑ですが、ブラックボックスではありません。むしろ、ガラスボックスと呼ぶほうが正確です。文字通り中を見て、各コンポーネントが何をしているのか確認できるのですから」 [「The black box metaphor in machine learning」からの引用]。ニューラルネットワークの推論決定は従来の論理ルールをベースとしておらず、その人工ニューロンの複雑な相互作用は人間には簡単にはわかりませんが、数学的システムの結果であるため、再現可能で分析可能です。私たちに足りないのは、サポートのための適切なツールです。改善の余地がいまだ広大にあるのは、この AI の領域です。そして、市場のさまざまな AI システムがユーザーの作業をどの程度うまくサポートできるかが、明らかになるのもこの分野です。

IDS はこの分野で、関係機関や大学との共同研究により、これらのツールの開発に取り組んでいます。IDS NXT ocean ソフトウェアにはすでにこのコラボレーションの成果が含まれています。アテンションマップ (ヒートマップ) と呼ばれる形式での視覚化により、AI の重要な意思決定を理解しやすくなり、これを受けてニューラルネットワークの産業環境への受け入れが促進されます。トレーニングされたデータバイアスの認識と回避にも使用できます (「アテンションマップ」の図を参照)。混同行列を使用する統計分析も、クラウドベースのトレーニングソフトウェア IDS NXT lighthouse と IDS NXT カメラ自体の両方でまもなく利用できるようになり、トレーニング済み ANN の品質を容易に決定および理解できるようになります。これらのソフトウェアツールを利用して、ユーザーは IDS NXT AI の動作と結果を直接トレースしてトレーニングデータセット内での弱点を突き止め、個別に修正できます。これにより、AI の挙動が説明され、誰にとっても理解しやすくなります。

完全パッケージとして産業用途に最適

人工知能には多大な可能性が眠っていることは疑いようがありません。AI アクセラレーター搭載の推論カメラという形で登場しているハードウェアも、すでに効率的に使用できることを実証しています。しかし、ハードウェアの準備だけでは、AI を業界に全面的に普及させるには不十分です。メーカーは、ユーザーフレンドリーなソフトウェアと統合プロセスとして、専門知識をユーザーと共有してサポートするという課題を抱えています。数年掛けて成熟し、固定顧客ベースと大量のドキュメント、知識転移、多数のソフトウェアツールで構築されているベストプラクティスと比較すると、AI にはまだやるべきことがたくさんありますが、すでに構築作業は始まっています。標準と認定も現在作成中で、受容度と理解を強化し、AI を幅広く普及させようとしています。最終的には、誰もが新しいテクノロジーに習熟し、波に乗り遅れないようにします。IDS がそのお手伝いをします。IDS NXT ocean では、組み込み AI システムをすでに利用でき、産業ツールとしてすばやく容易に運用できます。多数のユーザーフレンドリーなソフトウェアツールを搭載し、機械学習、画像処理、アプリケーションプログラミングの深い知識がなくても、どのようなユーザーグループも便利に使用できます。