AIが最も導入されているのは画像処理の分野であるとお聞きした方も多いのではないでしょうか?特に製造業の分野で多く見られます。例えば、AIが利用される分野としては、以下があります。

製品検査: 製品の不良を発見する異常検知の技術を応用
予知保全: 設備の異常を予測する技術
デジタルファクトリープラットフォーム: IoTとAIを組み合わせが生産性と品質向上をはかる
サプライチェーン最適化: 分析予測技術を活用した生産計画、価格予測、在庫管理などサプライチェーンの最適化

その中でも、サプライチェーン最適化以外は、画像によるAI活用が大部分を占めてきます。

しかし、その中でももととなるものは、データラベリングによって生成された大量の学習用データが必要となってきます。では、その画像におけるデータラベリングはどのようなものがあるのでしょうか?

その種類をご紹介していきます。
大きくは3つのタイプがあります。

1、 物体検出
2、 領域検出
3、 画像分類

ではどのような作業が必要になるのか見ていきたいと思います。

1、 物体検出

画像に対して、意味付けを行っていきます。
これは、自転車、人、足、建物などとタグを付けていきます。

2、 領域抽出

画像の中にある物体に対して、どの部分にあたるかを指定します。

3、 画像分類

画像に対して詳細なタグを付けていきます。
例えば、「この動物は何?」「色は?」「柄は?」「どういう関係?」 などの属性を付けていきます。

このように画像に対してデータを作成をしていくことで、教師ありデータの学習モデルを作成していくことができます。
膨大な画像に対して、人間の目によってこれらの作業を行っていくには、さまざまな有効なアノテーションツールを利用いただくことが重要になってきます。

allAi.jpでは無償で使えるツールもご紹介をしていきたいと思いますので、ぜひよろしくお願い致します。

企業におけるAI活用が急務であると言われていますが、何よりも大事なことはAIを利用するための高精度なデータがどれだけ揃っているかというのは、皆様ご存知のとおりです。

そのためのデータ生成ということで、このデータラベリングという技術、または作業が必要となってきます。アノテーションという言葉も使われますが、同じ意味と考えていただいて構いません。データラベリングというのは、文字通り、画像や動画、音声、テキストになどの学習用データに対してラベルをつけていく作業のことを言います。

AIの活用に至るまでの一連の作業におけるデータラベリング(アノテーション)の位置づけは次のようになります。

アノテーションにおける具体的な作業では、例えば、画像に対して行う場合には、次のような例があります。

・猫の画像に猫の種別情報をつける
・人の画像の中で顔部分に枠を付ける。目鼻口の位置を指定する。
・画像の中の鳥の数を数える。
・SNSの口コミのいて、良い/悪い/普通のタグを付ける
・製造業において品質不良箇所に印をつける

一つ一つの操作に対してはとても簡単な作業です。しかしこれを大量に行うためには、データの収集から始まり作業を管理するためのツールが必要となってきます。それがアノテーションツールと呼ばれるものです。無料のものから有料のものまで様々なものがあります。また対象とするデータが、テキストなのか、画像/動画、音声かによっても変わってきます。

allAi.jpではこのような便利なアノテーションツールについてもご紹介をしていきたいと思います。

HACS (Human Action Clips and Segment )データセットは、アクションセグメントのビデオを使用して、認識と時間的ローカリゼーションを扱うモデルの構築に適したCVデータセットです。大規模な画像認識/分類、オブジェクト検出、セグメンテーション、およびキャップです。

詳細を見る

Waymoは、25都市で1,000万を超える自律走行距離を収集し、高品質のマルチモーダルセンサーデータセットを公開しました。サイズとカバレッジに加えて、このデータセットには、多様な運転環境、詳細なラベリング、360度ビュー、2Dおよび3D知覚、ドメイン適応、シーン理解、行動予測に適したカメラとライダーの同期も含まれています。

詳細を見る

自動運転車における非常に優れたソースとなるレベル5向けのデータセットには、55,000を超える人間が付与したラベルがついています。3D注釈付きフレームおよび、表面マップ、7個のカメラ、最大3個のLidarセンサーでキャプチャされた、基盤となるHD空間セマンティックマップが含まれ、コンテキスト化に使用できます。なお、このデータセットはnuScenes形式でされるのでご留意ください。

詳細を見る

2016年にv1で最初に導入されたGoogleのオープンイメージは、2019年に新しいセグメンテーションマスクとインスタンスセグメンテーションに重点を置いて更新されています。Open Images V5は、350のカテゴリーの280万のオブジェクトインスタンスのセグメンテーションマスクを備えています。マスクに加えて、人間が検証した新しい画像レベルのラベル640万個を追加し、20,000を超えるカテゴリで合計3650万個に達しています。このデータセットは、オブジェクト検出モデルの構築に非常に適しています。

詳細を見る

ドローンシステムとテクノロジーのリーダーの1つであるParrotは、エンジニアリング、建設、農業におけるユースケースに適したさまざまな空中自律走行機のトレーニングに使用できる空中からの優れたビデオのコレクションを提供しています。

詳細を見る

COCO(Common Objects in Context)とは、大規模な画像認識/分類、オブジェクト検出、セグメンテーション、キャプションのデータセットです。次のようなデータを含んでいます。
330,000画像(200,000 +注釈付き)
キーポイントを持った250,000人による1画像あたり5つのキャプションを備えた、80ポイントのオブジェクトカテゴリで200万を超えるインスタンスがあります。

お客様からのデータをお預かりしてデータラベリンク作業を実施することが原則ですが、不足する場合は、公開データセットなどをもとにしたデータを追加することも可能です。