最適な顔認証ソリューションを選ぶための7つの要素
私たちの日常生活の中で、顔認証は急速に普及しつつあります。モバイルデバイスや検温スクリーニング端末などを通じて、多くの人々が日常的に顔認証を使用しています。AIテクノロジーの急速な進歩によって、顔認証技術をより手軽に利用できるようになった結果、その用途は拡大し続けています。あなた自身が顔認証ソリューションの利用を検討する機会も、今後増えていくことでしょう。
顔認証ソリューションを選択する際には、考慮すべきさまざまなポイントがあります。顔認証の導入形態は幅広いため、包括的なアプローチが必要ですが、導入を成功させるためのポイントは、導入形態に関わらずほとんど変わりません。この記事では、顔認証ソリューションの導入を成功させるためのポイントをご紹介します。
顔認証の基本事項
顔認証とは?
顔認証とは、人物の顔を検出して、個々の顔の特徴を抽出及び比較してその同一性を識別、顔のテンプレートを作成して既存のデータベースと比較し、個人の身元を確認します。近年のAI技術の急速な発展に伴い、顔の特徴量を検出・抽出してベクトル化して、既存のデータベースと比較して人物を識別することが可能になりました。AIを取り入れた顔認証技術は、ますます主流になりつつあります。
顔認証の用途
スマートフォンのロック解除だけではなく、空港の顔パスゲートや、スポーツ観戦やコンサート会場での入場者チェックなどで顔認証を使用したことのある方も多いでしょう。詳しくは、「2023 顔認証システムを使った7つの活用事例」にて紹介しています。技術の進歩によりパフォーマンスの向上と低コスト化が実現したことで、顔認証の用途はこれからも大きく拡がっていきます。
エッジデバイス?クラウド?顔認証システムの導入先について
顔認証システムは、エッジまたはクラウド環境にて導入が可能です。例えば、スマートロック・アクセス制御・セルフサービスkiosk (キオスク)・スマホの金融アプリなどは、エッジデバイスでの展開が最適です。顔認識をエッジに導入する利点は、コスト削減、応答時間の短縮、サービスの可用性の向上などがあります。詳しくは、「2023年版 顔認証テクノロジー活用ガイド」をご覧ください。
どのように企業にとって最適な顔認証ソリューションを選択すべきか?
顔認識を展開する上で最も重要な考慮事項は、社内の専門知識 (ソフトウェア エンジニアなど) を利用してソリューションをゼロから開発できるかどうかです。その場合、顔認証SDKなどのソリューションを使用できます。どの顔認識ソリューションが適しているかについて詳しくは、顔認識ソフトウェア ソリューションFaceMe をご覧ください。
最適な顔認証ソリューションを選ぶための7つの要素
必要な顔認証ソリューションを理解するために、以下の7点について意向を整理してみましょう。ニーズの優先順位に合わせて、取捨選択を行うことでより最適なソリューションを選択することができます。
- 認識の精度:使用環境で必要となる精度の高さはどのくらいなのか。
- 顔認証の機能:どの機能を必要としているのか(例:顔検索・顔照合・勤怠管理など)。
- パフォーマンス:希望とする認識速度や処理時間はどのくらいなのか。
- エッジデバイスとクラウド:導入の際に使用するアーキテクチャは何か。
- デバイスとハードウェアのサポート:どのタイプのデバイス及びチップが適しているのか(予算とともに考慮することをお勧めします。)
- ソフトウェア:顔認証SDK導入して自社開発を行うか、全てお任せのターンキーソリューションを採用するか。
- コスト:導入と維持に使用可能な予算。
1.認識の精度
顔認証の精度を検討する際に、考慮すべきポイントをご説明します。
- 顔認証ソフトウェアの精度
顔認証モデルのサイズ、チップセットの処理能力、およびカメラの性能に影響されます。FaceMe®の顔認証モデルのサイズは6.7MBから300MBで、低消費電力のチップセットに最適化されており、幅広い用途に対応できる柔軟性を持っています。 - 顔認証アルゴリズムの精度
米国国立標準技術研究所(NIST)の顔認証ベンダーテスト(FRVT)などで測定されます。最新のNIST FRVT 1:Nテストでは、FaceMe®は最大99.73%の精度を記録し、テストに参加した全ベンダーの中で第6位、世界市場への展開に制限のある中国やロシアを除くと第1位にランクインしています。 - 顔認証における精度の重要性
機密性の高いデータや厳重な管理が必要な危険物、重要な資産などを保護するためのアクセス制御では高い安全性が求められます。このような状況で、顔認証の精度は最も重要となる可能性が高くなります。一般的に、正確性の高いアルゴリズムは、それ自体が高価でなくとも、より多くのストレージと処理能力が必要となります。これにより、下記で説明するようにシステム全体のコストが大幅に増加する可能性があります。精度は顔認証システム成功の重要なポイントであり、FRVTなど業界テストで定期的に更新されている顔認証アルゴリズムのランキングを確認して、上位にランクインしているベンダーのソリューションを検討することをおすすめします。
顔認証の用途によっては、最も正確なアルゴリズムを使用することは経済面で現実的ではない場合もあります。実際には、ほとんどの用途では99%以上の精度が必要となることはありません。しかし、精度への依存性が低い用途でも、95%以上の精度を持つソリューションを使用することをおすすめします。
使用環境
使用場面
展開規模
2.顔認証の機能
-
顔認証
- 顔認識
- 特徴点抽出
- 顔検出
- 比較と識別
-
顔属性分析
- 性別
- 年齢
- 感情推測
- 頭の向き
-
画像前処理
- 2D カメラによる生体認証(なりすまし防止)
- 3D カメラによる生体認証(なりすまし防止)
- TrueTheater™ 技術
-
マスク着用時の顔認証
- マスク検出
- マスク着用時の認識率 TAR 98.21%
顔認証ソリューションはさまざまな機能を提供していますが、多くのソリューションは次の3つの基本的機能を備えています。
- 顔検出
顔検出は、顔認証で行われる最初のステップです。このステップでは、画像全体をスキャンして、人間の顔の全部または一部が含まれているかを確認します。高速で正確な顔検出は、顔認証プロセス全体のパフォーマンスを確保するための重要なステップです。FaceMe®をはじめとする主な顔認証ソリューションは、一度に複数の顔を検出し、存在する顔の数をカウントし、それぞれの顔を個別に検出できます。 - 顔認証
顔を検出した後、顔認証エンジンは顔画像から顔の特徴点情報を抽出し、テンプレートを作成します。次に、このテンプレートは、事前にデータベースに登録されているものと照合され、個人のテンプレートと照合されます。顔認証に関するプライバシー上の懸念を考慮すると、できるだけ高水準の暗号化技術を使用しているベンダーを選択し、また許可されていない人物がテンプレートデータを使用できないようにすることを強くお勧めします。高度に暗号化されたテンプレートを使用する場合、実際の顔画像をプラットフォーム上に保存する必要がないため、高いレベルのプライバシー保護が実現できます。 - 顔属性検出
顔属性検出は、年齢、性別、顔の表情、頭の向きや動き(うなずく、頭を振る、など)といった特性を識別して分析するタスクです。この機能は、顧客ターゲットに合わせカスタマイズされた広告やメッセージを提供したり、詳細な訪問者統計を収集したりするなどの用途に使用されるため、デジタルサイネージやスマートリテールには欠かせない機能となります。
FaceMe®をはじめとした先進的な顔認証ソリューションは、次のような追加機能も備えています。
- 画質改善
このプロセスによって、明るさやカメラの性能などが原因でキャプチャされた写真が不鮮明な場合に画質を改善し、顔認証の精度を向上させることができます。 - なりすまし防止
なりすまし防止機能は、2Dまたは3Dカメラを使用して生体検出を行います。Webカメラなどの2Dカメラを使用する場合、なりすまし攻撃は対話型および非対話型の方法で検出することができます。対話型の方法では、顔を特定の方向に向けるなどの指示を行い、これに対して頭や顔の動きが自然で正確かを識別して生体検出を行います。非対話型の方法では、各ソリューションベンダー独自のAIアルゴリズムによって生体検出を行っています。
3Dカメラは、深度検出を行うことで顔写真やビデオを使用したなりすましを即座に防止します。この場合、対話型の生体検出は必要ありません。一般的に、3Dカメラは優れたユーザー体験を提供できますが、コストは比較的高価となります。一方で、2Dカメラはリーズナブルなコストで正確ななりすまし防止を提供することができます。
- マスク検出、マスク着用状態での顔認証
マスク検出機能は公共空間において健康と安全を確保するために重要な機能で、人物がマスクで鼻と口を正しく覆っているかどうかを確認することができます。FaceMe®などの先進的なソリューションは、マスクを着用した状態でも高精度の顔認証が可能です。
高度な機能と基本的な機能を選択する際の見分け方
使用場面
使用状況
展開規模
3.パフォーマンス
精度と同様、多くの要素が顔認証システムのパフォーマンスに影響を及ぼします。それぞれのポイントを見ていきましょう。
- フレーム毎秒(FPS)
カメラなどで撮影された画像を使用して、1秒間に顔認証システムが処理可能な画像の枚数を示す値です。FPSが高いほど、精度とパフォーマンスは高くなります。 - 検出速度
検出速度は、顔認証システムが空間内をスキャンし、顔が存在することを検出する速度を示します。 - 抽出速度
抽出速度は、顔認証システムが顔の特徴点情報を抽出するのに要する時間を示します。 - 認証速度
認証速度は、顔認証プロセスの最後に、システムが抽出された情報を処理して、一致または不一致のいずれかを判定する速度を示します。
パフォーマンスを向上させるためには、特定の使用状況に合わせて最適なチップセットとソフトウェアも必要です。
- チップセット:パフォーマンスを向上させることができます。単体GPUやNVIDIA T4のようなVPUチップを別のCPUと組み合わせることで、パフォーマンスを大きく向上させることができます。GPUアクセラレーションにはさまざまなオプションが提供されています。OpenVINO、NVIDIA CUDA/TensorRT、Intel Movidius、NVIDIA Jetson、Qualcomm SNPE、MediaTek NeuroPilotなどを活用することで、ディープラーニングアルゴリズムを高速化し、パフォーマンスをさらに最適化することができます。
- 顔認証ソフトウェア:さまざまなチップセットとシステムアーキテクチャとの組み合わせに応じて最適化を行っています。たとえばFaceMe®は、最高のパフォーマンスを提供するため、多くの経験をもとにアーキテクチャを最適化しています。NVIDIA RTX A6000を搭載したワークステーション1台を使用した場合、FaceMe®は毎秒340~410フレームを処理できます(処理可能なフレーム数は、使用しているFaceMe®顔認証モデルによって異なります)。これは、ワークステーション1台あたりで25~41のビデオチャネル(10フレーム/秒)を処理できることを意味しており、非常に高性能なオプションであるといえます。
パフォーマンスが顔認証における需要性とは
パフォーマンスは、多くの用途で顔認証システムの有効性を確保するための重要なポイントです。たとえば大規模な施設への展開では、数百のビデオチャネルを同時に処理する必要があり、またその中には人通りが非常に多いエリアも存在します。高性能な顔認証モデルを提供するベンダーを選ぶことによって、このような施設を監視するために必要となる、高価なワークステーションの台数を削減することができます。
下記にて、異なる状況下でのパフォーマンスの需要性をみてみましょう。
使用用途
空港のような混雑した公共空間では、顔認証システムを使用して数十、場合によっては数百の顔を同時にスキャンし、ブラックリストに載っている人物を検出したり、マスクの着用状態を監視したりする必要があります。このように膨大な量のデータを同時に処理する用途では、強力なパフォーマンスを持つ最高レベルの顔認証ソリューションを選択し、比較的高コストである高性能ハードウェアの数を抑えることが重要です。
図書館へ顔認証を導入する場合、本の貸出時に顔を個別にスキャンするといった作業が主な用途となります。この場合、システムが一度に処理しなければならない情報は少ないため、パフォーマンスの制約は少なくなります。
使用環境
大規模な施設に多くの人々が存在するため、顔認証システムは複数のカメラチャンネルを処理する必要があります。パフォーマンスはきわめて重要なポイントです。
オフィスの入り口などでアクセス制御を行う顔認証システムは、ほとんどの場合一度に1人または少人数の顔を処理するだけでいいため、一般的にパフォーマンスの制約は少なくなります。
展開規模
カメラからのビデオチャンネルが増えれば増えるほど、顔認証システムへの負荷は大きくなります。システムを正常に動作させるためには、より高性能のチップセットとソフトウェアを検討する必要があります。
出入口に1台のカメラのみが設置される小規模施設のような場合、単一のビデオチャンネルのみを処理するだけでいいため、システムへの負荷はそれほど大きくなりません。このような場合、システムコンポーネントを選択するうえでパフォーマンスの制約は少なくなります。
4.アーキテクチャ:エッジとクラウド
エッジとクラウドのアーキテクチャの違いは、顔認証システム全体のセキュリティとパフォーマンスに大きな影響を与えるため、速度を求めるオペレーターにとって重要な考慮事項となります。一般的に、エッジベースのシステムは、クラウドとの間で情報をやり取りする必要がないため、より高速に動作することができます。
エッジベースのシステムには次のような利点があるため、今日において一般的な選択肢となりつつあります。
- セキュリティ:エッジベースのシステムは、クラウドへのデータ送信が必要ないため、情報漏洩などのリスクは低くなります。
- 柔軟性:エッジベースのシステムはクラウドに接続する必要がないため、ネットワーク接続が利用できない用途にも導入することができ、柔軟性に優れています。
ただし、次のような用途ではクラウドも適しています。
- 使用頻度が低い用途:人が頻繁に訪問することのない施設を保護する場合など。
- 高精度が必ずしも必要ではない用途:店舗のロイヤリティプログラムなど、比較的リスクの低い場面など。
- ハードウェアコストの制約が厳しい用途:存のハードウェアを交換することができず、クラウドインフラに依存せざるを得ない場合など。
5.ハードウェア:顔認証デバイスとチップセット
技術革新によってハードウェアとチップセットは急速に進歩しており、処理速度、消費電力、フォームファクター、およびコストといった制約に対応するため、数多くのオプションが市場で提供されています。これによって、これまでに顔認証の使用が困難だった用途にも、顔認証が導入されつつあります。
チップセットに関しては、顔認識システムのコストとパフォーマンスの要件に応じて、下記の表にまとめてある通りさまざまなチップセットから選択できます。詳細については、こちらの記事をお読みください。
ハードウェアのパフォーマンス
パフォーマンスの高いハードウェアと低いハードウェアどちらを選択すべきか、下記の表よりその違いを見てみましょう。
使用用途
感染症拡大防止の観点から、大学のキャンパス全体を監視するセキュリティシステムは、数百台のカメラからの映像を監視し、マスク着用状態の検出を行う必要があります。このような用途では強力なハードウェアが必要なため、ワークステーションまたはサーバーを検討することをおすすめします。
顔認証を利用した部屋のドアロックには、ドアに内蔵するためサイズの制約がありますが、一方でパフォーマンスの制約は少なくなります。
使用環境
多数のビデオフィードに対して、個人認証とマスクの着用状態検出を同時に実行する必要がある用途では、ワークステーションなどのより高性能で堅牢なハードウェアが必要となります。
こちらの用途では、処理する必要のあるビデオフィードは少ないため、パフォーマンスの制約も少なくなります。ハードウェアの選択にあたってはコストと利便性に重点が置かれるため、PCが最適なオプションである可能性が高くなります。
展開規模
各店舗のIPカメラで録画される数百のビデオストリームと画像を処理する必要があります。こういった大規模な用途では、顔認証を実行するために各店舗に高性能ワークステーションを配置し、中央の高性能サーバーとの組み合わせで各店舗から送信された顔テンプレートを照合する、ハイブリッドモデルを検討する必要があります。
比較的小規模のホテルでは、パフォーマンスの制約は少ないため、高性能のPCやワークステーションが適しています。
6.ソフトウェア
比較的小規模のホテルでは、パフォーマンスの制約は少ないため、高性能のPCやワークステーションが適しています。
- プラグ&プレイソフトウェア
当初、顔認証ソリューションは主にソフトウェア開発キット(SDK)の形で提供されていました。これらは一般的に柔軟性があり、個々の用途向けに調整されたソリューションの展開が可能となりますが、高いプログラミングスキルと統合のための作業が必要となります。顔認証ソリューションをよりすばやく簡単に導入できるようにするために、明確に定義された用途を持つプラグ&プレイソフトウェアが登場しました。たとえばFaceMe® Securityなどのプラグ&プレイ顔認証セキュリティソフトウェアは、アクセス制御や監視などの一般的なセキュリティ用途に最適となるようあらかじめ設計されているため、簡単に導入することができます。
より優れた製品は非常にスケーラブルであり、単一のカメラを使用する用途から、複数台のカメラ、複数の場所での使用に至るまで導入が可能です。また、既存のカメラやネットワークへの接続にも対応できます。こういったソリューションを、VMS、ドアロック、勤怠管理ソフトウェアなどの他のシステムに簡単に接続することもできます。 - ソフトウェア開発キット(SDK)
SDKは柔軟性に優れており、顔認証アルゴリズムをソフトウェアインストラクチャに合わせて完全に制御する必要がある用途に適したオプションです。SDKを効果的に実装するためには、SDKを既存のソフトウェアインストラクチャに統合できる、優れたスキルを持ったIT人材が必要となることに注意が必要です。SDKを使用することで、既存のワークフローやプロセスを生かしながら顔認証を使用することができるようになります。
使用用途
施設ごとに独自に設計されたプロセスとシステムが存在するため、この用途では多くの場合、より柔軟なSDKを採用する必要があります。
既存のカメラセキュリティシステム、またはカメラを接続するビデオ マネジメント システム(VMS)があるかどうかにかかわらず、費用対効果が高く、メンテナンス性にも優れたFaceMe® Securityのようなプラグ&プレイソリューションが適しています。
使用環境
銀行へ入るためのカードスキャナーを顔認証で置き換える場合、既存のシステムやエンタープライズインフラと統合する必要があります。このような用途では、SDKの方が適しています。
オフィス施設には、セキュリティモニタリング、従業員と訪問者のアクセス制御、ブラックリストに載っている人物の通知といった共通のニーズが存在します。大規模な施設には通常、セキュリティカメラとドアアクセス制御機能を備えたVMSが既に存在するため、FaceMe® Securityなどのプラグ&プレイソフトウェアを簡単に接続することができます。また、VMSを備えていない施設においても、FaceMe® Securityの最新アップデートで追加された、VMR Add-onを使用することができます。
展開規模
7.コスト
顔認証を統合する前に、顔認証システムのライフサイクルコストを考慮することが重要です。考慮すべきいくつかのポイントをご説明します。
- 初期コスト
初期コストには、顔認証システムと統合を最初に行う際の費用と投資が含まれます。これには、調査、実証実験、ハードウェア、ソフトウェア、統合作業、トレーニング、初期データの作成、既存の機器の改造、およびその他に要したコストが含まれます。 - 変動コスト
変動コストは、顔認証システムの運用期間を通して発生します。これには、システムメンテナンス、顔認証ソフトウェアのサブスクリプションの費用、毎月の通信費と電力費、サーバーのレンタル費用、および関連する資本コストが含まれます。陳腐化への対応・コンポーネントの陳腐化に対応するため、顔認証システムの運用期間中、ハードウェア、OS、ソフトウェアをタイムリーにアップグレードする必要があります。 - 交換サイクル
交換サイクルは、長期的にコストを最適化するための一般的なメンテナンスオプションです。ハードウェアとソフトウェアのコンポーネントを計画的に交換することで、最新のテクノロジーによるパフォーマンスの向上とコストの削減(維持費、電力使用量の削減など)といったメリットを得ることができます。 - 規模に関連するコスト
多くのコストポイントは、顔認証を展開する規模に関係しているため、全体的なコストを見積もる際に考慮する必要があります。たとえば、監視する必要のある建物が多いほど、多くのハードウェアが必要となるため、これに応じて顔認証ソフトウェアのコストや、メンテナンス、電力費、通信費などの月額コストが高くなります。
導入規模に応じたコストの例を、いくつかご紹介します。
最適な顔認証システムの創造
想定する用途に応じて顔認証ソリューションを設計する場合、利用可能なオプションは数多く存在します。上記でご案内したコアコンポーネントと決定ポイントは、ニーズに対して有効なソリューションを構築するための重要な鍵となります。より安全な設計のために、まずはそれぞれの決定ポイントと現在存在するオプションを十分に認識して、最新の技術とソリューションを理解することで、この先に予想されるイノベーションが開発とテストの日程にどの程度影響を与えるかを確認することが大切です。次に、設計を成功させるために重要なポイント(パフォーマンス、機能、ハードウェアなど)に焦点を当てて検討を行います。
また、業界での多くの顔認証の成功例や失敗例について学ぶことも重要です。多くの業界には、顔認証の導入例と、それがどのように役立ったかを調査している協会や組織が存在します。
最後に、これらの情報の集大成を使用して、あなた自身の用途に適した最適なソリューションを選択するための決定ツリーを構築することで、適切な決定を導き最適な顔認証の創造へとつながります。
顔認証の概要、その仕組み、および導入方法等詳細については、FaceMe の公式 Webサイトをご覧いただくか、下記よりお問い合わせください。