AIの透明性に関するお知らせ
Entrust本人確認サービスの人工知能(AI)の透明性に関するお知らせ
このお知らせは、お客様が使用しているAIシステムに関する透明性の高い情報を提供するものであり、システムの機能、制限、バイアス、データ使用の慣行、安全対策について概説しています。 このAIがどのように機能するのか、何ができて何ができないのか、あなたのデータがどのように扱われるのかを理解するために必要な知識を提供したいと考えています。 こうした透明性を提供することで、当社のAI技術の利用に関して、十分な情報に基づいた意思決定を行うことができます。
このお知らせにありますように、当社のAIが提供する重要な情報を必ずダブルチェックするようにしてください。当社の技術は、専門家の判断を支援することを目的としており、専門家の判断に取って代わるものではありません。健康上、財政上、または法的な影響を及ぼす可能性のある決定については、行動を起こす前に、適切な資格を有する専門家に相談するか、独立した法律顧問を採用されることを強くお勧めします。
Entrustの本人確認(IDV)技術
EntrustのIDV(本人確認)製品を使用すると、ユーザの処理、検証、オンボーディングをリモートで行うことができます。 このシステムに入力する情報は、ID証明書の写真/ビデオと申請者の写真/ビデオです。 Entrustの意思決定エンジンは、これらの入力情報を使用して承認/検討のシグナルを返します。その際、結果がどのように生成されたかに関して、適切なコンテキストと詳細な内訳も提供します。
IDV製品は4つの主要な技術セグメントによって支えられており、それぞれがAIシステムに依存しています。 4つのセグメントとは、(1)顔の類似性、(2)生体認証によるなりすまし防止とライブネス検出( 顔画像)、(3)文書からの自動データ抽出、(4)ID証明書の不正防止技術です。 これらのセグメントでは、データ抽出、生体認証による照合、文書の検証、および生体認証による検証のタスクが実行され、いずれも承認信号を返すためには肯定的な結果が必要になります。 これらの各技術セグメントに対応する複数のAIシステムが集まってIDVアプリケーションを形成しますが、IDVアプリケーションにはAIに基づかないアルゴリズムも相当量含まれていることに注意が必要です。 AI/MLベースのアルゴリズムと非AIベースのアルゴリズム(つまり、従来のコンピューターコード)の組み合わせが、Entrustの製品を生み出しています。
使用目的とAI機能
Entrustは責任を持ってAIを活用することで、より迅速で一貫性のあるデータ処理を可能にし、エンドユーザにとってよりスムーズで安全なエクスペリエンスを提供します。 当社のシステムは、個人データに対する人的なレビューを可能な限り最小限に抑えるように設計されており、エンドユーザ情報の不必要な露出を減らすのに役立っています。
AIは、当社の本人確認(IDV)製品ポートフォリオ全体で使用されています。その目的は次のとおりです。
- 政府発行IDの写真やビデオが本物のように見えるか、改ざんや不正行為の兆候があるかどうかを示す。
- パスポートや運転免許証など、書類のタイプを分類する。
- 書類の画像やビデオから、名前や生年月日などの関連情報を抽出する。
- エンドユーザによって提供された顔認証が本物に見え、ID証明書に示された個人と一致するかどうかを示す。
当社のソリューションは、真正性または潜在的な不正行為を示す可能性のあるパターンを特定するよう設計されており、組織が信頼性と安全性に関する意思決定を十分な情報に基づいて下すのに役立ちます。 結果は決定的な判断ではなくリスク指標として解釈されるべきであり、他の管理手順や検証手順と併せて使用する必要があります。
データタイプ
- 政府IDの写真/ビデオ
- 顔認証の写真/ビデオ
AI使用/モデルタイプ
すべてのアプリケーションでディープラーニングモデルが使用されており、具体的なパラダイムはアプリケーションによって異なります。 通常、これらのモデルは事前にトレーニングされ、次に独自のデータセットで微調整され、パフォーマンス(精度と公平性の両方)が最適化されます。
- 二値分類モデル: 文書不正検出と生体認証のライブネス検出では、二値分類モデルを使用して、入力された画像/ビデオが本物である(ディープフェイクなどの不正な方法で変更されたり、何らかの意図的な妨害行為で改ざんされたりしていない)確率を評価します。
- マルチクラス分類モデル: 文書分類ではマルチクラス分類モデルが使用され、入力された文書画像に基づいて最も可能性の高い文書タイプを返します。
- 視覚言語モデル(VLM): 文書抽出では、ドキュメントインテリジェンスのために視覚言語モデル(VLM)が使用されます。
- 顔認識モデル: 当社のアプリケーションは、教師ありディープラーニングモデルを採用しています。ライブで撮影された自撮り写真やビデオと、政府発行のID証明書や以前に撮影した他の自撮り写真やビデオから取得した画像との間で顔比較を行います。 このモデルは、各顔画像の数値表現(「埋め込み」)を生成し、埋め込み間の類似度を測定して、両方の画像が同一人物のものである可能性を判断します。これは、埋め込み表現ベースの1対1または1対Nの生体認証として知られています。
AIのトレーニング方法
当社のAIモデルは、体系的なベンチマークプロトコルを用いて、パフォーマンス(精度と公平性の両方)が最適化されています。 トレーニングと微調整を行い、その後、エンドユーザのデータから収集されたデータセットに対して徹底的にベンチマークを実施します。 当社は、生産現場から一様にサンプリングした品質チェック(QC)データを使用して、指定されたモデルにおける真の他人受入率/本人拒否率の偏りのない推定値を取得しています。 さらに、ヒューマンインザループ(HITL)と呼ばれるフィードバックプロセスを採用しています。このプロセスでは、人間のアナリストが評価結果を検証し、Entrustの責任あるAI原則に従ってモデルのパフォーマンスを継続的に改善します。
責任あるデータ使用の原則
AIを活用したEntrustのシステムをご利用いただくにあたり、当社がお客様のデータをどのように取り扱うかをご紹介します。以下の重要な点をご確認ください。
- AIの使用には、エンドユーザの個人データの処理が含まれます。 当社は、正当な法的根拠がある場合にのみ、そのような個人データを処理します。 個人データの取り扱いについて詳しくは、IDV製品プライバシー通知をご覧ください。
- AIモデルおよび関連データへのアクセスは、特定の職務の遂行に必要な個人のみに制限しています。
- 転送中および保管中のデータを暗号化します。
バイアス
潜在的に受け継がれるバイアス
実世界のデータでトレーニングされたほとんどのAIシステムと同様に、当社のモデルも、トレーニングや改良に使用されたデータセットから受け継いだバイアスを反映している可能性があります。 トレーニングデータの多様性は国や人口統計グループによって異なり、それが一部の集団や文書タイプのパフォーマンスの差につながる可能性があります。 当社はこうした要因を積極的にモニタリングし、データのリバランス、再トレーニング、公平性テストなどの手段を適用することで、ユーザグループ間の意図しないパフォーマンスの差を低減しています。
バイアスが受け継がれる潜在的な原因としては、次のようなものが考えられます。
- トレーニングデータの構成: 初期のモデル開発で使用される一般に入手可能なデータセットは、特定の領域、顔の特徴、または造影条件を過剰に反映している可能性があります。
- 画像の品質と文書の設計:写真の品質、印刷基準、ホログラム、セキュリティ機能の差異は、文書の種類によってパフォーマンスに影響を与える可能性があります。
- キャプチャ条件: 照明、カメラ機器、画像収集方法の違いは、様々な環境におけるモデルの結果に影響を与える可能性があります。
バイアス緩和の取り組み
EntrustのAIシステムは、意図しないバイアスを最小限に抑え、人口統計学的および地理的なグループ全体で公平な結果を促進するために開発され、継続的に改善されています。 バイアスを軽減するために、次のことを適用しています。
- モデルのトレーニングにバランスのとれた適応的なサンプリング手法を用いることで、地域的および人口統計的な多様性を確保する。
- 国、大陸、性別をまたいだ定期的なパフォーマンス評価を実施し、不均衡を特定して対処する。
- 過小評価グループに対するトレーニングの比重を高めるダイナミックサンプリング調整によって精度を向上させる。
- 実世界のドメインに固有のデータで微調整を行うことで(自撮り写真とドキュメントの比較など)、様々な画像タイプや条件にわたってモデルの汎化を強化する。
こうした対策によってパフォーマンス差は大幅に縮小されますが、どのAIモデルもバイアスを完全に排除することはできません。 当社は、責任あるAI開発プロセスの一環として、透明性、継続的な評価、継続的な改善に引き続き取り組んでいきます。
革新的な技術を責任を持って開発するという当社の取り組みの詳細については、ICO Sandboxレポートをご参照ください。
制限
当社のAIは一定の制限を受ける可能性があります。
- 範囲: 当社のAIは、不正行為防止に特化して設計されています。
- 言語: 当社のAIは、ラテン文字やアラビア文字を使用する言語に基づいた多言語入力をサポートします。
- コンテキスト:当社のAIは、入力データの真偽を判断します。
- ハルシネーション: 限定的なケースですが、情報がソース文書から不正確に抽出された場合、当社のAIは矛盾した結果を生成する可能性があります。
ヒューマンオーバーサイト/ヒューマンインザループ
Entrustは、ヒューマンインザループ(HITL)モデルを利用した本人確認サービスを顧客に提供しており、当社のAIシステムの運用において中心的な役割を果たしています。 このプロセスを通じて、熟練したアナリストがモデルの出力を定期的にレビュー、検証、改善することで、Entrustの責任あるAI原則に従ってパフォーマンスと整合性を向上させています。
モデルが本番環境にリリースされる前に、専門家が分析ダッシュボードと管理されたA/Bテストを使用してそのパフォーマンスを評価し、結果が品質と公平性の基準を満たしていることを確認します。 また、人間のレビュー担当者がデータのラベリングと検証を監督し、システム改善に使用されるトレーニングデータが正確で代表的なものであることを確認します。 一部の製品では、AIが異常な入力や不確かな入力を検出した場合、人間の専門家が引き続きリアルタイムで結果を評価することができます。
フィードバック
AIシステムの改善のため、皆様からのご意見をお待ちしております。 潜在的なエラーに関する詳細情報を提供される場合や、体験を共有していただく場合は、[email protected] までメールをお送りください。
顧客管理
当社は、データを完全に可視化し、お客様自身で管理できるようにすべきだと考えています。それにより、お客様のデータが当社のサービス向上にどのように役立っているかを、エンドユーザに偽りなく説明できるようになります。
当社の本人確認(IDV)システムは、機械学習を使用して精度を高め、異常を検出し、全体的なパフォーマンスを向上させます。 これらのプロセスへの参加は、すべてお客様の判断に委ねられています。 当社のIDVは、オプトアウト方式で運用されています。 お客様がオプトアウトすると、そのチェックはモデルのトレーニングを含むあらゆる機械学習アクティビティから除外されます。 お客様は、エンドユーザのデータが当社のサービスの開発や改良に使用されるかどうかを完全に管理することができ、アカウント設定を通じていつでもカスタマイズできます。
お客様が機械学習をオプトアウトした場合、そのお客様は品質管理(QC)プロセスからも自動的に除外されます。 当社の標準的な慣行の一環として、精度を検証し、継続的な改善をサポートするために、毎月すべてのチェックの約3%をランダムにレビューしています。 このようなQCの知見はモデルの信頼性を強化するのに役立ちますが、オプトアウトを選択すると、お客様のチェックはこのフィードバックサイクルから除外されます。
お客様が機械学習またはQCに参加しないことを選択した場合でも、当社のシステムは、分析、ベンチマーク、統計レポートといった合法的な業務目的のために、仮名化して集計されたデータを処理する可能性があります。 集計データには、個人を特定できる情報(PII)は一切含まれません。
継続的な改善
当社は、バイアスのモニタリングと公平性の評価を継続的なプロセスとして扱っています。 当社のAIモデルは、パフォーマンスを向上させ、問題を解決するために、定期的な見直しと更新が行われます。 不均衡が見つかった場合は、トレーニングデータ、サンプリング戦略、キャリブレーションパラメータを調整して、バランスと精度を改善します。
こうした取り組みは、責任あるAI開発に対する当社の包括的なコミットメントの一環であり、当社の検証技術がすべてのユーザ集団において可能な限り正確かつ透明性の高いものであることを保証します。 当社は、お客様に最新の情報を提供するために、本通知を毎年、または重要な変更が生じた場合に更新します。
最後更新日: 2025年10月28日