地元の新聞に載った銀行強盗犯の写真を見て、タリーの勤めるビルで仕事をしている男が通報した。その監視カメラの映像を、顔認識ソフトウェアを使ってチェックし、「犯人はタリーに間違いない」と結論を下したのはFBIの専門家だった。

タリーにはアリバイがあったが、FBIの証言のせいで、汚名が晴らされるまでには1年以上かかった。その間2カ月も監房に入れられ、身の潔白が証明される頃には仕事も家も失い、子どもとも会えなくなっていた。何もかも、人ちがいのせいだった。

顔認識アルゴリズムは犯罪捜査で広く使われるようになった。顔写真や映像、3Dカメラの画像を入力すると、顔を検出して、特徴を測定し、データベース内の顔写真と比較して、身元を特定する。

ベルリンでは鉄道駅でテロリストの顔を見分ける顔認識アルゴリズムが試行運用されている。ニューヨーク州では2010年以降、詐欺やなりすまし犯罪の4000人以上の犯人逮捕にアルゴリズムが貢献している。

一方、人間の顔認識の実力はさほどでもない。イギリスで、パスポートをチェックする入国審査官に対して空港のセットをつくって行われた実験では、顔認識のプロである審査官が本人のものでないパスポートの14%を見逃し、パスポートと一致している人の6%を別人と見誤った。

だが、スティーヴ・タリーの例のように、犯罪捜査では誤認識が重大な事態を引き起こす。そこには大きな問題がある。じつは、皆が思っているほど顔認識アルゴリズムも顔の識別が得意でもないのだ。

顔認識アルゴリズムは主に2種類ある

顔認識アルゴリズムそのものは、主に2種類ある認識方法のいずれかを用いている。

ひとつは、2Dの写真を何枚も組み合わせるか、赤外線カメラで顔をスキャンするかして、顔の3Dモデルを作る。iPhoneのフェイスIDがこの方法だ。

これは変化しにくい組織や骨――眼窩や鼻筋など――を重視し、表情や加齢による変化の問題を回避する。アップルによると、フェイスIDで本人以外が携帯のロックを解除できる確率は100万分の1とのことだ。

だが、双子やきょうだいならロックが外れる場合があり、子どもが親の携帯を使える場合もある。3Dプリンターで作った特別なマスクでアルゴリズムを欺けるとも言われている。

パスポート検査や監視カメラの映像にはもうひとつのアルゴリズムが使われている。そちらは人が特徴として認識する目印にはほとんど注目せず、2Dの画像内の明暗のパターンを統計的に数値化する。そして膨大なデータからアルゴリズムに学習させる。

グーグルの顔認識用のニューラルネットワーク、フェイスネットはこうした統計値を用いたアルゴリズムだ。その能力を検証するために、有名人の顔写真5000枚を識別させた。

まず人間がその作業を行って、97.5%という正解率をたたきだした。とはいえ被験者がよく知っている有名人の顔なので、驚くほどのことではない。だが、フェイスネットはさらに優秀で、正解率はなんと99.6%だった。