Amazon Rekognitionを用いた顔検索機能の開発事例
教育機関を中心にスポーツ団体・企業等さまざまなイベントの撮影、インターネット上での写真販売を行う「はいチーズ!」や、保育業務支援システム「Hoisys」などの保育Techを提供する千株式会社。
今回は、「はいチーズ!」で販売される1万枚以上の写真から我が子の映った写真を検索できるAWSの深層学習による画像認識AIサービス「Amazon Rekognition」活用の効果をお聞きしました。
AWSの深層学習による画像認識AIサービス「Amazon Rekognition」
「顔検索」機能の開発の裏側
まずは、御社のプロダクト「はいチーズ!」の概要について教えてください
千株式会社 SREチームリーダー 宮里新司さん(以下、宮里):「はいチーズ!」は、2006年に開始した幼稚園・保育園の教育機関を中心にさまざまなイベントの撮影、インターネット上での写真販売を行うサービスです。従来の写真販売方法で主流となっていた壁貼り販売と比べると、先生方は、業務時間外で実施することが多かった撮影・掲示・印刷・集金/集計・配布などの手間から解放され、保護者は、写真購入がいつでもどこでも行えるようになりました。現在は、全国に6,000以上導入実績がございます。2017年より、AWSのAmazon Rekognitionを用いた「顔検索」機能を開発し、子どもの顔をより早く簡単に見つけることができるようになりました。
写真を探す手間をAIが削減
なぜ顔検索機能を開発したのでしょうか?
宮里:「はいチーズ!」は、入園式や運動会など1イベントに対して1000枚以上の写真撮影をすることがあります。壁貼り販売と違い、掲示場所に限りがないインターネット販売は多くの写真を見ることができる一方で、膨大な写真の中から我が子の写真を探す手間やストレスが課題となっていました。そこでお子様の顔で検索できる顔検索機能があれば解決できると思い、検証を開始しました。自社で開発することを模索しながら、他社製品の検証を進めている中で、2016年12月にAmazon Rekognitionがリリースされました。検証した結果、精度が十分高いことがわかり、また「はいチーズ!」はインフラにAWSを活用しておりRekognition利用の親和性が高いこともあり、採用することになりました。
Amazon RekognitionのAPIは、シーン分析や顔検出など、様々なAPIが提供されていますが、顔検索機能で使用しているAPIは以下の3つです。
・CreateCollection:顔コレクションを作成 ・IndexFaces:顔メタデータ(顔の特徴を表すベクトル)を顔コレクションに追加 ・SearchFacesByimage:指定した画像で顔コレクションないの類似画像を検索
効果がでない苦節3年を経て
顔検索導入後は、どんな効果がありましたか?
宮里:2017年のサービス開始から3年が経過し、現在購入CVRは17%ですが、『顔検索機能』リリース当初は、「集合写真で検出ができない」「CVR、売上などに期待したほどの効果が見られない」という大きな課題に直面しました。
大きな課題をどのように解決したのでしょうか?
宮里:一つ目の課題は、「集合写真で検出ができない」ことです。集合写真では15人以上写る園の方が多いものの、当初のAmazon Rekognitionは、1画像から検出できる顔の上限が15人までだったのです。学校や園などの教育機関では集合写真のニーズが高く、せっかくの顔認識機能を充分に活かしきれていませんでした。そこで 1画像あたりの顔の人数を減らすため、集合写真の場合は、2分割あるいは4分割を行うことで最大60人までの集合写真での顔検索を可能としました。ただ、分割させるため検索までに20秒もかかっている状態でした。
*仕組み
宮里:その後、AWSがAmazon Rekognitionのアップデートを発表。1画像あたり最大100人の顔検出が可能な「人混みモード」が追加され、分割せずに集合写真の顔検出が可能になりました。結果、集合写真の顔検出の実行回数は7回から1回へ、分析時間は20秒から3秒に短縮されました。
二つ目の課題は、『顔検索機能』は、瞬時に我が子だけを表示するので便利な反面、ユーザーである保護者は顔検索のために我が子の画像をアップロードすることに抵抗があったり、アップロードしても検索に適していない画像だったりと当初は期待したほど顔検索機能の利用ユーザー数が上がりませんでした。
そこで、購入履歴から我が子の顔を特定し、その顔で予め検索した結果を表示する『おすすめ機能』を開発。我が子が写った写真だけが表示されるようにしたことで”面倒だ”と感じさせる作業をなくし、購入CVRを17%にすることに成功しました。
*3年間の経緯
開発時、特に苦労したことはありますか?
宮里:この3年間一番大変だったことは、『おすすめ機能』の開発において、検索精度を目視で確認したことです。検索ヒットしてほしい子ども(顔)がヒットしているのかいないのかを約2000枚の写真を目視で確認しながらチューニングしました。また、検索画像選出条件の改善や、横顔・ピンボケ写真は購入履歴の写真を事前処理する段階で除外するなど試行錯誤しながら、少しずつおすすめ写真の精度をあげていきました。
今後これができれば面白いなと思うことはありますか?
宮里:Amazon Rekognitionを触ってみて、これは革命的な機能だと思いました。顔で画像を検索できる!しかも大量の写真を検索しても数秒で完了するのは感動でした。AWSが発表したAI系のサービスの中で一番分かりやすい機能ですし、精度も高いのでAIの民主化の一翼を担っていると思います。今度、千株式会社のサービスで動画を取り扱うことも増えていくので、動画版の対応も検討していく予定です。
その他にも、下記のようなサービスでAmazon Rekognitionを使用しています。
・卒園卒業アルバム制作サービス「はいチーズ!アルバム」人物自動集計機能 https://sencorp.co.jp/news/topics/3129.html
・卒園卒業アルバム制作サービス「はいチーズ!アルバム」顔検索機能 https://sencorp.co.jp/news/topics/4132.html