ZOZOテクノロジーズは9月2日、服のコーディネート約255万件とアイテム約200万件などを含むデータセット「Shift15M」をオープンソースとしてGitHubで公開したと発表した。服の流行が変化してもAIの認識精度を高く保つための研究への活用を見込む。

 公開したデータは、服のコーディネートを試せるアプリ「IQON」で2010〜2020年に投稿されたコーディネート情報や、投稿日時、「いいね」の数、ジャンルやカテゴリー情報、機械学習用に付与したラベルなど。

 同社によると、ファッション関連のデータは流行の変化や新製品の登場によってデータの分布が変わる「分布シフト」という現象が起き、AIによる認識精度が低下する。分布シフトはファッション以外の分野でも起きるが、これまでデータセットの不足で研究が進まなかったという。

 Shift15Mと合わせて、10年間のコーディネートの傾向を基に分布シフトの再現実験などができるソースコードのセットも公開した。分布シフトが発生する条件下で「いいね」数や価格などの推移を分析でき、分布シフトの解決策を探るのに役立つという。