これまで、主に大学や大学院で統計学など、データサイエンスに関わる学問を学んだ人がデータサイエンティストという職に就いていました。しかし、近年は、経済や経営など、文系の学問を専攻した方もデータサイエンティスト職に就くケースが増えています。文系の経験はデータサイエンティストの業務に生かすことができるのでしょうか?
質問

「データサイエンティストは文系の経験を生かせる」という話も聞きますが、以下のような形で、文系の経験を生かすことに意味はありそうでしょうか。このような方向性によるデータサイエンス研究がありましたら、ご教授お願いいたします。また、以下とは別の方向による文系を生かしたデータサイエンス像もつかみたいので、関連するトピックを教えてください。

ビッグデータの中でも、数字ではなく、インターネット(サイト、ブログ、SNS)、アンケート、問合せ、発話という言葉のデータを扱う場面においては、歴史古典研究の研究法、研究感覚が関わると思われます。つまり、歴史古典研究では、文献の文章、言葉を読む上で、辞書の定義を当てはめるだけではなく、個々の使用者の言葉に対して加えているイメージ・意味も読み取る作業が行われます。

使用者に即した言葉の理解は、その人の真意、本人も言語化していない潜在的に持つ感覚を知ることにつながります。このような形で、入手した文章の内容以上の情報を得ていくのが、歴史古典研究の一面です。ビッグデータの研究でも、当然ながら、こうした文章に直接示されていない情報、言外の意味を読み取ることは重要だと思います。

扱うデータの量が膨大になると、当然ながら、精緻なプログラムを作成して、機械によりこの言外の意味を読み取る作業を行うことになると思います。すると、一度、歴史・古典研究などの作業手順が精緻にまとめられ、それをコンピュータプログラムに生かそうとする作業は意味があると思います。

回答

これから起きることは、あらゆる世界がデータ×AI化するということです。したがって、どのような分野であっても理数素養をベースにしたデータリテラシーが必要になってくると考えられます。

理数素養が欠落した文系というのは国外にはない概念ですし、文系固有の経験というものは一歩日本を出ると存在しないと思われます。しかし、例えば、服飾における素材や流通に関する造詣など、領域ごとの深いドメイン知識ということであれば、十分に意味があります(このような仕事をやっている方は文系が多いとは思いますが、それは単に日本の大学が極端に文系に偏っているからで、文系の経験というのは無理があります)。

質問の「辞書の定義を当てはめるだけではなく、個々の使用者の言葉に対し加えているイメージ・意味も読み取る」という理解は、意志と並んで、人間しか当面出来ない仕事の1つであり(AIによる自動化の見込みが立っていない)、そこが文系の仕事だとは思いません。ですが、この理解をある種の機械学習に対する正解データ的に活用する仕事は十分ありえますし、既存のデータのラベル付けや仕分けには不可欠だと思われます。

このように深いドメイン素養を持ち、そこにデータリテラシーを差し込むことで境界、応用領域の刷新を図るというのがこれからの姿だと思います。また課題解決は単に技術で起きるものではなく、実際には「課題(夢)×技術×デザイン」という形で起きます。この夢を描き、さまざまな要素を領域を超えてつないでデザインする力を持てるかが非常に重要になってくると考えられます。