2022.11.24.
東剛且さん(長田典子研究室所属・4年生)がMUFG Data Science Champion Ship「クラウドファンディングの資金調達の成否を予測しよう!」で1位入賞

 東剛且さん(長田典子研究室所属・学部4年生)が8月30日から9月22日にかけて開催されたコンペ、MUFG Data Science Champion Ship「クラウドファンディングの資金調達の成否を予測しよう!」において1位入賞しました。宮嶋大輔さん(長田研所属・学部4年生)も7位に入りました。

このコンペは三菱UFJ銀行、三菱UFJ信託銀行、SIGNATEによる学生向け(大学生、大学院生対象)データサイエンスコンペティションで、既にデータ分析に知見のある学生だけではなく、未経験者に対しても学習コンテンツを無償で提供し、プログラムを通してデータ分析を身近に感じていただけるカリキュラムとして開催されました。
「MUFG Data Science Champion Ship」は、プロジェクトの資金調達の成否予測を行い、予測精度の高さで順位を競うデータ分析経験者向けのコンペティションです。

タスク内容は、クラウドファンディングの調達目標金額やアピール文章といった定量および訂正データを元に分析モデルを構築して、資金調達の成否の予測をするものです。このモデルの精度の高さを競うコンペで東さんは最終評価1位、宮嶋さんは7位になりました。

東さんをインタビュー

■問題解決やその対処が得意なので、その性質を活かしてチャレンジしました

 今回はHTML言語から解析して、資金調達できるか・できないかを予測するための分析モデルの精度を競うというものでした。
このモデル作りがすごく難しく、より良いモデルが作れたら良い予測を導き出せるということになります。今回は、HTML言語の文章から特徴を取り出して、自然言語処理を使って進めました。
 研究では自然言語処理を使った言葉と言葉の関係の研究をしています。データサイエンスは勉強したいと思っていましたがモデル作りは経験がなく、未経験の取り組みでした。

本当にゼロからのスタートだったので、同じような研究をされている方はいないかサーベイするところから始めました。今回もプロのエンジニアかどうかに関わらず、成績を残されている方や実績のある方のやり方を参考にして自分のオリジナルに仕上げていけたことが一番大きなポイントだったなと感じています。このプログラムもモデルの組み方を調べるところから始めて、とにかく1つやって、できたら次のステップ、できなかったら調べなおして、いろんな方が共有してくださっている多くのデータを参考に自分なりに工夫していきました。

ただ、なぜ結果につながったのかの詳細を理解していないところもあり、将来エンジニアを目指す身としては根拠を示しきれなかったことが勉強不足だと痛感したところです。そこが今後の課題です。
 

■この言語モデルを使って、今後は「人はどういうことを考えているのか?」検証したい

 今は感性工学という人が受ける印象や人間の感性についての研究を行っていて、人の奥底の潜在的な気持ちを読み解く手段として言葉や特徴量※(※機械学習において分析対象データの中の、予測の手掛かりとなる変数のこと。)の関係が大切だと感じています。これを理解することで好みの個人差が大きいプロダクトデザインや商品開発に活かし、潜在的ニーズに合った商品提供ができると考えています。今はECサイトのレビューデータを用いて投稿者の潜在意識や価値観などの因果関係を取り出す研究をしていますが、言語モデルの活用により個人の価値観を精度よく捉えることができるのではないかと思っていて、自分の研究と今回のコンペをリンクさせていきたいです。

また、このコンペに参加するためにたくさんの方々の経験の共有により完成させることができたので、将来的には自分が作ったコードを広く共有して、それを知った人たちが上位を取ってほしい思いがあります。僕が皆さんの成果を見せていただけたことで今回の結果につながっているので、次に取り組もうとしている人に今度は僕が伝えていける立場になりたいです。


■完璧でなくても、素直に伝えたら楽しめました

 表彰式では入賞者のプレゼンをする機会をいただきました。他のスピーカーはデータサイエンスや自然言語処理研究で言語モデルを使ってますという方が多いので、みなさんモデルの仕組みなど詳細に説明されるのですが、僕はそれができないので長田先生にも相談して素直に自分がやったことをお話しました。知らないから・できないからといって変に整えようとするのではなく、やったことを共有する場なので、素直に「ゼロから始めたので、色んな人のものを盗むところから始めました。」から初めて、本当に1から学んだ方法を参加者からの質問を受けつつ、お話をさせていただきました。技術紹介とかプログラミングの説明だけではなく、ストーリー性があって聞き手が想像できるようなプレゼンを意識したことで、オーディエンスの方からの反応もとてもよく、手ごたえを感じることができ、向上心の強い方々とのやり取りもさせていただくことができました。


■言葉を使い、技術や意識を組み合わせたエンジニアリングが面白い

 感性の話で言うと、世界中の人は例えば服の好みとか、自分にとって似合うものなどを分かっている人って少ないのではないかと思います。それを商品レビューなどから心理的に分析したデータを得て、購入者や購入検討している人に「こういった服はいかがですか?」という提案も可能になると思っています。 価値観にあったものを心理的データから引き出してきて、それをつなぎ合わせてスーツを作り上げていくようなシステムを先輩方は研究されていて、 僕はそれを助けるような心理的データを集めて、分析して、パターンを見つけていくようなつなぎ目の役割です。もと精度を上げるためにも更に勉強して技術力をつけて行きたいと思いました。自然言語処理を用いたり、データサイエンスを用いて新しいものを生み出せるエンジニアを目指していきます。

関連ページへのリンク

MUFG Data Science Champion Ship (三菱UFJファイナンシャル・グループ)

最終評価ランキング