大好きな数学で社会貢献できる分野を模索し、
データサイエンスの世界へ
ソフトバンク株式会社 AI戦略室AIエンジニアリング部AIエンジニアリング2課
課長 金 大柱 氏
プロフィール
金 大柱
ソフトバンク株式会社 AI戦略室AIエンジニアリング部AIエンジニアリング2課 課長
2013年3月、九州大学大学院にて博士号 (機能数理学)取得後、ソフトバンク株式会社に入社。
2013年4月~2018年3月 セキュリティ部門で社内システム開発業務に従事。
2018年4月~2019年3月 AI部門で機械学習システム開発業務に従事。
2019年4月~2020年9月現在 同部門課長としてOCR製品開発および管理業務に従事。
大好きな数学で社会貢献できる分野を模索し、データサイエンスの世界へ
いつごろからデータサイエンスに興味を持つようになったのですか。
中学生のころから数学を中心とした理系科目が好きで、大学2年生ぐらいまでは興味の赴くままに大学の講義を受けていました。進路について考え始めたのは大学3年生になったころですね。それまでに身につけてきた能力を生かして社会貢献できる分野で仕事をしたいと考え始めました。それでいろいろ模索してたどり着いたのが統計学だったんです。その当時、まだ統計学は今ほど注目を浴びる存在ではありませんでしたが、データの規則性や母集団の特性を数学的な手法で解析する点に魅力を感じました。博士前期課程・後期課程の期間、大変なこともありましたが、「一つの研究分野をとことん突き詰める」という非常に良い経験を積むことができました。
博士後期課程ではどのような研究をされたのですか。
タイトルでいうと「局所適応型正則化法に基づく非線形回帰モデリング」です。統計や機械学習は、データの裏にある構造を手元にあるデータからなるべく正確に推定する手法として用いられます。その現象の構造が多少複雑な形をしていたとしても、うまく推定できるような数理モデリングの研究を行っていました。また、私がいた九州大学大学院数理学府博士後期課程では3か月間のインターンシップがあり、某研究所で、主に自然言語処理の機械学習アルゴリズムに関する研究に携わりました。社会人になってから振り返ると、一企業の文化を知ることができた貴重な経験であり、現在、自分が在籍する企業の文化を意識しながら仕事ができているという点でも、非常に有意義であったと思います。
就職先としてソフトバンクを選ばれたのは、どのような理由からですか。
一言でいうと、新鮮で豊富なデータが蓄積されていると考えたからです。私が就職した2013年当時はiPhoneが大ブームで、ソフトバンクはドコモ、auに続く3つ目のキャリアとして参入し、多くの基地局を設置していました。そのような中で、モバイル端末を中心としたデータが日々継続的に蓄積されている点に大きな魅力を感じたんです。その大量のデータを分析してみたいとの思いから入社を決めました。はじめの5年間は、セキュリティ部門で社内システム開発業務に従事。ここでは、お客様にセキュアなサービスをお届けするためには何を想定してプログラミングし、サーバーを構成し、ネットワークの構成をつくっておくべきかという点をしっかり学べました。この経験は今の業務に大きく役立っています。
法人からの特注による製品開発とともに、SaaSでのサービス提供もめざす
現在の部署ではどのような業務に携わっているのですか。
博士後期課程で研究してきた数理科学、統計や機械学習の知識を生かし、特にOCR製品の開発やそのマネジメント業務に携わっています。OCRというのは文字を画像として取り込み、デジタルデータ化する技術ですが、そのモデルを機械学習を用いて開発し、お客様へサービスを提供しています。OCRは古くからある技術ですが、近年、深層学習や機械学習の技術発展に伴い、活字のみならず手書き文字を読み取る精度が向上し、自然ノイズを除去する性能も高まっています。特に、深層学習を使うことにより製品の画期的な精度向上がかなうため、昨今多くの企業が力を入れて取り組んでいます。
金さんの部署でも、企業などの個別の依頼に応じてOCR製品を開発されているということですね。
そうですね。基本的には企業などの法人から依頼があって、その要求に沿ったOCRをつくるという業務が多いですね。今後ともお客様からの受注に応えつつも、SaaS製品として一般の利用者様向けにサービスを提供したいと考えており、その両輪で走って行けるよう体制を整えたいと思っています。
今、従事されている業務にはどのような能力が必要とされますか。
統計、機械学習、深層学習といった技術を扱いますので、これらを理解するには数学や数理学の知識が必要です。例えば線形代数、微分積分、統計学や機械学習の手法についてしっかり理解しておくことが重要です。また、コンピュータサイエンスやプログラミング言語の勉強も欠かせません。特にサービスとして人気のある、画像処理や自然言語処理に関するナレッジはなるべく蓄積しておいたほうが良いと思います。私の場合、チーム開発や製品前提のコーディングなどは、就職してから現場で学びました。
製品の性能向上に努めるとともに、大学との共同研究などによる成果発表も視野に
課長としてマネジメントにも携わっていらっしゃいますが、心がけていることはありますか。
「成長し続ける強いAIエンジニアリング組織を構築する」のが私の役目だと思っています。私も身につけなければいけないスキルにばらつきがあり、まだまだ修行中の身ではありますが、エンジニア一人一人の成長を支え、時にはメンバーから教わりながら自身を成長させられるよう仕事に取り組んでいます。また、チームメンバーが活躍できる領域を広げるため、機械学習エンジニアリングのみならずソフトウェアエンジニアリングのスキルも習得できるようなプロジェクト管理を心がけています。 また、私が束ねているチームは総勢8人ですが、日本、インド、シンガポール、中国やマレーシアといった多国籍のチームです。慣れない土地で暮らすメンバーのフォローや、能力適性に合ったタスクアサイン、メンバー間のシナジーの創出やプロジェクトに積極参加しやすい環境づくりなど、試行錯誤を続けています。
今後の仕事での目標をお聞かせください。
現在、私たちがゼロからつくり上げたサービスを使ってくださるお客様が徐々に増えている状況です。中期的な目標は、今後さらに多くのお客様にご利用いただけるよう、製品の性能を確実に向上させていくことです。また長期的にはプロジェクトで創出した成果、大学との産学連携や共同研究で創出した研究成果を国際学会などで発表、論文化して科学界への貢献も果たしていきたいと考えています。実は、弊社は2019年12月、東京大学とともに「Beyond AI 研究推進機構」を立ち上げました。共同研究の中で成果が出たものについては迅速にビジネス応用できるような体制が整いましたので、ここでも積極的に活動し成果が出せれば嬉しいですね。
本学大学院でデータサイエンスを学ぶ意義とは
本学が教育・研究の対象としているM&D分野で、データサイエンティストは何を求められているとお考えですか。
メディカルサイエンスでいうと、まずはAIによる画像データ解析によって腫瘍の発現箇所を見極めるといった技術が進んでいます。AIモデルの腫瘍検出精度で本物の医師に匹敵するほどの精度が出ている領域もあり、このような技術は医療の課題を解決する一助になると考えます。また、ゲノムデータの解析では、高次元の統計理論を使い効率的に情報を抽出することで、特定の患者群の抽出を行うことが可能です。さらに、カルテについても完全に電子化して、関係する医療従事者であればセキュアな環境で誰でも見られるようにするといった取り組みも期待されます。 画像診断などで病気の発現箇所を見極めたいなどの予測性能を重視したい場合には、機械学習あるいは深層学習が有用ですし、事象の解釈が求められる場面では統計的手法を使えばいいでしょう。場面に応じてそれらの手法を使い分けできるスキルが求められていて、かつ適切な手法でデータを分析し結論を導く能力が求められていると思います。
本学大学院でデータサイエンスを学ぶメリットはどこにあると思われますか。
研究志向が強い学生、一つの分野を究めたいという学生には大学院進学を勧めます。また、その大学院で取り扱う内容が独創的であればあるほど、希少価値の高いスキルが身に付くことが期待されます。その点、東京科学大学はメディカル分野・デンタル分野に特化した知見やデータが豊富に蓄積されており、それらとデータサイエンスを融合した研究ができる日本で唯一ともいえる環境です。東京科学大学大学院に行かなければできない貴重な研究に挑戦してほしいですね。
最後に、本学大学院でデータサイエンスを学ぼうと考えている学生にアドバイスをお願いします。
私が大学院にいたころとは違い、新しい論文が発表されれば論文はWEBで簡単に閲覧でき、その実装が同時に公開されることも多く、運が良ければ動画で内容を詳細に説明してくれている場合もあります。このように勉強や研究の環境が整ってきている反面、自分の独創性を出すことが難しくなっているとも言えますよね。だからこそ他者との差別化を意識し、自分が戦っていく分野を意識しながらスキルを伸ばしていってほしいと思います。独創性は、自分がとことん興味を持った分野で研究を主体的に進める過程で養われ、発揮できると考えます。 自分が興味を持った一つの分野をとことん研究しつくした経験があると、ほかの分野に挑戦するときにも広い視野で見渡せるようになります。私自身も博士後期課程まで行って研究に没頭したことが、ほかの場面でも活きているという実感がありますし、弊社内でも、そういう経験がある人は伸びる傾向にあると感じています。 いろいろお話ししてきましたが、少しでも多くの学生の皆様がM&Dデータ科学センターで多くのスキルと経験を積み、メディカルデータサイエンスの先駆者として成長されることを祈っております。