自然言語処理で読み取る、CEOメッセージに込められた企業文化

2019-11-01

PwCのARCA(アドバンスト・リスク・アンド・コンプライアンス アナリティクス)チームでは、先進的なテクノロジーをガバナンス・リスク管理・コンプライアンス(GRC)分野にどのような形で応用できるかを、常に調査しています。本コラムでは、「Word2Vec」という自然言語処理の技術を用いて行った、日本企業のCEOメッセージ分析とその結果について解説します。

Word2Vecとは

Word2Vecは2013年にトマス・ミコロフ(Tomas Mikolov)氏によって提案された、言語データの分析と応用のための手法です。学習対象の文章を多数与えると、単語をベクトルとして表現できるようになるモデルです。「ベクトルとして」という表現にはなじみがないかもしれませんが、直感的には、ある平面上に言葉を並べる技術としてイメージいただければよいと思います。

このモデルのメリットは、単語同士の意味の近さを計算したり、単語同士の意味を足し引きしたりできるという点です。結果として、ある言葉の類義語や対義語の探索が容易になります。2019年現在、Word2Vecから発展して多数の自然言語処理技術が開発され、性能が日々向上していますが、本コラムでは、これらの基礎であるWord2Vec自体を利用した分析をご紹介します。

約2,000社のCEOメッセージを分析

今回分析の対象としたのは、インターネット上に公開されている日本企業のCEOメッセージです。CEOの発するメッセージが企業のリスクマネジメントと密接に関連しているという分析は既に多くなされており、米国ではCEOメッセージをもとにしたスコアリングやランキングの発表も実施されています。従来、こうした分析はアナリストに委ねられており、人間がその文章に目を通して、どのような内容に力点が置かれているかを調査する必要がありました。一方、Word2Vecを用いれば類義語の探索が容易となるため、例えば、ある企業はコンプライアンスに関連する言及が多い、ある企業は利益に関する言及が多い、といった傾向を調べやすくなります。

私たちは、2019年7月末時点の東証一部上場企業を対象に、上記分析を実施しました。東証一部2,152社のうち、インターネット上で取得できた1,957社のCEOメッセージを、Word2Vecを用いてベクトル化を行いました。そのうえで、8項目(1.コンプライアンス、2.大胆さ、3.安定性、4.顧客、5.利益、6.イノベーション、7.グローバル、8.信念)の観点から、それぞれの要素がどの程度言及されているか、業界別、企業規模別にスコアリング(偏差値で表現)を実施しました。無論、それぞれのCEOメッセージが意図している読者は大きく異なるケースがあり、一律の比較には注意が必要ですが、業界や企業規模といった単位でまとめることで個別企業の差が吸収され、全体の傾向を捉えることは可能と考えます。

企業規模・業種などで見るCEOメッセージの傾向

まずは企業規模別の結果となります。先述の8つの観点について、図表1に企業規模別(TOPIXニューインデックスシリーズの一部を使用)のスコアを表示しています。結果はかなり明瞭で、コンプライアンスに関する言及は企業規模が大きくなるほど高くなり、イノベーションはTOPIX Core30企業群が突出して高い、などの結果が見て取れました。

また、平成30年間で時価総額を最も伸ばした企業Top 10に限定して見ることも試みました。これらの企業が発したメッセージの中では、図表2の通り、イノベーション、グローバルと並んでコンプライアンスにかかわる言及が多かったことが分かりました。「コンプライアンスを重視する企業が長期的な成長を実現する」と一般的に言われますが、この仮説がサポートされる一つの結果が得られたと考えられます。

最後に業種別の結果となります。図表3に、各項目がどの程度言及されているのかを、業種別にまとめました。結果は概ね一般的な想像とマッチすると言えるのではないでしょうか。例えばコンプライアンスについては自動車、鉄鋼が高くなっています。これはコンプライアンス関連の問題がフォーカスされた企業があったことによると思われますが、業界全体に影響が出るという点は注目に値します。また、イノベーションについては電力自由化の影響もあってか、電力・ガスが最も高くなりました。

日進月歩の自然言語処理技術

簡単ではありますが、以上がWord2Vecを用いた分析結果となります。近年急速に発達する自然言語処理技術を用いることで、人間では多大な時間を要する作業が容易に実行できるようになること、またそこから新しい知見が得られる可能性があることをご理解いただけたのではないでしょうか。

2019年の時点で自然言語処理技術は、まさに日進月歩の様相を呈しています。BERT(Bidirectional Encoder Representations from Transformer)に代表されるような、より高精度かつ汎用性のあるモデルも利用されるようになってきました。ARCAチームでは最新技術の動向を継続的にフォローしています。得られた知見について、今後もコラムやセミナーを通じて継続的に発信していきます。

本コラムに関するお問い合わせがございましたら、以下までご連絡ください。

辻田 弘志
PwCあらた有限責任監査法人 パートナー
hiroshi.tsujita@pwc.com

執筆者

霜坂 秀一
PwCビジネスアシュアランス合同会社 マネージャー

※法人名、役職などは掲載当時のものです。


{{filterContent.facetedTitle}}

{{contentList.dataService.numberHits}} {{contentList.dataService.numberHits == 1 ? 'result' : 'results'}}
{{contentList.loadingText}}

{{filterContent.facetedTitle}}

{{contentList.dataService.numberHits}} {{contentList.dataService.numberHits == 1 ? 'result' : 'results'}}
{{contentList.loadingText}}