ソフトバンク孫氏の「日本が金をとれるように」発言における「コンテキストと共起」に関する考察

 ある日会社から帰ってテレビのスイッチをつけた瞬間、ソフトバンクの孫社長がテレビに出ていて、映像のテロップに「日本が金をとれるように」と書いてありました。その瞬間、孫社長が「金(カネ)をとれる」ようにといっているのは、何のビジネスについてだろうと思いました。ニュース映像が進むと、その発言が北京五輪の野球で「金(キン)をとれる」ようなチームを作るためには、主力選手の出し惜しみをしないというソフトバンク・ホークス孫オーナーとしての発言だということがわかりました(関連記事「ソフトB孫オーナーは五輪も支援」)。
 この場合、隠れた主語は映像より「孫氏」だとわかり、ビジネスマンとして著名な「孫氏」と「金(カネ)」の連結強度が極めて強く、プロ野球球団オーナー「孫氏」が一部選手を送り出す五輪チームの「金(キン)」メダルとの連結強度が弱いため、テレビをつけた瞬間のコンテキストがない段階では意味理解を間違えたという状況でした。このようなことを体験して、自然言語処理における「コンテキスト」と「共起(きょうき)」について少し考察する機会を得ました。………<続きを読む>………

 言語処理分野において、「共起」という概念があります。同じ文章の中で、複数の単語が同時に使われる可能性が高い状況を指します。たとえば、
■「横綱が九州場所で優勝した」
という文章があった場合、この文章には下記の2つの「共起」の関係が存在します。
●簡単な方●
 「横綱」・「優勝」が「共起」の関係にあります。
●複雑な方●
 「横綱」という単語からこの文章が「相撲ドメイン」の文章であることがわかり「九州」と「場所」はばらばらの単語ではなく、「九州場所」という大相撲6場所1つである「九州場所」のことを指す単語だということがわかります。このような時、「横綱」・「九州場所」が、あるいは、「横綱」・「九州」・「場所」が「共起」の関係にあります。

 最初の「孫氏のカネ・キン問題」は、コンテキストがない時は、「孫」(社長)と「金(カネ)」が強い「共起」の関係にありますが、一旦、五輪関係のニュースが頭に入った後では(頭データベースに記録された後では)、五輪のコンテキストがあるニュースにおいては、「孫」(オーナー)と「金(キン)」が弱い「共起」の関係になったと言えます。

カテゴリー: ウェブ・技術 パーマリンク