アメリカのデータサイエンティストが、ドナルド・トランプ次期米国大統領による選挙中のツイートについて、ある仮説を検証した。
それは、「トランプのツイートのうち、誇張され攻撃的なツイートは本人が使うAndroidから、良心的なツイートは選挙キャンペーンスタッフのiPhoneから呟かれている」というものだ。
テキストマイニングの技術や統計専門ソフトの力を総動員し導かれた結論は、やはり仮設の通り、トランプ大統領は我々が思っている以上にもっとひどそうだ、ということだった。
Photo credit: Gage Skidmore via VisualHunt.com / CC BY-SA
「iPhone」からツイートするトランプは、なぜか普段より優しい
日本でも頻繁に話題に上がるトランプ大統領によるツイート。
選挙戦中にも、対抗馬を激しく攻撃したり、メディアを嘘つき呼ばわりしたり、差別的なツイートをしたりと、トランプのTwitterは大きな波紋を呼んでいた。
そんな中、選挙キャンペーン中のトランプのツイートを見ていたTodd Vaziri氏が、ある法則に気がついた。
Every non-hyperbolic tweet is from iPhone (his staff).
Every hyperbolic tweet is from Android (from him). pic.twitter.com/GWr6D8h5ed
— Todd Vaziri (@tvaziri) 2016年8月6日
このVaziri氏によるツイートを翻訳すると次のようになる。
全ての誇張的なツイートはAndroidから呟かれている(トランプ本人)。
確かにVaziri氏の指摘する通り、トランプがオリンピックチームに「Good Luck(幸運を祈る)」などと良心的なツイートをする時には決まってiPhoneからツイートが行われ、ライバル候補を激しく罵る時には決まってAndroidからツイートが行われていた。
iPhoneを使用する選挙キャンペーンの本部スタッフが、無害な優しいトランプ像を演出し、トランプ本人はひたすら悪口をツイートし続けているのではないか。
こうした憶測が広がり、この指摘は大きな話題を呼ぶことになった。
実際、トランプはオフィスにパソコンを持っておらず、SumsungのGalaxy(Androidスマートフォン)を使用してツイートしていると報道されている。もしiPhoneとAndroidのツイートに明確な違いが存在するとすれば、Androidからのツイートだけが本人によるものだと言えそうだ。
データサイエンティストがトランプのツイートを分析!
この話題にインスパイアされたのが、データサイエンティストのDavid Robinson氏だ。
Robinson氏は、プリンストン大学のPhD(定量・コンピュータ生物学)を取得し、現在はプログラマー向けのQ&AサイトStack Overflowでデータサイエンティストとして活躍している。
いわば、統計やデータ分析のプロである。
Robinson氏は、Vaziri氏によるトランプのツイッターに関する仮説を統計的に検証するため、トランプのTwitterアカウント(@realDonaldTrump)を統計ソフトで分析することにした。
統計分析ソフト「R」でツイートの分析を可能にする「twitteR」というパッケージを用いて、トランプのタイムラインからツイートデータを取得し、ごく少数の例外的ツイート(iPadなどによるもの)を取り除き、iPhoneからの628ツイートと、Androidからの762ツイートを精緻に分析したという。
すると、次のような傾向が浮かび上がってきた。
トランプ米大統領のツイートの統計分析結果
- iPhone(スタッフ)が午後又は夕方早くに多くのツイートを行う一方、Android(トランプ本人)は午前中にずっと多くのツイートを行なっている。
- Androidによるリツイートだけが、公式のリツイート機能ではなく、わざわざ自分でコピペし「“”」マークを付けるという「時代遅れ」の方法で行われていた。
- 写真やリンクを含むツイートは、iPhoneによって、Androidより38倍多く行われていた。イベントの告知などのツイートも、iPhoneが行う傾向にある。
このように、ツイートの傾向を分析していくと、トランプのTwitterアカウントのiPhoneとAndroidは、別の人物によって運用されている可能性が高いことが明らかになった。
さらに、Robinson氏は、自身が開発したテキストマイニングパッケージ「tidytext」を用いて、ツイートの内容そのものの分析までも行なっている。
トランプ米大統領のツイートのテキストマイニング結果
- 大半のハッシュタグ付きのツイートはiPhone(スタッフ)によって行われていた。ごく稀な例外を除いて、Android(トランプ本人)からのツイートではハッシュタグが使用されていない。
- join、tomorrow、7pmといったイベントの告知に用いられる単語は、iPhoneからのツイートにしか含まれていなかった(告知ツイートの例:Join me in Houston, Texas tomorrow night at 7pm!)。
- badly、crazy、weak、dumbなど、感情的な単語はAndroidからのツイートに多く含まれていた。この事実は、誇張され、怒りに満ちたツイートがAndroid(トランプ本人)によって行われているという仮説を支持するものである。
Robinson氏は、これらのトランプのTwitterアカウントの分析を終え、次のように結論している。
データサイエンティストRobinson氏によるトランプのTwitter分析結論
My analysis, shown below, concludes that the Android and iPhone tweets are clearly from different people, posting during different times of day and using hashtags, links, and retweets in distinct ways.
ここに掲げる私の分析は、次のような結論を導いた。AndroidとiPhoneのツイートは、明らかに別の人物によるものである。異なる時間帯に、異なる方法でハッシュタグ・リンク・リツイートなどが行われている。
What’s more, we can see that the Android tweets are angrier and more negative, while the iPhone tweets tend to be benign announcements and pictures.
さらに、iPhoneのツイートが無害で温厚な告知や写真掲載をする一方で、Androidのツイートはよりネガティブで怒りに満ちていることが分かる。
Overall I’d agree with @tvaziri’s analysis: this lets us tell the difference between the campaign’s tweets (iPhone) and Trump’s own (Android).
総合すれば、私はVaziri氏の分析に賛同する。すなわち、統計分析により、キャンペーンスタッフによるツイート(iPhone)と、トランプ本人によるツイート(Android)を区別することができたということだ。
やはり、Varizi氏の仮説が話題になった通り、「悪いツイート」はトランプ本人によるもので、時々現れる「良いツイート」はスタッフによるものだということが明らかになった。
トランプのツイートは酷い。でも、トランプ本人はもっと酷い。
アメリカでは、政治家がTwitter上で積極的に発言を行なっており、国政上の重要なことまでもツイートによって周知されることがある。
特にトランプ米大統領は、選挙戦中から非常に多数のツイートを行なっており、トランプのツイートによって株価が大きく変動したり、世界中でニュースが駆け巡るなど、トランプの考え方や政策を知る上で、ツイッターは非常に重要な情報ソースになっている。
多くのアメリカの有権者や、世界中でトランプのツイートを見ている人々は、トランプのツイートから、本人がどのような人物かを推測をしていたわけだが、今回の統計分析によって、トランプの選挙キャンペーン中のツイートの約半分はスタッフによるものだということが明らかになった。
トランプのTwitterアカウントのうち、温厚なコメントの大半がスタッフによるものであるということは、トランプ大統領は我々が思っている以上に暴言ばかりをツイートしていたことになる。
これからの大統領任期中、トランプは記者会見やインタビューなど、ツイッター以外で露出する機会が増えていく。
トランプのツイートを見て、アメリカの代表がこのような人物であることを残念だと感じている人がいるならば、もっと失望が深まることを覚悟しておいた方がいいかもしれない。
トランプ本人は、ツイッター上のトランプより、もっと酷いのだから・・・。