テキストマイニング、ビックデータ、などがBuzzワードになって久しい昨今、何年か前から話題になってる「twitterから株価予測」というお話がなんだかもうビジネス化してるみたいですね。
Social Market Analytics http://www.socialmarketanalytics.com/
サイトそのものがなかなかイケててよいです。
最近ではニューヨーク証券取引所との提携もはじめたみたいです。
きっかけとなった論文
こちらのサービスといいますかこの話題のそもそもの発端は、
という論文がarXivで発表されたことでした。当時いくつかのメディアでも紹介されたかと思います。
ちなみに日本語での詳しい解説はこのあたりのサイトがとてもおすすめ。
SMAの概要:S-Factors™
どういうことをしているのかを簡単に言いますと、
「マーケットに関係するtwitterの投稿を分析し感情=sentimentに関わる情報を引き出し、それをスコア化する」
そのスコアを総称して「S-Factors™」と呼んでいます。
S-Factors™の構成要素
S-Factors™は以下のいくつかの要素で構成されていて、
- S-Score™: 観測期間における「感情」を数値化・標準化したもの
- S-Mean™: 観測期間におけるS-Score™の加重平均したもの
- S-Delta™: 観測期間におけるS-Score™ の変化率
- S-Volatility™: 観測期間における感情レベルのボラティリティ
- S-Volume™: ある観測時点におけるS-Factors™ に寄与・関係するツイートの量を計測したもの
- S-Buzz™: 異常時のツイート数を計測したもの
- S-Dispersion™: S-Score™算出に寄与したツイートのソースを計測したもの
(出所:S-Factors Applications Guide(pdf)よりyuu-koma.jpが意訳)
これらを総称して「S-Factors™」といっているようです。
一般に、このS-Score™がプラスであればあるほど、マーケットや銘柄に対して「ポジティブ」「好意的」な感情をもっていることを示し、逆にマイナスであればあるほどマーケットや銘柄に対して「ネガティブ」「否定的」な感情をもっていることを示すとのことです。
そして、この市場に対する「感情」が株価に影響を与えるのではないか、と考えるわけです。
無料のアカウント登録が可能
こちらのサービス、だれでも簡単にアカウント登録できまして、毎日のスコア上位下位銘柄のサマリーをレポートする「Daily Newsletter」であれば無料で配信を受けることができます。
詳細なレポート、カスタマイズしたレポート、そしてデータフィードなどは有料のようです。データフィードサービスになると法人、金融機関やファンドなどが顧客になるのでしょう。
実際のサービス内容の例
さて実際の中身ですが、その大変使い勝手のいいウェブサイトのスクリーンショットをもとに説明してみます。
ここでは、2013年2月におけるApple(http://www.socialmarketanalytics.com/graph/stock/AAPL)を例にしてみましょう。
上段には、3つのチャートがあります。そのうち2つがS-factorにおける「S-Mean(緑)」と「S-Score(赤)」。あらためて説明しますと、S-Scoreはスポットのスコア値、そしてその移動平均をとったS-Meanでした。
どちらのS-factorも「Pre-Open」となっているのがポイント。つまり、マーケットが開く前の数字だということです。
つまり、マーケット開始前の感情の状態がその後のマーケット開始後の株価にどう影響をあたえるのかを見ている、S-factorを先行指標として用いているというわけです。
そして残る3つ目の青いチャートが株価、その日の終値。
ざっと見る限りではS-factorと株価はそこそこ連動しているように思えます。スポット値のS-Scoreよりも緑色のS-meanのほうがより連動性がよさそうでしょうか。
必ずしも予測力があるわけではなさそう
しかし、必ずしも予測力があるかというとそうでもなさそうです。 Google(http://www.socialmarketanalytics.com/graph/stock/GOOG)を見てみますと、
2/21以降では、S-Meanを見る限りではどちらかというとネガティブな領域に入りつつあったにもかかわらず株価は持ち直しています。
当然ながら万能ではないわけですね。モデルの精度が悪いのか、そもそも人々の感情が相場に素直に反映される事自体が万能でない、いろんな考えがあるのでしょう。
ちなみに上記の例では直近一ヶ月における日々の状態を見ましたが、日中の動き=Intra dayについても見ることができます。こちらもなかなかおもしろいので是非ウェブサイトで確認してみてください。
予測力についての統計的な検証
実際に予測力はどの程度なのかについては、同サイト内に掲載されている以下の報告書にて確認することができます。
SMA Sentiment and 24hr Price Changes http://www.socialmarketanalytics.com/content/sentiment_and_24hr_price_changes
こちらの報告によりますと、オーバーナイトリターン(前日終値から当日始値の変化率)とマーケット開始前(Pre-Market-Open)のS-Scoreに有意な関係があるとのことです。
(出所:http://www.socialmarketanalytics.com/content/sentiment_and_24hr_price_changesよりyuu-koma.jpが加工)
また、当日始値から当日終値の変化率についても、株価5ドル以上の銘柄ではそれなりに有意な結果であったとのこと。ただし、その効果はオーバーナイトのものと比べるとその効果は小さいようです。
最後に
ということで、以上、この新しいソーシャルメディアを活用したひとつのサイトを紹介して来ました。
このようなサービス、ビジネスは当然ながら日本では本格化していない、いやアメリカですら始まったばかり。なんだか面白い時代になってきたなあと実感しています。
この手の話題、もともと僕自身感心の強いものなのですが、仕事においても新境地を開拓していかなければならないこともあり、今後の展開に非常に着目しています。
良い感じで仕事に繋げられると理想的ですけどね。
高安美佐子
日本評論社 2012-08-24
売り上げランキング : 184942