井庭崇のConcept Walk

新しい視点・新しい方法をつくる思索の旅

<< April 2024 | 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 >>

「べき乗分布」のインプリケーション (『歴史の方程式』, マーク・ブキャナン)

Book-Buchanan.jpg今週のインターリアリティプロジェクトの輪読では、『歴史の方程式』の前半を読んだ。

この本は、「べき乗分布」に関する研究の歴史を振り返り、「非平衡物理学」(nonequilibrium physics)―――著者の言葉でいうと「歴史物理学」(historical physics)―――の考え方を紹介してくれる、とても刺激的で重要な本だ。ここまで「べき乗分布」の研究について詳しく書いてくれている本は他にはない。

今日は、この本のなかから僕が特に面白いと思う部分を紹介することにしたい。

■べき乗分布にはスケール不変性がある → 「典型的」「一般的」な出来事はない。

凍ったジャガイモを壁や床に叩きつけると砕け散るが、そのとき様々なサイズの破片ができる。粉々になった小さな破片は非常に多く、大きな塊は少ないだろう。ここで、この破片の大きさと数を詳しく調べてみると、実は規則正しいということがわかってくる。「重ささが二倍になるごとに、破片の数は約六分の一になっていく」(p.59)というのだ。これは、数学的にいうならば、「べき乗分布」になっているということだ。

「べき乗分布」には、スケール不変的(scale-invariant)な性質がある。つまり、どのスケール(尺度)で拡大してみても、同じような状況が見えるのである。このことをわかりやすくいうと、次のようになる。

「今あなたが、好きなように自分の体の大きさを変えられる存在だったとしよう。・・・どんな大きさでもまわりの景色はまったく同じに見えるので、もし自分を何回縮めたか忘れてしまうと、まわりを見ただけでは自分の大きさがまったく分からなくなってしまうのである。これが、冪乗則の意味するところである。破片の山は必ず、「スケール不変性」や自己相似性と呼ばれる特別な性質をもっているからである。破片が広がった様子はどの大きさにおいても同じに見え、まるで各部分が全体の縮小像であるかのように見えるということだ。」(p.61)

つまり、どのスケールで見ても、同じような秩序が見うけられるということだ。バラバシたちが、リンク数の順位分布がべき乗分布になるネットワークを「スケールフリー・ネットワーク」と呼んだのは、このためだ。

LinearGraph-Ave200.jpgべき乗分布においては、「典型的な」もしくは「一般的な」サイズというものは存在しない。あらゆるスケールのものが同じようなかたちで存在するからである。正規分布では重要な指標であった「平均」や「分散」というものが意味をなさなくなる。というのは、平均をとると、テールに引っ張られて平均値は限りなく小さくなってしまう。また、分散を調べると、ヘッドの値とテールの値にかなりの差があるため、かぎりなく大きな分散値になってしまう。このように、平均や分散という指標は、正規分布でなければ意味をなさないのだ。そのため、対象の分布が正規分布なのかべき乗分布なのかということはとても重要なことになる。

さらに、サンプリングの考え方も、正規分布を前提とする場合とは話が違ってくる。正規分布であれば、サンプリング数を増やすことで、より精度の高い近似ができるが、べき乗分布の場合は、サンプリング数を増やすほど、テール部分を拾ってしまい、値は小さくなってしまう。ここでも、対象となる現象が正規分布なのかべき乗分布なのかは、重要な違いだといえる。


■べき乗分布にはスケール不変性がある → 大きな出来事に特別な理由はない。

べき乗分布のスケール不変性は、大きな出来事が何か特別な理由によるものではない、ということも意味している。それは、大きな出来事も小さな出来事も、同じメカニズムで生成されるからだ。

「ジャガイモの破片の山におけるスケール不変性は、大きい破片は小さい破片を拡大したものにすぎないということを示している。すべての大きさの破片は、あらゆる大きさで同じように働く崩壊過程の結果として生じる。グーテンベルク=リヒターの法則は、地震や、地震を発生させる地殻で起こる過程についても、同様のことが言えるということを示している。地震のエネルギーは冪乗則に従うので、その分布はスケール不変的になる。大きな地震が小さな地震とは違う原因で起こると示唆するものは、まったく何もないのである。大きな地震が特別なものである理由がないという事実は、小さな地震を引き起こすものと大きな地震を引き起こすものはまったく同じであるという、逆説的な結果を示唆している。この考え方にもとづけば、大地震に対する特別な説明を探しても意味がないことになる。」(p.63)

このことを印象的に示すために、コロンビア大学の地震の専門家クリストファー・ショルツの言葉が紹介されている。「地震は、起こりはじめたときには、自分がどれほど大きくなっていくか知らない。」(p.98)。大地震というのは、地震の連鎖の雪崩によって結果として大地震になったのであり、その背後にあるメカニズムは、小規模の地震や中規模の地震と同じメカニズムによるということだ。


以上のことを、僕らの商品市場の研究成果と絡めて考えてみることにしたい。すでに紹介したように(「書籍販売市場における隠れた法則性」)、井庭研では、書籍販売市場などの実データ解析をしているが、そこでもべき乗分布が発見されている。このことは何を意味するのだろうか。

まず最初に、書籍販売市場において「典型的な」あるいは「一般的な」商品というものは存在しないということである。平均と分散で商品を見ることはできない、ということである。これはおそらく現場レベルではずいぶんまえからわかっていたことだと思う。販売冊数-順位のべき乗分布は、それが統計的にも言えるということを示している。

さらに、販売冊数-順位のべき乗分布は、大ヒットをした商品が売れた理由は、何か特別な理由があるからではない、ということ示唆している。このことは、大地震がスケールに依存しない普遍的なメカニズムによって、地震の連鎖の雪崩によって結果として生まれたというのと同じように、商品の大ヒットも市場の普遍的なメカニズムによって、「売れるものがますます売れる」という連鎖の雪崩によって、結果として生まれるのかもしれない。そうすると、僕らはマーケティングや市場戦略というものをどう考えればよいのだろうか………とても興味深い。(この点については、また別の機会に議論することにしたい。)

このように、べき乗分布について考えるときには、商品市場の例がわかりやすく、想像力豊かに考えることができる。そう思って、僕はべき乗分布のインプリケーションについて考えるときはいつも、市場のべき乗分布で考えている。なかなかおすすめの方法だ。
複雑系科学 | - | -

書籍販売市場における隠れた法則性

MarketPowerLaw-Linear200.jpgMarketPowerLaw-Log200.jpg以前の僕らの研究(※)で、全国に分布する2,000以上の書店のPOS(販売時点情報管理)システムの実データを解析したところ、販売冊数-順位の関係が、月間・年間のどちらの場合も「べき乗分布」になっていることがわかった。

例えば、2005年度における販売冊数と順位の関係を示すと、左図のようになる。縦軸が、販売冊数の割合(そのタイトルの販売冊数を書籍全体の販売冊数で割ったもの)、横軸が順位である。つまり、グラフの左から右に向かって、販売冊数が多いタイトル(銘柄)から低いタイトルまでが並んでいる。もし販売冊数が同じものがあっても、同位とはせず、順に順位を振っていく。例えば、まったく同じ販売冊数のタイトルが2つあったとしても、100位が2つあるというふうにするのではなく、100位と101位に分けてプロットする。ここで示したグラフは、上が線形グラフ、下が両対数グラフである。上の線形グラフをみると、「ロングテール」である(「しっぽ」の部分が長い)ことがよくわかると思う。

LinearLogGraph200.jpgここで、「線形グラフ」と「両対数グラフ」について、少し解説しておくことにしよう。線形グラフ(linear graph)というのは、一般的によく用いられている普通のグラフだ。線形グラフでは、目盛りごとに100、200、300というような感じで「線形」に数が増えていく。両対数グラフ(double logarithmic graph)では、目盛が増えると、1、10、100、1000というように対応する値が増えていくグラフである。このグラフでは、実は10の「何乗か」という指数の部分が、0、1、2、3と増えているのだ。べき乗分布のデータは、線形グラフでは、軸に限りなく近くて、その特徴が理解できないため、両対数グラフで見ることが多い。べき乗分布は、両対数グラフでは直線上に並んでプロットされる。

販売量-順位分布のべき乗が示しているのは、「破格に売れているタイトルがごく稀にあり,ほとんど多くのタイトルはあまり売れていない」という事実である。テール部分が近似線から乖離しているのは、書店や棚の規模が有限であるために生じる「カットオフ」だと考えられる。書籍販売市場がウィナー・テイク・オール市場だということは、以前から知られていたが、この分析結果の面白い点は、売れ行きの規模に関係なく、順位が下がれば販売量が規則正しく減少していくということである。べき乗分布は、単に「20:80の法則」(ニッパチの法則)が示しているような「ほんの一部のタイトル(銘柄)がとても売れている」ということだけを示しているのではない。また、ロングテール論がいうような「テールが長く、集めるとかなりの量になる」ということだけを示しているわけでもない。べき乗分布が示しているのは、それら二つの特徴を含みながら、最上位や最下位の間に存在するすべての書籍が、べき乗則という法則に従っているという驚くべき事実なのだ。これは、本当に不思議なことだ。

SystemLayerEmergence-power200.jpgまた、月間のデータでも、どの月もほぼ同じべき乗分布を示しているというのも興味深い。市場で販売されているタイトルは日々入れ替わっており(現在日本で発行される新刊タイトル数は年間7万7千点にのぼる)、そこで購入している人たちも日々入れ替わっているにもかかわらず、べき乗分布という市場レベルの法則性は維持されている。それゆえ、この法則性は、個々の要素には還元することができない市場レベルの「創発的秩序」だといえる。

「べき乗分布」は、実は、都市、社会ネットワーク、価格変動、所得など様々な領域で発見されている。都市人口の規模と順位は、べき乗分布になることが知られている。このことは、1890年以降のアメリカの都市についても、日本の都市についても当てはまる。また、社会ネットワークにおけるノードの次数(そのノードがもつリンク数)と順位の関係にも、べき乗分布があることが知られている。そのほか、所得分布の一部がべき乗になることが知られており、「パレートの法則」と呼ばれている。企業の所得分布もべき乗分布に従うことがわかっており、業種ごとの比較研究などもある。さらに、価格変動の規模と頻度の関係をべき乗分布が見出されている。これらのべき乗分布の生成メカニズムについては、少しずつわかってきてはいるものの、まだまだ解明されていないホットイシューだ。

商品市場においてどのようなメカニズムでべき乗分布が生成されるのかについては、まだわかっていない。僕らは今まさにそのメカニズムの解明に取り組んでいるところだ。


※この研究成果は、以下のジャーナル論文、学会研究会で報告している。

●井庭 崇, 深見 嘉明, 斉藤 優, 「書籍販売市場における隠れた法則性」, 情報処理学会論文誌:数理モデル化と応用, Vol.48, No.SIG6 (TOM17), 2007年3月発行, pp.128-136 [CiNiiのページへ]

●井庭 崇, 深見 嘉明, 斉藤 優, 「書籍販売市場における隠れた法則性」, 情報処理学会 第61回数理モデル化と問題解決研究会, 大阪, 2006年9月 [PDF]

●井庭 崇, 深見 嘉明, 吉田 真理子, 山下 耕平, 斉藤 優, 「書籍販売市場における上位タイトルの売上分析」, 情報処理学会 第64回 数理モデル化と問題解決研究会, 大阪大学, 2007年5月 [PDF]
複雑系科学 | - | -

学会発表「書籍販売市場における上位タイトルの売上分析」

5月17日に行われた情報処理学会MPS(数理モデル化と問題解決)研究会で発表した研究の2つめは、「書籍販売市場における上位タイトルの売上分析」というものだ。

 これは、日本における書籍販売市場の実データを解析した研究だ。書籍販売市場は、売れているものは爆発的に売れているが、たいていのものはほとんど売れていないというのが現状だ。クリス・アンダーソンのロングテール論などでもこのような話は有名だが、それが実際にどのような分布になっているのかを実データで示した研究は国内外でもほとんどない。
 そのような分布を明らかにするために、僕らは日本全国の書店のPOSデータを用いて実証的に示したというわけだ。結果からいうと、販売冊数と順位の分布はほぼ「べき乗分布」に従っていた。このことは年間でみても、月間でみても当てはまる。
 分布がいつも一緒ということは、非常に興味深いこと。書籍販売市場では、毎年約7万7千点の新刊が出ており、書籍の顔ぶれは日々変わっている。しかも、ふつう同じ本を2冊以上買う人はいないので、買っている人の顔ぶれもどんどん入れ替わっている。しかし、それにもかかわらず、販売冊数と順位の分布はいつも同じ形をしているということは、実に不思議なことなのである。
 まとめると、個々の書籍、個々の購入者というレベルは絶えず入れ替わっているのに、販売冊数-順位分布という市場レベルでは、ある法則性が維持されている。これは、まさにこの法則性が、市場レベルの「創発」特性だということを示している。

 この研究では、その販売冊数-順位分布の特徴について解析したのだ。詳しくは論文を参照していただくとして、今回わかったことは、次の2点。
1)売上の上位1.5%の書籍が、市場の約半分のシェアを占めている。
2)売れるものがますます売れるという傾向がある。

どちらもなかなか興味深い。なぜこのような傾向が生じているのかについては、今後の研究で明らかにしていきたい。

MPS64-BookSales
●井庭 崇, 深見 嘉明, 吉田 真理子, 山下 耕平, 斉藤 優, 「書籍販売市場における上位タイトルの売上分析」, 情報処理学会 第64回数理モデル化と問題解決研究会, 大阪, 2007年
Paper 論文PDF


また、この市場レベルの創発特性ということについては、以下の雑誌にも書いた。オンラインで読めるので、こちらもご覧ください。

●井庭 崇, 「新しいシステム間にもとづく思考と実践」,『Mobile Society Review 未来心理』, vol.009, 2007年3月
Paper 論文PDF
井庭研だより | - | -
CATEGORIES
NEW ENTRIES
RECOMMEND
ARCHIVES
PROFILE
OTHER