平均スクラブルグラフ構造:直径?
Average Scrabble Graph Structure
解決:
メソッド
ベースURLから始めてhttp://www.cross-tables.com/annotated.php?a=1Pythonの組み合わせを使用しましたurllib、
マルチプロセッシングと
最初の10000ゲームを抽出するBeautifulSoup。ゲームは解析され、
numpy15x15ブール行列。次に、マトリックス内の2つの隣接するセルが両方ともアクティブである場合、マトリックスはエッジを作成するグラフに変換されました。次に、グラフのプロパティを次のように分析しました。
networkx
10000のゲームのうち、9966のみが使用可能でした。一部のゲームは中央のタイトルで開始されませんでしたが、他のゲームは非常に迅速かつ奇妙に終了し、適切に動作しませんでした。幸いなことに、これらのゲームは非常にまれであったため、サンプルは真の分布のロバスト推定を提供するはずです。
メソッド(更新)
もう少しデータのクリーンアップが必要でした。私は挑戦的な動きを考慮していなかったので、100以上のタイルが使用されたゲームにつながりました。その過程で、私は誤った動きと偽のゲームに気づきました。真の経験的データのコストなど、データに少し不確実性を持たせなければならない場合があります。
結果
最初の興味深い情報はボードの周波数です。これにより、これから調査するグラフとの空間的なつながりが得られます。ゲームのプレイ方法(および左から右、上から下の読み取り方法)により、ボードが非対称であることに注意してください。
ここから質問に答えることができます、
「平均的なスクラブルゲームのグラフの直径と半径の分布はどのくらいですか?」
散布図とグラフサイズの関係から、小さい方の情報が少し多くなります。$ N $値:
結果(更新)
コメントに基づいて、半径と直径をプロットしました。多少の差異があるゲームの範囲を除いて、ほぼ線形の1対2の関係が得られました。コメントでこれの重要性についていくつかの観察を自由に行ってください。
クイック結論(TLDR)
調査したデータから、平均グラフ半径18、直径36の約100タイルでプレイされたゲームがほとんどありました。これらの結果を、同じサイズとエッジ数でエッジ分布が異なるランダムグラフと比較するには、さらに作業が必要です。
可能な最大直径は100枚のタイル全体を使用していることがわかりました!私の友人のカールは、2008年に彼が作ったゲームでこれを説明しました:http://www.cross-tables.com/annotated.php?u = 2493#0#。
質問ありがとうございます!
スクラブルに使用できる実行可能な辞書が必要な場合は、http://www.lexicalwordfinder.com/about/サイト(Lexical Word Finder Webサイト)で入手できます。
興味深い実験:ほとんどの人が専門的にプレイしないと仮定すると、語彙単語ファインダーから生成されたリストを使用してプレイできます 中くらい 平均グラフがどのように見えるかを確認するための単語。また、各ターンでの「最良の」動きが何を生み出すかを見るのも良いでしょう。
networkxの興味深い使用。