完全な旅のデータを楽しむ-1。データセットの概要
Fun With Complete Journey Data 1
データ紹介
このデータはRパッケージに含まれていますcompletejourney
入手できます。完全なデータはgithubにダウンロードするか、Rの対応するコードを介して直接ダウンロードする必要がありますが、ラダーが必要であり、サンプルデータの一部をパッケージで直接取得できます。
このデータは 84.51° 会社から提供されます。データはから来ています 食料品店 。 1年以上をカバーし、頻繁に買い物をする2,469世帯をカバーしています。データには、取引情報、割引情報、家族情報などが含まれます。関連する特定のデータセットは次のとおりです(説明する必要があります。ここでは、データベースの元のテーブルに相当します。実行する場合は、多くの情報が含まれます。詳細な分析には、さまざまなデータテーブルも必要です。ステッチを実行します):
- プロモーション(キャンペーン) :各世帯が受けたプロモーション
- プロモーションの説明(campaign_descriptions) :プロモーションメタデータ
- クーポン :クーポンメタデータ
- クーポンの引き換え(coupon_redemptions) :クーポンの引き換え情報(クーポンは、引き換え日の前にあり、使用する前に特定の指定された条件を満たす必要があります)
- 家族情報(人口統計) :家族の人口統計(年齢、収入、世帯数など)
- 製品 :製品メタデータ(ブランド、説明など)
- プロモーション :メールまたは店舗配置データで送信される商品プロモーション
- トランザクション :家計購入の取引記録
以下は、ERダイアグラムを通じて、さまざまなデータテーブル間の接続と各テーブルの特定のデータ特性を直接理解できます。
IS図
各データシートの詳細な説明と紹介
人口統計
この表には、一部の世帯の人口統計情報が含まれています。データの性質上、人口統計情報はすべての世帯で利用できるわけではありません。
変数 | 説明 |
---|---|
世帯ID | 各世帯を一意に識別します |
年齢 | 推定年齢範囲 |
所得 | 世帯収入 |
自宅の所有権 | 住宅所有者、賃貸人など。 |
配偶者の有無 | 婚姻状況(既婚、独身、不明) |
世帯規模 | 5歳以上までの世帯の規模 |
family_comp | 世帯構成 |
kid_count | 3歳以上までの子供の数 |
トランザクション
世帯によるトランザクションレベルの製品購入(通常は領収書に表示されるもの)が含まれます。すべてのトランザクションのサンプル(transactions_sample
)を使用するか、get_transactions()
を使用してデータセット全体を取得します。
変数 | 説明 |
---|---|
世帯ID | 各世帯を一意に識別します |
store_id | 各店舗を一意に識別します |
Basket_id | 各購入機会を一意に識別します |
製品番号 | 各製品を一意に識別します |
量 | 旅行中に購入した製品の数 |
sales_value | 小売業者が販売から受け取る金額 |
Retail_disc | 小売業者のポイントカードプログラムにより割引が適用されます |
クーポンディスク | メーカークーポンによる割引適用 |
クーポンマッチディスク | 小売業者のメーカークーポンの一致により割引が適用されます |
週間 | トランザクションの週範囲1-53 |
transaction_timestamp | 取引が発生した日時 |
キャンペーン
変数 | 説明 |
---|---|
キャンペーンID | 各キャンペーンを一意に識別します範囲1〜27 |
世帯ID | 各世帯を一意に識別します |
campaign_descriptions
キャンペーンのメタデータ、特にキャンペーンがアクティブだった時刻が含まれます。
変数 | 説明 |
---|---|
キャンペーンID | 各キャンペーンを一意に識別します範囲1〜27 |
キャンペーンタイプ | キャンペーンの種類(タイプA、タイプB、タイプC) |
開始日 | キャンペーン開始日 |
終了日 | キャンペーン終了日 |
製品
購入した製品(ブランド、説明など)に関するメタデータが含まれています。
変数 | 説明 |
---|---|
製品番号 | 各製品を一意に識別します |
Manufacturer_id | 各メーカーを一意に識別します |
部門 | 類似の製品をグループ化する |
ブランド | プライベートまたは国内のラベルブランドを示します |
製品カテゴリ | 類似の製品を下位レベルでグループ化します |
製品型 | 類似の製品を最低レベルでグループ化します |
小包のサイズ | パッケージサイズを示します(すべての製品で利用できるわけではありません) |
クーポン
この表には、キャンペーンの一環として顧客に送信されたすべてのクーポンと、各クーポンを利用できる製品が一覧表示されています。一部のクーポンは複数の商品に交換できます。一例は、自社ブランドの冷凍野菜のクーポンです。このクーポンを利用できる商品はたくさんあります。
キャンペーンTypeAの場合、この表は可能なクーポンのプールを提供します。タイプAキャンペーンに参加している各顧客は、プールから16枚のクーポンを受け取りました。 16枚のクーポンは、顧客の以前の購入行動に基づいて選択されました。各顧客が受け取った特定の16枚のクーポンを特定することは、このデータベースの範囲外です。
キャンペーンタイプBおよびタイプCの場合、キャンペーンに参加しているすべての顧客は、そのキャンペーンに関連するすべてのクーポンを受け取ります。
変数 | 説明 |
---|---|
クーポン_upc | 各クーポンを一意に識別します(世帯およびキャンペーンに固有) |
製品番号 | 各製品を一意に識別します |
キャンペーンID | 各キャンペーンを一意に識別します |
クーポン償還
特定の製品のキャンペーンの有効性とクーポンの使用状況を測定するために使用できる個々のクーポンの引き換え(世帯、日、UPCコード、キャンペーン)が含まれています。
変数 | 説明 |
---|---|
世帯ID | 各世帯を一意に識別します |
クーポン_upc | 各クーポンを一意に識別します(世帯およびキャンペーンに固有) |
キャンペーンID | 各キャンペーンを一意に識別します |
redemption_date | クーポンが引き換えられた日付 |
プロモーション
キャンペーンに対応する商品の配置情報(メーラーページの配置や店内のディスプレイの配置など)が含まれます。すべてのプロモーションのサンプル(promotions_sample
)を使用するか、get_promotions()
を使用してデータセット全体を取得します。
変数 | 説明 |
---|---|
製品番号 | 各製品を一意に識別します |
store_id | 各店舗を一意に識別します |
display_location | 展示場所(0ディスプレイ、1店舗フロント、2店舗リア、3フロントエンドキャップ、4ミッドアイルエンドキャップ、5リアエンドキャップ、6サイドアイルエンドキャップ、7インアイル、 9-セカンダリロケーションディスプレイ、A-in-shelf) |
mailer_location | メーラーの場所(0-広告にない、A-内部ページ機能、C-内部ページラインアイテム、D-フロントページ機能、F-バックページ機能、H-ラップフロント機能、J-ラップインテリアクーポン、L-ラップバック機能、P-インテリアページクーポン、インテリアページでXフリー、フロントページ、バックページ、またはラップでZフリー) |
週間 | トランザクションの週範囲1-53 |
関連コード
Rパッケージをインストールする
install.packages('completejourney')
トランザクションとプロモーションに関する完全なデータを取得する
# get the full transactions data set transactions <- get_transactions()
# get the full promotions data set promotions <- get_promotions()
REF
- https://bradleyboehmke.github.io/completejourney/articles/completejourney.html
- https://github.com/bradleyboehmke/completejourney