完全な旅のデータを楽しむ-1。データセットの概要



Fun With Complete Journey Data 1



データ紹介

このデータはRパッケージに含まれていますcompletejourney入手できます。完全なデータはgithubにダウンロードするか、Rの対応するコードを介して直接ダウンロードする必要がありますが、ラダーが必要であり、サンプルデータの一部をパッケージで直接取得できます。

このデータは 84.51° 会社から提供されます。データはから来ています 食料品店 。 1年以上をカバーし、頻繁に買い物をする2,469世帯をカバーしています。データには、取引情報、割引情報、家族情報などが含まれます。関連する特定のデータセットは次のとおりです(説明する必要があります。ここでは、データベースの元のテーブルに相当します。実行する場合は、多くの情報が含まれます。詳細な分析には、さまざまなデータテーブルも必要です。ステッチを実行します):



  • プロモーション(キャンペーン) :各世帯が受けたプロモーション
  • プロモーションの説明(campaign_descriptions) :プロモーションメタデータ
  • クーポン :クーポンメタデータ
  • クーポンの引き換え(coupon_redemptions) :クーポンの引き換え情報(クーポンは、引き換え日の前にあり、使用する前に特定の指定された条件を満たす必要があります)
  • 家族情報(人口統計) :家族の人口統計(年齢、収入、世帯数など)
  • 製品 :製品メタデータ(ブランド、説明など)
  • プロモーション :メールまたは店舗配置データで送信される商品プロモーション
  • トランザクション :家計購入の取引記録

以下は、ERダイアグラムを通じて、さまざまなデータテーブル間の接続と各テーブルの特定のデータ特性を直接理解できます。


IS図




各データシートの詳細な説明と紹介

人口統計

この表には、一部の世帯の人口統計情報が含まれています。データの性質上、人口統計情報はすべての世帯で利用できるわけではありません。

変数 説明
世帯ID 各世帯を一意に識別します
年齢 推定年齢範囲
所得 世帯収入
自宅の所有権 住宅所有者、賃貸人など。
配偶者の有無 婚姻状況(既婚、独身、不明)
世帯規模 5歳以上までの世帯の規模
family_comp 世帯構成
kid_count 3歳以上までの子供の数

トランザクション

世帯によるトランザクションレベルの製品購入(通常は領収書に表示されるもの)が含まれます。すべてのトランザクションのサンプル(transactions_sample)を使用するか、get_transactions()を使用してデータセット全体を取得します。

変数 説明
世帯ID 各世帯を一意に識別します
store_id 各店舗を一意に識別します
Basket_id 各購入機会を一意に識別します
製品番号 各製品を一意に識別します
旅行中に購入した製品の数
sales_value 小売業者が販売から受け取る金額
Retail_disc 小売業者のポイントカードプログラムにより割引が適用されます
クーポンディスク メーカークーポンによる割引適用
クーポンマッチディスク 小売業者のメーカークーポンの一致により割引が適用されます
週間 トランザクションの週範囲1-53
transaction_timestamp 取引が発生した日時

キャンペーン

変数 説明
キャンペーンID 各キャンペーンを一意に識別します範囲1〜27
世帯ID 各世帯を一意に識別します

campaign_descriptions

キャンペーンのメタデータ、特にキャンペーンがアクティブだった時刻が含まれます。



変数 説明
キャンペーンID 各キャンペーンを一意に識別します範囲1〜27
キャンペーンタイプ キャンペーンの種類(タイプA、タイプB、タイプC)
開始日 キャンペーン開​​始日
終了日 キャンペーン終了日

製品

購入した製品(ブランド、説明など)に関するメタデータが含まれています。

変数 説明
製品番号 各製品を一意に識別します
Manufacturer_id 各メーカーを一意に識別します
部門 類似の製品をグループ化する
ブランド プライベートまたは国内のラベルブランドを示します
製品カテゴリ 類似の製品を下位レベルでグループ化します
製品型 類似の製品を最低レベルでグループ化します
小包のサイズ パッケージサイズを示します(すべての製品で利用できるわけではありません)

クーポン

この表には、キャンペーンの一環として顧客に送信されたすべてのクーポンと、各クーポンを利用できる製品が一覧表示されています。一部のクーポンは複数の商品に交換できます。一例は、自社ブランドの冷凍野菜のクーポンです。このクーポンを利用できる商品はたくさんあります。

キャンペーンTypeAの場合、この表は可能なクーポンのプールを提供します。タイプAキャンペーンに参加している各顧客は、プールから16枚のクーポンを受け取りました。 16枚のクーポンは、顧客の以前の購入行動に基づいて選択されました。各顧客が受け取った特定の16枚のクーポンを特定することは、このデータベースの範囲外です。

キャンペーンタイプBおよびタイプCの場合、キャンペーンに参加しているすべての顧客は、そのキャンペーンに関連するすべてのクーポンを受け取ります。

変数 説明
クーポン_upc 各クーポンを一意に識別します(世帯およびキャンペーンに固有)
製品番号 各製品を一意に識別します
キャンペーンID 各キャンペーンを一意に識別します

クーポン償還

特定の製品のキャンペーンの有効性とクーポンの使用状況を測定するために使用できる個々のクーポンの引き換え(世帯、日、UPCコード、キャンペーン)が含まれています。

変数 説明
世帯ID 各世帯を一意に識別します
クーポン_upc 各クーポンを一意に識別します(世帯およびキャンペーンに固有)
キャンペーンID 各キャンペーンを一意に識別します
redemption_date クーポンが引き換えられた日付

プロモーション

キャンペーンに対応する商品の配置情報(メーラーページの配置や店内のディスプレイの配置など)が含まれます。すべてのプロモーションのサンプル(promotions_sample)を使用するか、get_promotions()を使用してデータセット全体を取得します。

変数 説明
製品番号 各製品を一意に識別します
store_id 各店舗を一意に識別します
display_location 展示場所(0ディスプレイ、1店舗フロント、2店舗リア、3フロントエンドキャップ、4ミッドアイルエンドキャップ、5リアエンドキャップ、6サイドアイルエンドキャップ、7インアイル、 9-セカンダリロケーションディスプレイ、A-in-shelf)
mailer_location メーラーの場所(0-広告にない、A-内部ページ機能、C-内部ページラインアイテム、D-フロントページ機能、F-バックページ機能、H-ラップフロント機能、J-ラップインテリアクーポン、L-ラップバック機能、P-インテリアページクーポン、インテリアページでXフリー、フロントページ、バックページ、またはラップでZフリー)
週間 トランザクションの週範囲1-53

関連コード

Rパッケージをインストールする

install.packages('completejourney')

トランザクションとプロモーションに関する完全なデータを取得する

# get the full transactions data set transactions <- get_transactions() # get the full promotions data set promotions <- get_promotions()

REF

  • https://bradleyboehmke.github.io/completejourney/articles/completejourney.html
  • https://github.com/bradleyboehmke/completejourney