Dunnhumby — The Complete Journey

Published: 28 April 2026| Version 1 | DOI: 10.17632/7myy93ym6k.1
Contributor:
Luiz Guilherme Nascimento

Description

O dataset Dunnhumby – The Complete Journey é uma base de dados transacional amplamente utilizada em pesquisas acadêmicas e aplicações educacionais voltadas à análise de comportamento do consumidor no varejo. Ele representa aproximadamente dois anos de compras reais realizadas por 2.500 famílias frequentes de uma rede supermercadista, totalizando milhões de registros de transações. Diferentemente de bases limitadas a poucas categorias, o conjunto contempla todas as compras realizadas pelas famílias dentro da loja, permitindo uma visão abrangente dos hábitos de consumo . A base é organizada em múltiplas tabelas relacionais. A principal delas, transaction_data, registra cada item comprado em uma cesta, contendo informações como identificador da família, cesta de compra, dia da transação, produto adquirido, quantidade, valor vendido, loja e descontos aplicados. Além disso, há tabelas complementares com descrições de produtos, categorias, marcas e fabricantes (product), bem como informações demográficas anonimizadas de parte das famílias (hh_demographic) . Outro diferencial importante é a presença de dados de campanhas promocionais, cupons enviados e cupons resgatados pelos consumidores, além de exposições promocionais em loja e encartes (causal_data). Isso torna o dataset especialmente valioso para estudos de market basket analysis, sistemas de recomendação, elasticidade promocional, previsão de demanda e avaliação do impacto de marketing direto. Pela riqueza e granularidade temporal, trata-se de uma base robusta para modelagem preditiva e mineração de padrões de consumo.

Files

Institutions

Categories

Retail Buying

Licence