Pular para o conteúdo principal

(E) O que entra no Data Warehouse?

Muitos projetistas de data warehouse iniciantes veem o warehouse como o repositório final de todos os dados da empresa. Eles farão declarações ingênuas, como "Toda a produção de relatórios da empresa será feita a partir do warehouse". Geralmente, essa não é uma estratégia viável. Conforme já mencionei, o warehouse é apenas um componente de uma estratégia de produção de relatórios empresarial, eu diria até um importante componente.

Outro motivo pelo qual é importante "posicionar" o warehouse na arquitetura de produção de relatórios corporativa é para proteger o projeto de uma construção grande demais. No desenvolvimento de sistemas, aumentos no tamanho aumentam o risco. Cada nova tabela, cada nova coluna, cada nova restrição, aumenta o volume de trabalho de desenvolvimento que deve ser estimado, agregado e executado. Eles também aumentam a possibilidade de que um objeto na arquitetura venha a falhar. Assim, posicionar o warehouse efetivamente é uma ferramenta para o gerenciamento de sua abrangência e para ajudar a garantir seu sucesso.

Dessa forma, recomendo que, ao projetar um warehouse, você faça uma declaração (uma espécie de missão do projeto), explícita quanto ao lugar que este sistema vai se encaixar no processo de produção de relatórios na sua organização. Essa declaração deve pormenorizar as regras que serão usadas para determinar quais dados serão armazenados e quais serão excluídos. Um exemplo de declaração: "O warehouse vai focalizar a entrega de dados em um formato agregado dos principais relatórios disponibilizados atualmente para a alta direção cujo seu acompanhamento e monitoramento é diário e possuem impacto financeiro."

Declarações como esta (talvez com um pouco mais de detalhes) proporcionam aos desenvolvedores de warehouse uma base para decidir o que será incluído e o que será excluído do warehouse. Essa declaração de posição do warehouse deve ser desenvolvida enquanto se estiver reunindo os requisitos da empresa e de usuário.

A comunidade de usuários deve indicar seu entendimento e concordar com a declaração de posição do warehouse. Isso não apenas os ajuda a entender o papel do warehouse, mas também proporciona a eles outra maneira de fazer planos para sua utilização.

Comentários

Postagens mais visitadas deste blog

(T) Como indexar uma tabela Fato - (Best Practice)

A base de qualquer projeto de bi é ter um bom dw/data mart. Podemos falar em modelagem star-schema durante dias, sem falar nas variações do snowflake, mas o objetivo principal deste artigo é apontar algumas negligências que tenho percebido no tratamento da tabela fato. Tabela esta que é o principal pilar da casa que reside um modelo star-schema.

Ouço muitas vezes os clientes reclamando do desempenho das consultas enviadas contra o seu dw/data mart, ou do tempo de resposta das análises solicitadas ao bi. Isto é realmente inaceitável, não só numa perspectiva de implantação do projeto, mas também de desempenho da entrega das informações.

Como eu mencionei anteriormente o meu objetivo neste artigo, é alertar sobre a importância da indexação da tabela fato: o que deveria ser, porque é necessário, porque chaves compostas são boas e más, e porque você deveria se preocupar com isso.

Então, vejamos:

|a| Indexação padrão (default):
De forma rápida, todas as colunas de chave estrangeira (FK) devem …

(A) Tucson Best Buy Analysis

“Data! Data! Data!” he cried impatiently.  “I can’t make bricks without clay.” —Arthur Conan Doyle
The Ascendance of Data

We live in a world that’s drowning in data. Websites track every user’s every click. Your smartphone is building up a record of your location and speed every second of every day. “Quantified selfers” wear pedometers-on-steroids that are ever recording their heart rates, movement habits, diet, and sleep patterns. Smart cars collect driving habits, smart homes collect living habits, and smart marketers collect purchasing habits. The Internet itself represents a huge graph of knowledge that contains (among other things) an enormous cross-referenced encyclopedia; domain-specific databases about movies, music, sports results, pinball machines, memes, and cocktails; and too many government statistics (some of them nearly true!) from too many governments to wrap your head around.
Buried in these data are answers to countless questions that no one’s ever thought to ask. In…