Pular para o conteúdo principal

(E) O que entra no Data Warehouse?

Muitos projetistas de data warehouse iniciantes veem o warehouse como o repositório final de todos os dados da empresa. Eles farão declarações ingênuas, como "Toda a produção de relatórios da empresa será feita a partir do warehouse". Geralmente, essa não é uma estratégia viável. Conforme já mencionei, o warehouse é apenas um componente de uma estratégia de produção de relatórios empresarial, eu diria até um importante componente.

Outro motivo pelo qual é importante "posicionar" o warehouse na arquitetura de produção de relatórios corporativa é para proteger o projeto de uma construção grande demais. No desenvolvimento de sistemas, aumentos no tamanho aumentam o risco. Cada nova tabela, cada nova coluna, cada nova restrição, aumenta o volume de trabalho de desenvolvimento que deve ser estimado, agregado e executado. Eles também aumentam a possibilidade de que um objeto na arquitetura venha a falhar. Assim, posicionar o warehouse efetivamente é uma ferramenta para o gerenciamento de sua abrangência e para ajudar a garantir seu sucesso.

Dessa forma, recomendo que, ao projetar um warehouse, você faça uma declaração (uma espécie de missão do projeto), explícita quanto ao lugar que este sistema vai se encaixar no processo de produção de relatórios na sua organização. Essa declaração deve pormenorizar as regras que serão usadas para determinar quais dados serão armazenados e quais serão excluídos. Um exemplo de declaração: "O warehouse vai focalizar a entrega de dados em um formato agregado dos principais relatórios disponibilizados atualmente para a alta direção cujo seu acompanhamento e monitoramento é diário e possuem impacto financeiro."

Declarações como esta (talvez com um pouco mais de detalhes) proporcionam aos desenvolvedores de warehouse uma base para decidir o que será incluído e o que será excluído do warehouse. Essa declaração de posição do warehouse deve ser desenvolvida enquanto se estiver reunindo os requisitos da empresa e de usuário.

A comunidade de usuários deve indicar seu entendimento e concordar com a declaração de posição do warehouse. Isso não apenas os ajuda a entender o papel do warehouse, mas também proporciona a eles outra maneira de fazer planos para sua utilização.

Comentários

Postagens mais visitadas deste blog

(T) Como indexar uma tabela Fato - (Best Practice)

A base de qualquer projeto de bi é ter um bom dw/data mart. Podemos falar em modelagem star-schema durante dias, sem falar nas variações do snowflake, mas o objetivo principal deste artigo é apontar algumas negligências que tenho percebido no tratamento da tabela fato. Tabela esta que é o principal pilar da casa que reside um modelo star-schema.

Ouço muitas vezes os clientes reclamando do desempenho das consultas enviadas contra o seu dw/data mart, ou do tempo de resposta das análises solicitadas ao bi. Isto é realmente inaceitável, não só numa perspectiva de implantação do projeto, mas também de desempenho da entrega das informações.

Como eu mencionei anteriormente o meu objetivo neste artigo, é alertar sobre a importância da indexação da tabela fato: o que deveria ser, porque é necessário, porque chaves compostas são boas e más, e porque você deveria se preocupar com isso.

Então, vejamos:

|a| Indexação padrão (default):
De forma rápida, todas as colunas de chave estrangeira (FK) devem …

(A) Data Science in Practice with Python - Sample 2

In this post I'll explain what is a recommender system, how work it and show you some code examples. In my previous post I did a quick introduction:

Sample 2 - Recommender System

WHAT IS A RECOMMENDER SYSTEM? A model that filters information to present users with a curated subset of options they’re likely to find appealing.
HOW DOES IT WORK? Generally via a collaborative approach (considering user’s previous behavior) or content based approach (based on discrete assigned characteristics).

Now I'll get into in some concepts very important about recommender systems.

Recommender System in Details:

We can say that the goal of a recommender system is to make product or service recommendations to people. Of course, these recommendations should be for products or services they’re more likely to want buy or consume.

Recommender systems are active information filtering systems which personalize the information coming to a user based on his interests, relevance of the information etc.…

(T) Verificando a consistência de um repositório ou um Business Model no Oracle BI