Wat zijn de belangrijkste kenmerken van een Data Warehouse?

Wat zijn de belangrijkste kenmerken van een Data Warehouse?


Een data warehouse is een relationele database, een elektronische database waarin gegevens worden opgeslagen in tabellen rijen en kolommen. Het is ontworpen voor query en analyse, in plaats van de dagelijkse verwerking van transacties. Een transactie is een atomaire eenheid van het werk, zoals het betalen van een energierekening van uw bankrekening, die ofwel slaagt of mislukt. In tegenstelling tot een transactie verwerkingssysteem, heeft een data warehouse niet nodig om onmiddellijk te reageren op verzoeken van gebruikers en heeft andere unieke kenmerken.

onderwerp Oriented

Een database is ontworpen om analisten gegevens te analyseren. Als zodanig wordt opgeslagen door inhoud, in plaats van toepassing; Met andere woorden, de gegevens "vakgerichte." De exacte inhoud kan variëren van business to business, maar een bedrijf kan besluiten haar data warehouse te structureren door de verkoop, verzendingen of inventaris, zodat zij vragen als kan beantwoorden, "Welke klant kocht vorig jaar het grootste deel van dit product?"

Extraheren, transformeren en laden

Een ander kenmerk van een datawarehouse is dat het samen gegevens uit verschillende operationele databases, bestanden en gegevens segmenten moeten trekken; vervolgens presenteert ze in een consistent formaat. Dit betekent dat voordat gegevens in een data warehouse verplaatst, moet het een proces dat extract ondergaan, transformeren en laden. Eerste, dit proces haalt de data van één of meer operationele gegevensbronnen. Ten tweede, het verwijdert inconsistenties uit de gegevens; eindelijk, laadt de gegevens in het datawarehouse. Uiteindelijk is de efficiëntie van dit proces bepaalt de kwaliteit van de data in een data warehouse.

niet-vluchtige

Eenmaal overgebracht naar een data warehouse, worden de gegevens niet veranderen en wordt beschreven als "niet-vluchtig." De gegevens worden niet bedoeld om de dag-tot-dag bedrijf te runnen; In tegenstelling tot de gegevens die in operationele databases, het is niet bijgewerkt na elke afzonderlijke transactie. In plaats daarvan, worden gegevens in de data warehouse met regelmatige specifieke intervallen, zoals eenmaal per dag, eenmaal per week of eenmaal per maand, afhankelijk van de precieze aard van de gegevens.

Historische gegevens

In tegenstelling tot een transactie verwerkingssysteem, waarbij historische gegevens worden gearchiveerd op de prestaties van de database te behouden, moet een data warehouse historische gegevens. Om trends te identificeren, analisten vereisen grote hoeveelheden data, bemonsterde na verloop van tijd, dus een data warehouse bevat historische 'snapshots' van operationele gegevens op bepaalde tijdstippen. Met andere woorden, wordt de data in een data warehouse genaamd "tijd variant" omdat zijn vooral gericht tijd veranderen.