Database Management Technieken

Alle databases vereisen voortdurend onderhoud en management om de efficiëntie en snelheid aan te houden. We zullen verschillende technieken die worden gebruikt door de database managers om ervoor te zorgen dat hun gegevens veilig te verkennen en hun software blijft presteren als dat nodig is.

gegevens Normalisatie

Normalisatie houdt in dat alle gegevens in de database dezelfde wijze wordt ingevoerd. Het is cruciaal om de functionaliteit van een database, en moeten voortdurend gecontroleerd worden als een database regelmatig wordt bijgewerkt door de hand ingetoetst data entry.

Neem bijvoorbeeld de volgende drie namen: John Smith, Jonathan Smith, Jonathan R. Smith. Een menselijke lezer kan begrijpen dat alle drie de namen verwijzen naar dezelfde persoon, dus als John Smith noemt vragen over een bestelling die naar Jonathan werd gestuurd, kan zijn behoeften goed worden behandeld. Een databank kan echter het verband tussen deze drie namen, en te beschouwen als drie afzonderlijke klanten (met drie afzonderlijke orde geschiedenissen) of drie kandidaten met de hand worden ingevoerd.

Ook deze nummers verschijnen hetzelfde: (215) 555-2150 en 215-555-2150. Maar zij zijn niet gelijk aan de databank; afhankelijk van hoe de software behandelt streepjes tekstreeksen, het eerste nummer is twee woorden, maar de tweede is enige. Elke programmatische script dat een netnummer kiest door het ontleden door woord, bijvoorbeeld, zal falen bij het overwegen van het tweede nummer.

De beste manier om normalisering problemen te voorkomen is aan strenge data entry controle: ofwel voorkomen dat een gebruiker van het invoeren van misvormde data, of beter nog te nemen dat de gegevens en formatteren voordat intern opbergt. Een telefoonnummer veld kon weggooien alles dat niet een 0-9 cijfers en haakjes en streepjes toe te voegen - maar het moet eerst alfanumerieke telefoonnummers om te zetten of te verwerpen, zoals 800-MY-PHONE.

Database Fysieke Size, RAM Usage en Speed

Databases hebben de neiging om te groeien in de tijd; Het is gebruikelijk dat bedrijven zich richten op nieuwe invoer in hen, maar veel minder aandacht te besteden aan het ruimen oude en ongebruikte data uit. Het is zelden een goed idee om oude gegevens weg te gooien; Het is altijd mogelijk dat een aantal cruciale informatie in de toekomst zullen worden verkregen door het aggregeren en analyseren van het verleden database records.

Dit betekent dat de database manager aandacht moet besteden aan de fysieke grootte van de database is opgeslagen op de harde schijf. Over het algemeen is het belangrijk om een ​​enorme hoeveelheid vrije ruimte boven op de opslag drives te houden; op die manier, een schurkenstaat script dat per ongeluk zorgt voor een miljoen nieuwe records per uur niet in staat is te vullen een drive en veroorzaken kritische databank crash voordat het kan worden gestopt.

Managers moeten ook aandacht besteden aan hoe hun oorspronkelijke programmering veronderstellingen veranderen in de tijd, zoals databases te krijgen groot. Database zoekopdrachten trekken gegevens uit het station en in het RAM-geheugen, dat een plafond voor een efficiënte zoekalgoritmen creëert; een zoektocht die onmiddellijk over 10.000 dossiers uur kon nemen was toen het aantal records doorzocht is 250.000. Zoek en programmering algoritmen moeten regelmatig worden getest en getimed, zodat ze kunnen zo nodig tegen grotere datasets worden verbeterd.