Database
 sql >> Datenbank >  >> RDS >> Database

Tabellenkalkulationen vs. Datenbanken:Ist es Zeit für einen Wechsel? Teil 1

Tabellen – Excel, Google Sheets oder ein Blatt mit einem anderen Namen – sind wirklich coole und leistungsstarke Tools. Aber Datenbanken sind es ja auch. Wann sollten Sie bei einer Tabellenkalkulation bleiben? Wann sollten Sie auf eine Datenbank umsteigen?

Sie können Tabellenkalkulationen und Datenbanken für ähnliche Zwecke verwenden. Angesichts der Tatsache, dass sowohl Daten organisiert als auch Berichte erleichtert werden, kann es manchmal schwierig sein, zu bestimmen, welches am besten geeignet ist. Lassen Sie uns also über die Vor- und Nachteile jeder Option sprechen.

Am Anfang…

Wenn Sie gerade erst mit dem Geschäft beginnen, ist eine Tabellenkalkulation (oder ein „Blatt“) fast immer Ihre erste Wahl. Startups haben selten das Budget, um eine maßgeschneiderte Datenbank zu unterstützen. Und außerdem ist Ihr Geschäft neu; Sie werden keine Ahnung haben, ob es klein bleiben, sich zu einem riesigen Unternehmen entwickeln oder irgendwo in der Mitte liegen wird.

Ein weiterer Faktor ist, dass sich die Struktur und Organisation Ihres Unternehmens wahrscheinlich ändern wird, wenn es wächst. Es ist also wirklich keine übliche Option, von Anfang an eine Datenbank zu erstellen. Hier springen Blätter normalerweise ein.

Der wichtigste Grund für die Verwendung von Blättern ist, dass sie verfügbar sind. Mit nur wenigen Klicks können Sie Microsoft Excel, Google Sheets oder jedes andere Tabellenkalkulationsprogramm verwenden. Sie müssen keine komplizierte Struktur planen; Sie können einfach Ihre Daten eingeben, Berechnungen und Berichte erstellen und die Informationen mit Kollegen teilen. Sheets bieten viele coole integrierte Funktionen und können ein kleines Unternehmen eine ganze Weile durchhalten.

Nehmen wir also an, Sie haben alle Ihre Daten auf Blättern. Warum sollten Sie den Aufbau einer Datenbank in Betracht ziehen? Mit anderen Worten, warum sich das Leben verkomplizieren, wenn alles funktioniert?

An dieser Stelle würde ich vorschlagen, dass Sie sich fragen, wie gut alles funktioniert. Denken Sie daran, alles funktioniert gut, bis es nicht mehr funktioniert. Im Falle von Tabellen gilt:Je mehr Daten Sie haben, desto mehr Probleme können auftreten. Wie helfen Ihnen Datenbanken, diese Probleme zu vermeiden? Und wann sollten Sie über einen Wechsel nachdenken?

Verwenden von Tabellenkalkulationen zum Organisieren von Daten

Nehmen wir an, wir haben ein Unternehmen gegründet, das Telekommunikations- und Internetdienste für Kunden bereitstellt. Wir müssen nachverfolgen, welcher Kunde welchen Dienst derzeit abonniert. Kunden könnten mehr als einen aktiven Dienst gleichzeitig haben, und der Dienst könnte am Ende eines festgelegten Zeitraums ablaufen oder sich automatisch erneuern.

Sehen wir uns eine Lösung an, die Blätter verwendet.

Wir haben einfach eine Liste aller Daten erstellt, die wir haben, d.h. es gibt eine Mischung von Daten an einem Ort. Wir haben Kundendaten (Spalten A bis E), Servicetypen (Spalte F) und Servicedetails (Spalten G, H und J).

Auf den ersten Blick sieht alles ganz gut aus. Wir können alle Daten anzeigen, ohne komplexe Aktionen auszuführen. Wir können die benötigten Daten filtern und Pivot-Tabellen oder Diagramme für Berichtszwecke erstellen. So weit, so gut.

Aber wenn wir weiterhin Bettlaken verwenden, wenn wir mehr Kunden gewinnen, können wir einen Punkt erreichen, an dem alles zu groß für die Bettlaken wird. Und dies bringt eine Reihe neuer Probleme mit sich.

Mögliche Probleme mit Tabellenkalkulationen

Im Vergleich zu Tabellenkalkulationen sind Datenbanken kompliziert. Aber diese „Komplikationen“ dienen einem nützlichen Zweck; Sie verhindern oder minimieren zumindest die folgenden Probleme:

Datenqualität

Die Datenqualität und -konsistenz ist ein großes Problem für größere Blätter. Obwohl wir beabsichtigen, Daten korrekt zu speichern, Datenqualitätsprobleme sind sehr verbreitet. Menschen machen Fehler oder wir müssen unerwartete Informationen eingeben. Denken Sie nur daran, wie die folgenden Szenarios ein Problem darstellen könnten:

  1. Wir möchten einen neuen Kunden hinzufügen, ohne seinen Servicetyp anzugeben. Sollten wir die Kundendetails hinzufügen und die Servicedetails weglassen? Wenn wir nur Kunden einfügen können, die Servicedetails haben, ist das eine Einfügungsanomalie .
  2. Was ist, wenn wir Servicedaten hinzufügen, sobald sie verfügbar sind, nachdem der Kundendatensatz erstellt wurde?
  3. Was ist, wenn ein Kunde mehrere Dienste abonniert? Sollten wir für jeden Dienst einen neuen Datensatz erstellen, da wir nur einen Diensttyp pro Datensatz haben können?
  4. Was ist, wenn wir mehrere Datensätze für einen Kunden haben und wir die Informationen dieses Kunden aktualisieren müssen? Wenn wir die Informationen in allen relevanten Zeilen nicht ändern, werden unsere Daten inkonsistent sein. Wir könnten zwei verschiedene Adressen für dasselbe Konto haben; Wie können wir unter diesen Umständen wissen, welche Daten korrekt sind?
  5. Was passiert, wenn wir Daten löschen? Wenn wir die gesamte Zeile löschen, verlieren wir alle Daten dieses Kunden. Das ist keine gute Idee; Es ist besser, nur ihre Servicedaten zu entfernen und ihre Kundendaten zu behalten. Aber wie können wir das machen, wenn alles zusammen in einer Reihe aufbewahrt wird?
  6. Was ist, wenn nur ein Kunde einen Dienst abonniert und wir diesen Datensatz löschen? Wenn wir den Datensatz dieses Kunden löschen, löschen wir dann auch alle Datensätze dieser Dienstleistung? (Dies wird als Löschanomalie bezeichnet .) Bedeutet das, dass wir diesen Service nicht mehr anbieten? Wenn wir ihn immer noch anbieten, haben wir alle Parameter im Zusammenhang mit diesem Dienst verloren.

Offensichtlich wird es Komplikationen bei der Speicherung der Daten für jedes Unternehmen geben. Wir alle waren schon einmal Opfer von Datenqualitätsproblemen – z. Rechnungen für Dienstleistungen erhalten, die wir nicht bestellt haben, die gleiche Sache zweimal in Rechnung gestellt wurde oder ein Paket an die falsche Adresse geschickt wurde. Diese Dinge passieren, und bei einem kleinen Datensatz ist es relativ einfach, sie zu beheben. Aber was passiert, wenn wir Tausende oder sogar Millionen von Zeilen haben? Wir würden bald fast unsere gesamte Zeit darauf verwenden, diese Probleme zu beheben.

Leistungsprobleme

Leistungsprobleme passieren, wenn Datensätze zu groß werden, um von einem Blatt effizient verarbeitet zu werden. Datenqualitätsprobleme treten viel früher auf als Leistungsprobleme, aber das bedeutet nicht, dass Leistungsprobleme unwichtig sind. Im Gegenteil; Leistungsprobleme können sogar noch gefährlicher sein als Datenqualitätsprobleme.

Es ist üblich, nach bestimmten Zeilen zu suchen, neue Zeilen einzufügen, Zellwerte in vorhandenen Zeilen zu aktualisieren oder zu löschen und ganze Zeilen zu löschen. All diese Aktionen erfordern viel Filterung, was bei einem kleinen Datensatz kein Problem darstellt. Aber wenn Ihre Blätter wirklich groß werden, kann selbst ein einfacher Vorgang Minuten dauern. Die Hälfte Ihres Arbeitstages damit zu verbringen, darauf zu warten, dass der Filter seine Arbeit erledigt, ist kaum eine kluge Wahl.

Es gibt auch das damit verbundene Problem der Redundanz – das mehrfache Speichern der gleichen Daten auf der Festplatte (z. B. werden Kundendaten immer wieder in mehreren Zeilen gespeichert). Dies wirkt sich auch auf die Leistung aus.

Auf anständiger Hardware sind Blätter mit Tausenden von Zeilen in Ordnung. Aber wenn Sie in Zehntausende von Zeilen geraten, können Leistungsprobleme ihre hässlichen Köpfe aufrichten. Es versteht sich von selbst, dass Blätter mit Hunderttausenden oder sogar Millionen von Zeilen eine extrem schlechte Leistung aufweisen.

Andererseits sind Datenbanken dazu da, Leistungsprobleme zu lösen. Wenn alles richtig eingerichtet ist, stellt die Arbeit mit Millionen von Zeilen keine Herausforderungen dar.

Historische Daten und Berichte verwalten

Ein weiteres wichtiges Problem bei Blättern ist die Verfolgung von Datenänderungen im Laufe der Zeit. Wenn Sie Daten einfach aus Blättern löschen, gehen sie verloren. Wenn Sie sich entscheiden, ein Tagesblatt zu speichern (um alle Änderungen zu erfassen und historische Daten zu bewahren), werden Sie sich bald unter Tonnen von Blättern begraben finden. Das Erstellen von Berichten aus einer solchen Struktur ist sehr zeitaufwändig, und die Qualität der daraus generierten Berichte wäre sehr fragwürdig.

Haben Sie solche Probleme mit Ihren Daten?

Im heutigen Artikel haben wir einige Nachteile der Verwendung von Blättern zum Organisieren vieler Daten besprochen. Haben Sie jemals eines dieser Probleme erlebt? Sind Sie bereit, Ihr Unternehmen auf die nächste Stufe zu heben? Wenn die Antwort „Ja“ lautet, sind Sie hier genau richtig! Nächste Woche lernen wir, wie eine Datenbank Probleme beim Speichern von Daten in Blättern löst.