Database
 sql >> Datenbank >  >> RDS >> Database

ScyllaDB-Trends – Wie Benutzer die Echtzeit-Big-Data-Datenbank einsetzen

ScyllaDB ist ein verteilter Open-Source-NoSQL-Datenspeicher, der aus der beliebten Apache Cassandra-Datenbank neu implementiert wurde. Scylla wurde vor nur vier Jahren im Jahr 2015 veröffentlicht und verzeichnete laut DB-Engines ein durchschnittliches Wachstum der Popularität von über 220 % im Jahresvergleich. Wir haben von der DBA-Community und unseren Benutzern viel über diese wachsende Datenbank gehört und beschlossen, Sponsor des diesjährigen Scylla-Gipfels zu werden, um von seinen Benutzern mehr über die Bereitstellungstrends zu erfahren. In diesem Beitrag schlüsseln wir ScyllaDB Cloud vs. On-Premise-Bereitstellungen, die beliebtesten Cloud-Anbieter, SQL- und NoSQL-Datenbanken, die mit ScyllaDB verwendet werden, die zeitaufwändigsten Verwaltungsaufgaben auf und warum Sie ScyllaDB vs. Cassandra verwenden sollten.

  • ScyllaDB vs. Cassandra
  • ScyllaDB Cloud vs. ScyllaDB On-Premises
  • Die beliebtesten Cloud-Anbieter für ScyllaDB
  • Am häufigsten mit ScyllaDB verwendete Datenbanken
  • Zeitintensivste ScyllaDB-Verwaltungsaufgaben

ScyllaDB vs. Cassandra – Was ist besser?

Sie fragen sich, welchen Breitspaltenspeicher Sie für Ihre Bereitstellungen verwenden sollen? Während Cassandra immer noch am beliebtesten ist, gewinnt ScyllaDB laut DB-Engines schnell als siebtbeliebtester Wide Column Store. Was sind also einige der Gründe, warum sich Benutzer für ScyllaDB oder Cassandra entscheiden würden?

ScyllaDB bietet eine deutlich niedrigere Latenz, wodurch Sie ein hohes Datenvolumen mit minimaler Verzögerung verarbeiten können. Tatsächlich ist laut dem Leistungsbenchmark-Bericht von ScyllaDB ihre 99,9-Perzentil-Latenz bis zu 11-mal besser als Cassandra auf AWS EC2-Bare-Metal. Diese Art von Leistung muss also ihren Preis haben, oder? Das tut es, aber sie behaupten in diesem Bericht, dass es eine 2,5-fache Kostenreduzierung im Vergleich zur Ausführung von Cassandra ist, da sie diese Leistung mit nur 10 % der Knoten erreichen können.

Es gibt Dutzende von hochwertigen Artikeln über ScyllaDB vs. Cassandra, also hören wir hier kurz auf, damit wir zum eigentlichen Zweck dieses Artikels kommen können, nämlich der Aufschlüsselung der ScyllaDB-Benutzerdaten .

ScyllaDB Cloud vs. ScyllaDB On-Premises

ScyllaDB kann sowohl in der Public Cloud als auch lokal ausgeführt werden. Tatsächlich wird ScyllaDB am häufigsten sowohl in öffentlichen Cloud- als auch in On-Premise-Umgebungen innerhalb einer einzelnen Organisation bereitgestellt. Die 44 % der ScyllaDB-Bereitstellungen, die sowohl Cloud- als auch On-Premise-Computing nutzen, könnten entweder über eine hybride Cloud-Umgebung erfolgen, die beides für eine bestimmte Anwendung nutzt, oder diese Umgebungen separat nutzen, um verschiedene Anwendungen zu verwalten.

ScyllaDB-Bereitstellungen vor Ort und ScyllaDB-Cloud-Bereitstellungen waren mit jeweils 28 % tot. Sie können sowohl das kostenlose Open-Source-ScyllaDB als auch ScyllaDB Enterprise in der Cloud oder vor Ort ausführen, und die ScyllaDB-Enterprise-Lizenz beginnt bei 28,8.000 $/Jahr für insgesamt 48 Kerne.

Was ist der beste Weg, #ScyllaDB bereitzustellen? Cloud vs. On-PremiseClick To Tweet

Beliebteste Cloud-Anbieter für ScyllaDB

Da 28 % der ScyllaDB-Cluster ausschließlich in der Cloud bereitgestellt werden und 72 % die Cloud in gewisser Weise nutzen, waren wir daran interessiert zu sehen, welche Cloud-Anbieter für ScyllaDB-Workloads am beliebtesten sind .

#1. AWS

Wir haben festgestellt, dass 39,1 % aller ScyllaDB-Cloud-Bereitstellungen von unseren Umfrageteilnehmern auf AWS ausgeführt werden. Obwohl wir erwartet hatten, dass AWS der Cloud-Anbieter Nr. 1 für ScyllaDB sein würde, war der Prozentsatz erheblich niedriger als die Antworten aller Cloud-Datenbanktypen in dieser Umfrage, die angaben, dass 55 % auf AWS bereitgestellt wurden. Diese Zahl stimmt eher mit unserem aktuellen Open Source Database Trends Report 2019 überein, in dem berichtet wurde, dass 56,9 % der Cloud-Bereitstellungen auf AWS laufen. Dies kann daran liegen, dass AWS ScyllaDB nicht über seine Relational Database Services (RDS) unterstützt, sodass wir die Hypothese aufstellen könnten, dass AWS einen Rückgang seines Kundenstamms erleben könnte, wenn immer mehr Unternehmen ihre Daten zu ScyllaDB migrieren.

#2. Google Cloud

Google Cloud Platform (GCP) war mit 30,4 % aller Cloud-Bereitstellungen der zweitbeliebteste Cloud-Anbieter für ScyllaDB. Google Cloud bietet einen eigenen Wide Column Store und eine Big Data-Datenbank namens Bigtable an, die tatsächlich auf Platz 111 rangiert, eine unter ScyllaDB auf Platz 110 bei DB-Engines. Die niedrigen Kosten und die hohen Leistungsfähigkeiten von ScyllaDB machen es zu einer attraktiven Option für GCP-Benutzer, insbesondere da es im Vergleich zu Bigtable, das nur auf der GCP kommerziell erhältlich ist, Open Source ist.

#3. Azurblau

Azure folgte auf dem dritten Platz, was 17,4 % aller ScyllaDB-Bereitstellungen in der Cloud unserer Umfrageteilnehmer entspricht. Azure ist ein attraktiver Cloud-Anbieter für Organisationen, die die Microsoft-Servicesuite nutzen.

Welcher Cloud-Anbieter ist für #ScyllaDB am beliebtesten? AWS vs. Azure vs. GCPClick To Tweet

Es wurde festgestellt, dass die verbleibenden 13,0 % der ScyllaDB-Cloud-Bereitstellungen auf den Cloud-Computing-Diensten von DigitalOcean, Alibaba und Tencent ausgeführt werden.

Ihr Managed Service, Scylla Cloud, ist derzeit nur auf AWS verfügbar, und Sie müssen die ScyllaDB Enterprise-Version verwenden, um ihre DBaaS zu nutzen. Scylla Cloud plant, in Zukunft Unterstützung für GCP und Azure hinzuzufügen, aber mit nur 39 % der Berichte zu AWS können wir davon ausgehen, dass über 60 % der ScyllaDB-Bereitstellungen in der Cloud selbst verwaltet werden.

Datenbanken, die am häufigsten mit ScyllaDB verwendet werden

Wie wir auch aus dem 2019 Open Source Database Report herausgefunden haben, nutzen Organisationen im Durchschnitt 3,1 verschiedene Datenbanktypen. Aber in dieser Umfrage gaben Organisationen, die ScyllaDB verwenden, an, im Durchschnitt nur 2,3 verschiedene Datenbanktypen zu verwenden, eine Reduzierung um 26 % im Vergleich zu unseren Ergebnissen von allen Open-Source-Datenbankbenutzern. Wir haben auch festgestellt, dass 39 % der ScyllaDB-Bereitstellungen nur ScyllaDB verwenden und keinen anderen Datenbanktyp in ihren Anwendungen nutzen.

Welche Datenbanken werden also am häufigsten in Verbindung mit ScyllaDB verwendet? Wir haben festgestellt, dass ScyllaDB-Benutzer zu 20 % der Zeit auch SQL-Datenbanken, MySQL und zu 20 % PostgreSQL verwenden. Die am zweithäufigsten verwendete Datenbank mit ScyllaDB war Cassandra, die in 16 % der Bereitstellungen vertreten war, und wir könnten davon ausgehen, dass dies von Organisationen stammt, die ScyllaDB als Alternative zu Cassandra in ihren Anwendungen testen, da beide Datenbanktypen breite Spaltenspeicher sind.

MongoDB war mit 12 % die am vierthäufigsten bereitgestellte Datenbank mit ScyllaDB. Redis und Elasticsearch belegten den fünften Platz, beide nutzten 8 % der Zeit mit ScyllaDB-Bereitstellungen.

Wir haben auch festgestellt, dass 20 % der Scylla-Bereitstellungen andere Datenbanktypen nutzen, darunter Oracle, Aerospike, Kafka (das sich jetzt in eine Event-Streaming-Datenbank verwandelt), DB2 und Tarantool.

Zeitintensivste ScyllaDB-Verwaltungsaufgaben

Wir wissen, dass ScyllaDB sehr leistungsfähig ist, aber wie einfach ist es zu verwenden? Wir haben ScyllaDB-Benutzer gefragt, was ihre zeitaufwändigste Verwaltungsaufgabe war, und von 28 % gehört, dass die Scylla-Reparatur die längste Verwaltungsaufgabe war. Scylla Repair ist ein Synchronisierungsprozess, der im Hintergrund ausgeführt wird, um sicherzustellen, dass alle Replikate schließlich dieselben Daten enthalten. Benutzer müssen den Befehl nodetool repair regelmäßig ausführen, da es keine Möglichkeit gibt, Reparaturen in den ScyllaDB-Open-Source- oder ScyllaDB-Enterprise-Versionen zu automatisieren, aber Sie können einen Reparaturzeitplan über Scylla Manager einrichten.

Die langsame Abfrageanalyse von ScyllaDB belegte ScyllaDB-Sicherungen und -Wiederherstellungen mit jeweils 14 % für die zeitaufwändigste Verwaltungsaufgabe auf dem zweiten Platz. Es sieht nicht so aus, als hätte ScyllaDB derzeit einen Abfrageanalysator zur Verfügung, um Abfragen zu identifizieren, die optimiert werden müssen, aber Benutzer können ihre langsame Abfrageprotokollierung verwenden, um zu sehen, welche Abfragen die längste Antwortzeit haben. ScyllaDB-Backups können auch nicht durch die Open Source- und Enterprise-Versionen automatisiert werden, aber sie geben an, dass wiederkehrende Backups in zukünftigen Editionen von Scylla Manager verfügbar sein werden. Es gibt auch keine automatisierte Möglichkeit, ein ScyllaDB-Backup wiederherzustellen, da diese in allen Versionen manuell durchgeführt werden müssen.

10 % der ScyllaDB-Benutzer gaben an, dass das Hinzufügen, Entfernen oder Ersetzen von Knoten die zeitaufwändigste Aufgabe war und landete auf dem vierten Platz. Dies sind manuelle Prozesse, die einige Zeit in Anspruch nehmen können, insbesondere wenn Sie es mit einer großen Datenmenge zu tun haben. Das Hinzufügen von Knoten wird zum Aufskalieren einer Bereitstellung verwendet, während das Entfernen von Knoten Ihre Bereitstellung nach unten skaliert. Knoten müssen ersetzt werden, wenn sie ausgefallen oder tot sind, obwohl ein Cluster immer noch verfügbar sein kann, wenn mehr als ein Knoten ausgefallen ist.

Auf dem fünften Platz mit 7 % liegen Upgrades und Fehlerbehebung. ScyllaDB Enterprise und Open Source erfordern beide umfangreiche Schritte zum Upgrade eines Clusters. Die empfohlenen Methoden umfassen ein rollierendes Verfahren, sodass keine Ausfallzeiten auftreten. Dies ist jedoch ein manueller Prozess, sodass der Benutzer jeweils einen Knoten herunterfahren, alle Upgrade-Schritte ausführen, den Knoten neu starten und validieren muss, bevor er mit der Ausführung fortfährt dieselben Schritte für die verbleibenden Knoten im Cluster. In der Tat zeitaufwändig, aber zum Glück keine tägliche Aufgabe! Die Fehlerbehebung ist natürlich ein tiefes Kaninchenloch, in das man eintauchen muss, aber ScyllaDB Enterprise-Kunden erhalten unternehmenskritischen Support rund um die Uhr, und Open-Source-Benutzer haben Zugriff auf eine Fülle von Ressourcen, einschließlich Dokumentation, Mailinglisten, Scylla University und einem Slack Channel für Benutzer Diskussionen.

Was ist die zeitaufwändigste #ScyllaDB-Verwaltungsaufgabe?Click To Tweet

Die verbleibenden 21 % der zeitaufwändigen Aufgaben, die von ScyllaDB-Benutzern gemeldet werden, umfassen Überwachung, Migrationen, Bereitstellung, Shard-Ausgleich, Komprimierung und Patchen.

Wie sehen diese Ergebnisse im Vergleich zu Ihren ScyllaDB-Bereitstellungen aus? Suchen Sie nach einer Möglichkeit, diese zeitaufwändigen Verwaltungsaufgaben zu automatisieren? Obwohl wir heute MySQL, PostgreSQL, Redis™* und MongoDB® Database unterstützen, suchen wir immer nach Feedback dazu, welche Datenbank wir als nächstes durch unsere DBaaS-Pläne unterstützen sollen. Teilen Sie uns in den Kommentaren oder auf Twitter unter @scalegridio mit, wenn Sie nach einer einfacheren Möglichkeit suchen, Ihre ScyllaDB-Cluster in der Cloud oder lokal zu verwalten!