Database
 sql >> Datenbank >  >> RDS >> Database

Verwenden von ODBC-Daten in RapidMiner

Die RapidMiner-Distribution enthält einen generischen Konnektor, der es ermöglicht, Datensätze aus jeder Datenbank zu erstellen, für die ein ODBC-Treiber verfügbar ist. Der Konnektor heißt JDBC-ODBC Bridge und ist ein integraler Bestandteil von Java 1.7 und früher. Die Auswirkungen davon sind:

  • Version 1.8 und spätere Versionen von Java enthalten nicht die native JDBC-ODBC Bridge.
  • Die native Bridge ist in einer zentralen Java-Archivdatei enthalten, sie kann nicht von der mitgelieferten Java-Distribution getrennt werden.

Wenn Sie RapidMiner mit einem 32-Bit-ODBC-Treiber verbinden müssen, verwenden Sie stattdessen die Easysoft JDBC-ODBC Bridge. Die Easysoft JDBC-ODBC Bridge hat eine Java-Komponente und eine native 32-Bit-Komponente. Es wird vollständig von Easysoft unterstützt und wird derzeit in Produktionsumgebungen auf der ganzen Welt eingesetzt.

Sie müssen die Professional-Version von RapidMiner verwenden, um Treiber von Drittanbietern wie die Easysoft JDBC-ODBC Bridge damit zu verwenden. Eine Testversion von RapidMiner Professional ist für Benutzer verfügbar, die ein Konto auf der RapidMiner-Website erstellen.

Wenn Sie RapidMiner Professional noch nicht haben, gehen Sie folgendermaßen vor:

  1. Erstellen Sie ein RapidMiner-Konto und bestätigen Sie dann die E-Mail-Adresse, die Sie beim Erstellen des Kontos angegeben haben.
  2. Laden Sie RapidMiner Studio für Ihre Windows-Plattform herunter.
  3. Starten Sie RapidMiner und melden Sie sich an, wenn Sie dazu aufgefordert werden.

    Ihr Testzeitraum für RapidMiner Professional hat jetzt begonnen.

So verbinden Sie RapidMiner mit einigen ODBC-Daten:

  1. Konfigurieren Sie eine System-ODBC-Datenquelle für die Datenbank, mit der Sie sich in RapidMiner verbinden möchten.

    Verwenden Sie dazu die 32-Bit-Version des ODBC Data Source Administrator auf Ihrem RapidMiner-Rechner. Bei einigen Versionen von Windows befindet sich diese unter Systemsteuerung> Verwaltung . Bei einigen Windows-Versionen müssen Sie im Suchfeld der Taskleiste nach ODBC suchen. Die 32-Bit-Version von ODBC Data Source Administrator sollte deutlich gekennzeichnet sein. Geben Sie im Zweifelsfall im Windows-Dialogfeld „Ausführen“ Folgendes ein:

    %windir%\syswow64\odbcad32.exe
    

    Wir wollten RapidMiner mit einigen Microsoft Access-Daten ausprobieren und haben daher eine Access-ODBC-Treiberdatenquelle erstellt, die auf die Northwind-Datenbank verweist.

  2. Laden Sie die Easysoft JDBC-ODBC Bridge herunter. (Anmeldung erforderlich.)
  3. Installieren und lizenzieren Sie die Easysoft JDBC-ODBC Bridge auf dem Rechner, auf dem RapidMiner installiert ist.

    Installationsanweisungen finden Sie in der Easysoft JDBC-ODBC Bridge-Dokumentation.

  4. Wählen Sie in RapidMiner Verbindungen> Datenbanktreiber verwalten .

    Die Datenbanktreiber verwalten Dialogfeld wird angezeigt.

  5. Wählen Sie Hinzufügen .
  6. Füllen Sie die Dialogfeldfelder aus:
    Field Wert
    Name Easysoft JDBC-ODBC-Brücke
    URL-Präfix jdbc:easysoft://
    Port (Leer lassen)
    Schema-Trennzeichen (Leer lassen)
    Jar-Datei easysoft_install_dir \Jars\EJOB.jar

    Unter 64-Bit-Windows ist der Standardspeicherort für :\Program Files (x86)\Easysoft Limited\Easysoft JDBC-ODBC Bridge.

    Unter 32-Bit-Windows ist der Standardspeicherort für :\Programme\Easysoft Limited\Easysoft JDBC-ODBC Bridge.

    JDBC-Klasse easysoft.sql.jobDriver
  7. Wählen Sie Speichern .
  8. Wählen Sie Verbindungen> Datenbankverbindungen verwalten .

    Die Datenbankverbindungen verwalten Dialogfeld wird angezeigt.

  9. Wählen Sie Neu .
  10. Füllen Sie die Dialogfeldfelder aus:
    Field Wert
    Name JDBC-ODBC-Brücke
    Datenbanksystem Easysoft JDBC-ODBC-Brücke
    Host localhost/
    Port (Leer lassen)
    Datenbankschema my_odbc_data_source
  11. Wählen Sie Erweitert

    Die Erweiterten Verbindungseigenschaften Dialogfeld wird angezeigt.

  12. Füllen Sie die Dialogfeldfelder aus:
    Field Wert
    Anmeldebenutzer my_windows_user
    Anmeldepasswort my_windows_password

    Wählen Sie Überschreiben aus für diese beiden Felder.

  13. Verwenden Sie den Test Schaltfläche, um zu überprüfen, ob Sie die Verbindungsdaten korrekt eingegeben haben.

Um die über die JDBC-ODBC Bridge zugänglich gemachten ODBC-Daten zu analysieren, erstellen Sie einen neuen RapidMiner-Prozess:

  1. Wählen Sie Datei> Neuer Prozess .
  2. Wählen Sie einen leeren Prozess, wenn Sie dazu aufgefordert werden.
  3. Verwenden Sie das Repository Bereich, um die ODBC-Daten zu finden. Wir haben die JDBC-ODBC Bridge verwendet, um einige Access-Daten in der Northwind-Datenbank verfügbar zu machen:DB> JDBC-ODBC Bridge> Example Sets> Customers .
  4. Im Design ziehen Sie eine Tabelle aus dem Repository Bereich zum Prozess Feld. In unserem Fall war die Tabelle Kunden .
  5. Ziehen Sie Blending> Werte> Daten festlegen Operator aus den Operatoren Bereich zum Prozess Bereich.
  6. Ziehen Sie die Ausgabe des Retrieve-Operators auf Set Data Betreiber.
  7. Verwenden Sie die Set-Daten Registerkarte „Parameter“, um einen Spaltenwert zu ändern. Beispielsweise haben wir eine Stellenbezeichnung in unseren Kundendaten von Vertriebsmitarbeiter geändert an Verkaufsleiter :
    Feld Wert
    Beispielindex 1
    Attributname Kundennummer
    Wert ALFKI
    Zusätzliche Werte Liste bearbeiten (0) ...> Attributname Kontakttitel

    Liste bearbeiten (0) ...> Wert Verkaufsleiter

  8. Ziehen Sie die Ausgabe der Set Data Bediener auf die Res-Schaltfläche und wählen Sie Spielen .

    Die geänderten Daten werden in den Ergebnissen angezeigt ansehen.