Zu Hauptinhalten wechseln
Procore

Erste Schritte mit Analytics 2.0

Procore Analytics Cloud-Konnektor

Einleitung

Cloud Connector ist die Art und Weise, wie Procore Daten, Informationen und Analysen mit seinen Kunden teilt. Dies kann direkt an Reporting-Tools wie Power BI oder Tableau weitergegeben werden. Sie können auch für Data Warehouses, Stores, Lakes oder andere Anwendungen der Kunden freigegeben werden. Kunden können sogar programmgesteuerten Zugriff auf ihre Daten mit Cloud Connector erstellen, um eine echte Automatisierung zu erzielen. Cloud Connector basiert auf dem offenen Freigabeprotokoll von Delta Share.

Analytics 2.0 Guided Data Connector-Optionen

Delta Sharing ist das branchenweit erste offene Protokoll für den sicheren Datenaustausch, das den Datenaustausch mit anderen Unternehmen vereinfacht, unabhängig davon, welche Computerplattformen sie verwenden.  Viele Anwendungen können mit Delta Share auf Daten zugreifen. Um das Kundenerlebnis jedoch weiter zu verbessern, hat Procore Konnektoren, vorgefertigten Code und Leitfäden für die folgenden Plattformen hinzugefügt, um die Einrichtungszeit und Komplexität zu reduzieren und eine nahtlose, sofort einsatzbereite Verbindung zu ermöglichen.

  • SQL Server
    • SSIS-Python
    • Python-Bibliothek
    • Python Spark
  • Azurblau
    • ADLS Azure Functions
    • ADLS-Python
    • ADLS Spark
    • Lakehouse Fabric Data Factory
    • Lakehouse Notizbuch aus Stoff
    • SQL Server Azure-Funktionen
    • SQL Server Fabric Data Factory
    • SQL Server Fabric-Notebook
  • Databricks
  • Schneeflocke
  • Amazon S3
  • Anleitungen, um Ihre eigenen zu schreiben (GitHub)

Weitere Datenkonnektoren folgen in Kürze!

Zugriff auf Dokumentation und Code

Umfassende Dokumentationen und Codebeispiele sind im Analytics-Produkt direkt in der Procore-Webanwendung verfügbar, auf die Ihre Procore-Administratoren zugreifen können. Diese Ressourcen enthalten Schritt-für-Schritt-Anleitungen, Codeausschnitte und bewährte Praktiken, die Sie bei der Einrichtung und Verwaltung Ihrer Datenintegration unterstützen.

Nächste Schritte

Fahren Sie mit dem nächsten Abschnitt dieser Anleitung fort, um mit dem Einrichtungsprozess zu beginnen. 


Wenn Sie weitere Fragen oder Unterstützung benötigen, wenden Sie sich bitte an Ihren Kundenbetreuer oder unser Support-Team.  

Überlegungen zu Partnern

Bitte lesen Sie die folgenden Überlegungen zu Partnern:

Beratungspartner

  1. Berechtigungen: Wenn Sie Analytics 2.0 verwenden, ruft das von Ihnen generierte Token Daten von allen Unternehmen ab, auf die Ihr Procore-Login Zugriff hat.  Wenn Sie mit mehreren Kunden zusammenarbeiten, müssen Sie für jeden Kunden ein separates Procore-Login erstellen, um zu vermeiden , dass versehentlich Daten zwischen Kunden ausgetauscht werden.  Verwenden Sie nicht dasselbe Login (Token) für verschiedene Kunden.
  2. Support: Der Partner muss Support in Bezug auf seine Datensätze und Berichte bereitstellen.

App-Partner

  1. Massenzugriff: Unabhängig davon, ob Sie Ihre Daten über eine API oder einen benutzerdefinierten Power BI-Connector verfügbar machen , benötigen Sie ein Sicherheitsmodell, das Daten für alle Projekte mit jedem Endpunkt zurückgibt. Power BI ist auf die Massendatenerfassung ausgerichtet und kann nicht skaliert werden, wenn Datasets nach einem Projekt oder einem anderen eindeutigen Kennung durchlaufen werden müssen.
  2. Mehrere Datasets: Es ist üblich, separate Datasets für jede berichtsfähige Datenentität verfügbar zu machen. Jeder von ihnen sollte das gleiche Sicherheitsmodell unterstützen und Daten in großen Mengen zurückgeben.
  3. Sicherheit: Sie müssen eine Lösung implementieren, die das Massenlesen der Daten mit einem einzigen Satz sicherer Anmeldedaten ermöglicht.
  4. Power BI-Vorlage: Ihre Power BI-Vorlage sollte bei jedem Kunden, der sie verwendet , sofort funktionieren. Die Power BI-Vorlage wird in den Power BI-Mandanten des Clients geladen. Sie konfigurieren die Datasets mit den Anmeldedaten, die Sie ihnen zur Verfügung stellen.

Überprüfen von Berechtigungen

 Hinweis
  • Sie müssen das Analytics-Tool auf Unternehmensebene für das Procore-Konto Ihres Unternehmens aktiviert haben. 
  • Jeder, der über "Admin"-Zugriff auf das Analytics-Tool verfügt, kann zusätzlichen Benutzern Zugriff auf das Analytics-Tool gewähren. 
  • Benutzer müssen über "Admin"-Zugriff auf das Analytics-Tool verfügen, um ein Zugriffstoken generieren zu können. 
  • Es kann bis zu 24 Stunden dauern, bis Änderungen an den Berechtigungen eines Benutzers im Adressbuch für Analytics wirksam werden.

Sie müssen sicherstellen, dass die entsprechenden Berechtigungen zugewiesen sind, um ein Zugriffstoken zu generieren, damit Sie Ihre Procore-Daten mit Ihrer BI-Lösung verbinden können. Der Zugriff auf Analytics ist mit Ihren Procore-Anmeldedaten verknüpft, sodass Sie ein einzelnes Zugriffstoken generieren können. Das Zugriffstoken ist eine Ziffernfolge, die Sie in Ihr BI-System eingeben, um auf Daten zuzugreifen. 

In der Regel handelt es sich bei Benutzern, die Zugriffstoken benötigen, um Data Engineers oder Power BI-Entwickler.  Wenn Sie in mehreren Unternehmen Zugriff auf Analytics haben, können Sie mit Ihrem Token Daten von allen Unternehmen abrufen. Der Token ist an Sie gebunden, nicht an ein bestimmtes Unternehmen, so dass er für alle Unternehmen, auf die Sie Zugriff haben, gleich bleibt.

Unternehmens- und Projektadministratoren erhalten standardmäßig eine Admin-Rolle. Die folgenden Benutzerzugriffsebenen sind für das Analytics-Tool zulässig:

  • Nichts: Kein Zugriff auf Analytics-Daten.
  • Admin: Hat volle Zugriffsrechte auf Daten für alle Tools und Projekte (mit Ausnahme bestimmter als privat gekennzeichneter Daten wie Korrespondenzdaten ).

Widerrufen des Zugriffs

Der Zugriff auf Daten im Analytics-Tool wird widerrufen, wenn einem Benutzer die Berechtigungen für das Tool entzogen werden. Wenn der Kontaktdatensatz eines Nutzers inaktiv wird, verliert er außerdem den Zugriff auf Analytics-Daten.

Generieren von Anmeldeinformationen für den Datenzugriff

Um mit dem Zugriff auf Ihre Procore-Daten zu beginnen, gibt es zwei Optionen zum Generieren Ihrer Anmeldedaten für den Datenzugriff: die direkte Databricks-Verbindungsmethode oder die Delta-Freigabetokenmethode. Das Zugriffstoken ist eine Ziffernfolge, die Sie in den entsprechenden Datenkonnektor eingeben, um auf Daten zuzugreifen. 

Überlegungen

  • Sie müssen das Analytics-Tool auf Unternehmensebene für das Procore-Konto Ihres Unternehmens aktiviert haben. 
  • Standardmäßig haben alle Unternehmensadministratoren "Admin"-Zugriff auf Analytics im Adressbuch. 
  • Jeder, der über "Admin"-Zugriff auf das Analytics-Tool verfügt, kann zusätzlichen Benutzern Zugriff auf das Analytics-Tool gewähren. 
  • Benutzer müssen über "Admin"-Zugriff auf das Analytics-Tool verfügen, um ein Zugriffstoken generieren zu können. 

Schritte

  1. Melden Sie sich bei Procore an. 
  2. Klicken Sie auf das Symbol Konto und Profil im oberen rechten Bereich der Navigationsleiste.
    Account Icon.png
  3. Klicken Sie auf Meine Profileinstellungen.  
  4. Unter Wählen Sie Ihre Verbindung mit Analytics haben Sie zwei Optionen zum Generieren von Anmeldedaten:
    • Databricks stellt eine direkte Verbindung her ODER generiert ein persönliches Zugriffstoken mit Delta Share.
  5. Geben Sie Ihren Databricks-Freigabebezeichner für die direkte Databricks-Verbindungsmethode ein, und klicken Sie dann auf Verbinden. Weitere Informationen finden Sie unter Verbinden Ihrer Procore-Daten  mit einem Databricks-Arbeitsbereich
  6. Wählen Sie für die Tokenmethode Delta-Freigabetoken aus.
  7. Stellen Sie sicher, dass Sie ein Ablaufdatum wählen.
  8. Klicken Sie auf Token generieren.
    Wichtig! Es wird empfohlen, dass Sie Ihr Token kopieren und speichern, um später darauf zurückgreifen zu können, da Procore keine Token für Benutzer speichert. 
  9. Sie verwenden Ihr Bearertoken, Ihren Freigabenamen, die URL des Delta-Freigabeservers und die Version Ihrer Freigabeanmeldeinformationen, um auf Ihre Daten zuzugreifen und diese zu integrieren.
    analytics-generate-token.png
  10. In den zusätzlichen Abschnitten des Handbuchs "Erste Schritte" finden Sie die nächsten Schritte zum Verbinden Ihrer Daten basierend auf der gewünschten Datenverbindungsmethode. 
 Hinweis
  • Das Token verschwindet nach einer Stunde oder es verschwindet auch, wenn Sie die Seite verlassen. Um ein neues Token zu generieren, kehren Sie zu Schritt 1 zurück. 
  • Es kann bis zu 24 Stunden dauern, bis die Daten sichtbar werden.
  • Bitte generieren Sie Ihr Token während dieser Verarbeitungszeit nicht neu, da dies zu Problemen mit Ihrem Token führen kann.

Hochladen von Berichten in Power BI (falls zutreffend)

  1. Navigieren Sie über das Menü "Unternehmenstools" zu Analytics .
  2. Wechseln Sie zum  Abschnitt Erste Schritte .
  3. Wählen Sie unter Power BI-Dateien die verfügbaren Power BI-Berichte aus, und laden Sie sie herunter. 
  4. Melden Sie sich mit Ihren Power BI-Anmeldedaten beim Power BI-Dienst an.
  5. Erstellen Sie einen Arbeitsbereich, in dem Sie die Analytics-Berichte Ihres Unternehmens speichern möchten. Weitere Informationen finden Sie in der Power BI-Supportdokumentation von Microsoft.
    Notizen: Es können Lizenzierungsanforderungen gelten.
  6. Klicken Sie im Arbeitsbereich auf Hochladen.
  7. Klicken Sie nun auf Durchsuchen.
  8. Wählen Sie die Berichtsdatei an ihrem Speicherort auf Ihrem Computer aus und klicken Sie auf Öffnen.
  9. Nachdem Sie die Datei hochgeladen haben, klicken Sie auf Filter und wählen Sie Semantisches Modell.
  10. Bewegen Sie den Mauszeiger über die Zeile mit dem Namen des Berichts und klicken Sie auf das Symbol der vertikalen Ellipse icon-ellipsis-options-menu3.png .
  11. Klicken Sie auf Einstellungen.
  12. Klicken Sie auf der Einstellungsseite auf Datenquellen Anmeldedaten und dann auf Anmeldeinformationen bearbeiten.
  13. Führen Sie im angezeigten Fenster "[Berichtsname] konfigurieren" die folgenden Schritte aus:
    • Authentifizierungsmethode: Wählen Sie "Schlüssel". 
    • Kontoschlüssel: Geben Sie den Token ein, den Sie von der Seite zur Tokengenerierung in Procore erhalten haben. 
    • Einstellung der Datenschutzstufe für diese Datenquelle: Wählen Sie die Datenschutzstufe aus. Wir empfehlen, "Privat" oder "Organisatorisch" zu wählen. Weitere Informationen zu den Datenschutzstufen finden Sie in der Power BI-Supportdokumentation von Microsoft.
  14. Klicken Sie auf Anmelden.
  15. Klicken Sie auf Refresh und gehen Sie wie folgt vor :
    • Zeitzone: Wählen Sie die Zeitzone aus, die Sie für geplante Datenaktualisierungen verwenden möchten.
    • Stellen Sie unter Aktualisierungszeitplan konfigurieren den Umschalter auf die Position EIN.
    • Aktualisierungshäufigkeit: Wählen Sie "Täglich".
    • Uhrzeit: Klicken Sie auf Weitere Uhrzeit hinzufügen und wählen Sie 7:00 Uhr aus.
      Anmerkung: Sie können bis zu 8 Aktualisierungszeiten hinzufügen.
    • Optional:
      • Markieren Sie das Kontrollkästchen "Benachrichtigungen über Aktualisierungsfehler an den Eigentümer des Datasets senden", um Benachrichtigungen über Aktualisierungsfehler zu senden.
      • Geben Sie die E-Mail-Adressen aller anderen Kollegen ein, an die das System Benachrichtigungen über Aktualisierungsfehler senden soll.
  16. Klicken Sie auf Übernehmen.
  17. Um zu überprüfen, ob die Einstellungen korrekt konfiguriert wurden und ob die Daten des Berichts ordnungsgemäß aktualisiert werden, kehren Sie zur Seite "Filtern und Semantisches Modell auswählen"  zurück und führen Sie die folgenden Schritte aus:
    • Bewegen Sie den Mauszeiger über die Zeile mit dem Namen des Berichts und klicken Sie auf das kreisförmige Pfeilsymbol, um die Daten manuell zu aktualisieren.
    • Überprüfen Sie die Spalte "Aktualisiert", um zu sehen, ob ein Warnsymbol icon-warning-estimating.png angezeigt wird.
      • Wenn kein Warnsymbol angezeigt wird, wurden die Daten des Berichts erfolgreich aktualisiert.
      • Wenn ein Warnsymbol angezeigt wird, ist ein Fehler aufgetreten. Klicken Sie auf das Warnsymbol icon-warning-estimating.png , um weitere Informationen zu dem Fehler anzuzeigen.
  18. Führen Sie die folgenden Schritte aus, um das leere Dashboard zu löschen, das der Power BI-Dienst automatisch erstellt hat:
    • Bewegen Sie den Mauszeiger über die Zeile mit dem Namen des Dashboards. Klicken Sie auf das Ellipsensymbol icon-ellipsis-options-menu3.png und dann auf Löschen.
  19. Um zu überprüfen, ob der Bericht ordnungsgemäß gerendert wird, navigieren Sie zur Seite "Alle" oder "Inhalt", und klicken Sie auf den Namen des Berichts, um den Bericht im Power BI-Dienst anzuzeigen.
     Tipp
    Verweisen Sie auf die Spalte "Typ", um sicherzustellen, dass Sie auf den Bericht und nicht auf ein anderes Asset klicken.
  20. Wiederholen Sie die obigen Schritte in Power BI für jede Analytics-Berichtsdatei.

Herstellen einer Verbindung mit Power BI Desktop

  • Laden Sie das gezippte Paket aus dem Unternehmensebene Analytics-Tool (über Analytics > Getting Started > Connection Options > PowerBI) in Procore herunter.

Herstellen einer Verbindung mit SQL Server mithilfe von Python (SSIS)

Übersicht

Das Analytics Cloud Connect Access-Tool ist eine Befehlszeilenschnittstelle (CLI), mit der Sie Datenübertragungen von Procore zu MS SQL Server konfigurieren und verwalten können. Es besteht aus zwei Hauptkomponenten:

  •  user_exp.py (Dienstprogramm zur Konfigurationseinrichtung)
  • delta_share_to_azure_panda.py (Skript zur Datensynchronisation)

Voraussetzungen

  • Python und pip sind auf Ihrem System installiert.
  • Zugriff auf Procore Delta Share.
  • Anmeldedaten für das MS SQL Server-Konto.
  • Laden Sie das gezippte Paket aus dem Unternehmensebene Analytics-Tool herunter (über Analytics > Erste Schritte > Verbindungsoptionen > SQL Server).
  • Erforderliche Abhängigkeiten installieren: pip install -r requirements.txt.
  • Profildatei für die Delta-Freigabe:
    • Aktualisieren Sie das Token und den Endpunkt, die Sie von der Procore-Benutzeroberfläche in der Datei template_config.share (im heruntergeladenen Inhalt) erhalten haben, und benennen Sie template_config.share in config.share um.
    • Python-Umgebung:
      • Installieren Sie Python 3.9+ und pip auf Ihrem System.

Schritte

Erstkonfiguration

  • Führen Sie das Konfigurationsdienstprogramm aus:
    Python-user_exp.py

Dies wird Ihnen bei der Einrichtung helfen:

  • Konfiguration der Delta Share-Quelle
  • MS SQL Server-Zielkonfiguration
  • Einstellungen für die Terminplanung

Daten-Synchronisation

Nach der Konfiguration haben Sie zwei Möglichkeiten, die Datensynchronisierung auszuführen:

  1. Python für die direkte Ausführung
    delta_share_to_azure_panda.py
    ODER
  2. Geplante Ausführung
    Wenn Sie dies während des Setups konfigurieren, wird der Auftrag automatisch gemäß Ihrem Cron-Zeitplan ausgeführt.

Konfiguration der Delta-Freigabe

  1. Erstellen Sie eine neue Datei mit dem Namen config.share mit Ihren Delta Share-Anmeldedaten im JSON-Format.

{
"shareCredentialsVersion": 1,
"bearerToken": "xxxxxxxxxxxxxxx",
"endpoint": "https://nvirginia.cloud.databricks.c...astores/xxxxxx

 

  1. Abrufen von Pflichtfeldern:
    Hinweis: Diese Details können über die Analytics-Webanwendung abgerufen werden.
    • ShareCredentialsVersion: Versionsnummer (derzeit 1).
    • BearerToken: Ihr Delta Share-Zugriffstoken.
    • Endpunkt: Die URL Ihres Delta Share-Endpunkts.
    • Speichern Sie die Datei an einem sicheren Ort.
  2. Bei der Konfiguration der Datenquelle werden Sie aufgefordert, Folgendes anzugeben:
    • Liste der Tabellen (durch Kommas getrennt).
    • Lassen Sie das Feld leer, um alle Tabellen zu synchronisieren.
    • Beispiel: 'table1, t able2table3'.
    • Pfad zu Ihrer 'config.share' Datei.

MS SQL Server-Konfiguration

Sie müssen die folgenden MS SQL Server-Details angeben:

  • Datenbank
  • Gastgeber
  • Passwort
  • Schema
  • Nutzername

SSIS-Konfiguration

  1. Navigieren Sie über  die Befehlszeile zu dem Ordner, indem Sie'cd'<path to the folder> eingeben.
  2. Installieren Sie die erforderlichen Pakete mit 'pip install -r requirements.txt'  oder 'python -m pip install -r requirements.txt'.
  3. Öffnen Sie SSIS, und erstellen Sie ein neues Projekt.
  4. Ziehen Sie aus der SSIS-Toolbox die Aktivität "Prozessaufgabe ausführen" per Drag & Drop.

    analytics-data-connector-sql-ssis.png
  5. Doppelklicken Sie auf "Prozessaufgabe ausführen" und navigieren Sie zur Registerkarte Verarbeiten.
  6. Geben Sie unter "Ausführbare Datei" den Pfad ein,  um im Python-Installationsordner zu python.exe.
  7. Geben Sie in 'WorkingDirectory' einen Pfad zu dem Ordner ein, der das Skript enthält  , das Sie ausführen möchten (ohne den Namen der Skriptdatei).
  8. Geben Sie unter 'Argumente'  den Namen des Skripts 'delta_share_to_azure_panda.py' ein, die Sie mit dem .py ausführen möchten zu erweitern und zu speichern.

    analytics-sql-ssis2.png
     
  9. Klicken Sie auf die Schaltfläche "Start" im oberen Bereich:
    analytics-sql-ssis.png
  10. Während der Ausführung der Aufgabe wird die Ausgabe der Python-Konsole im Fenster der externen Konsole angezeigt.
  11. Sobald die Aufgabe erledigt ist, wird ein grünes Häkchen angezeigt:

    analytics-sql-ssis1.png

Herstellen einer Verbindung mit SQL Server mithilfe der Python-Bibliothek

Übersicht

Dieses Handbuch enthält detaillierte Anweisungen zum Einrichten und Verwenden des Delta Sharing-Integrationspakets auf einem Windows-Betriebssystem , um Daten nahtlos in Ihre Workflows mit Analytics zu integrieren. Das Paket unterstützt mehrere Ausführungsoptionen, so dass Sie die gewünschte Konfiguration und Integrationsmethode auswählen können.

Voraussetzungen

Stellen Sie sicher, dass Sie über Folgendes verfügen, bevor Sie fortfahren:

  • Analytics 2.0 SKU
  • Profildatei für die Delta-Freigabe:
    • Aktualisieren Sie das Token und den Endpunkt, die Sie von der Procore-Benutzeroberfläche in der Datei template_config.share (im heruntergeladenen Inhalt) erhalten haben, und benennen Sie template_config.share in config.share um.
    • Python-Umgebung:
      • Installieren Sie Python 3.9+ und pip auf Ihrem System.

Schritte

Vorbereiten des Pakets

  1. Erstellen Sie eine neue Datei mit dem Namen config.share mit Ihren Delta Share-Anmeldedaten im JSON-Format.

{
"shareCredentialsVersion": 1,
"bearerToken": "xxxxxxxxxxxxxxx",
"endpoint": "https://nvirginia.cloud.databricks.c...astores/xxxxxx

  1. Abrufen von Pflichtfeldern.
    Hinweis: Diese Details können über die Analytics-Webanwendung abgerufen werden.
    • ShareCredentialsVersion: Versionsnummer (derzeit 1).
    • BearerToken: Ihr Delta Share-Zugriffstoken.
    • Endpunkt: Die URL Ihres Delta Share-Endpunkts.
  2. Laden Sie das Paket herunter und extrahieren Sie es.
    Hinweis: Sie können das gezippte Paket aus dem Unternehmensebene Analytics-Tool herunterladen (über Analytics > Erste Schritte > Verbindungsoptionen > SQL Server).
  3. Entpacken Sie das Paket in ein Verzeichnis Ihrer Wahl.
  4. Kopieren Sie die *.share Delta Sharing-Profildatei in das Paketverzeichnis, um den Zugriff zu erleichtern.
    analytics-sql-windows2.png

Installieren von Abhängigkeiten

  1. Öffnen Sie ein Terminal im Paketverzeichnis.
  2. Führen Sie den folgenden Befehl aus, um die Abhängigkeiten zu installieren:
  3. pip install -r requirements.txt

Konfiguration generieren

  1. Generieren Sie die Datei config.yaml , indem Sie python user_exp.py ausführen:
    Dieses Skript hilft beim Generieren der Datei config.yaml, die die erforderlichen Anmeldedaten und Einstellungen enthält.
  2. Bei der Konfiguration der Datenquelle werden Sie aufgefordert, Folgendes anzugeben:
    • Liste der Tabellen (durch Kommas getrennt).
    • Lassen Sie das Feld leer, um alle Tabellen zu synchronisieren.
      Beispiel: 'Tabelle1, Tabelle2, Tabelle3'.
    • Pfad zu Ihrer 'config.share' Datei.
  3. Zum ersten Mal geben Sie Ihre Anmeldedaten wie den Speicherort der Delta Share-Quellkonfiguration, Tabellen, Datenbank, Host usw. an.
    Anmerkung: Danach können Sie die Konfiguration manuell oder durch das laufende Python-user_exp.py wiederverwenden oder aktualisieren.

Konfigurieren von Cron-Jobs und sofortiger Ausführung (optional)

  1. Entscheiden Sie, ob Sie einen Cronjob für die automatische Ausführung einrichten möchten.
  2. Stellen Sie einen Cron-Zeitplan bereit:
    • Format: * * * * * ( Minute, Stunde, Monatstag, Monat, Wochentag).
    • Beispiel für die tägliche Ausführung um 2 Uhr morgens: 0 2 * * *
    • Um die Planungsprotokolle zu überprüfen, wird die Datei 'procore_scheduling.log' erstellt, sobald die Terminplanung eingerichtet ist.

Sie können die Zeitplanung auch überprüfen, indem Sie den folgenden Befehl im Terminal ausführen:

Für Linux und MacOs:    

Bearbeiten/Löschen - Bearbeiten Sie den Terminplanungs-Cron mit:

'''Bash
EDITOR=nano crontab -e
```

  • Nachdem Sie den obigen Befehl ausgeführt haben, sollten Sie etwas Ähnliches wie das folgende sehen:
  • 2 * * * * /Benutzer/your_user/snowflake/venv/bin/python /Benutzer/your_user/snowflake/sql_server_python/connection_config.py 2>&1 | während der gelesenen Zeile; do echo "$(date) - $line"; Erledigt >> /Benutzer/your_user/snowflake/sql_server_python/procore_scheduling.log # procore-data-import
  • Sie können auch den Zeitplan anpassen oder die gesamte Zeile löschen, um zu verhindern, dass sie nach Zeitplan ausgeführt wird.

Für Windows:

  • Überprüfen Sie, ob die Terminplanaufgabe erstellt wurde:
    '''Powershell
    schtasks /query /tn "ProcoreDeltaShareScheduling" /fo LIST /v

    ```
  • So bearbeiten/löschen Sie die Planungsaufgabe:
    Öffnen Sie den Taskplaner:
    • Drücken Sie Win + R, geben Sie taskschd.msc ein. und drücken Sie die Eingabetaste.
    • Navigieren Sie zu den geplanten Aufgaben.
    • Erweitern Sie im linken Bereich die Taskplaner-Bibliothek.
    • Suchen Sie nach dem Ordner, in dem Ihre Aufgabe gespeichert ist (z. B. Taskplaner-Bibliothek oder ein benutzerdefinierter Ordner).
  • Finden Sie Ihre Aufgabe:
    • Suchen Sie nach dem Aufgabennamen ProcoreDeltaShareScheduling.
    • Klicken Sie darauf, um die Details im unteren Bereich anzuzeigen.
  • Überprüfen Sie den Zeitplan:
    • Überprüfen Sie die Registerkarte Trigger, um zu sehen, wann die Aufgabe ausgeführt werden soll.
    • Überprüfen Sie die Registerkarte Verlauf, um die letzten Ausführungen zu bestätigen.
  • So löschen Sie die Aufgabe:
    • Löschen Sie die Aufgabe aus der GUI.

Frage zur sofortigen Ausführung:

  • Option zum Ausführen eines Skripts zum Kopieren von Daten unmittelbar nach der Konfiguration.
  • Nach dem Generieren der config.yaml, Die CLI kann jederzeit unabhängig ausgeführt werden, indem je nach Paket ein Skript zum Kopieren von Daten ausgeführt wird. Siehe Beispiele unten:
    Python-delta_share_to_azure_panda.py
    ODER
    python delta_share_to_sql_spark.py
    ODER
    python delta_share_to_azure_dfs_spark.py

Ausführung und Wartung

Häufige Probleme und Lösungen

  1. Cron Job Einrichtung:
    • Stellen Sie sicher, dass die Systemberechtigungen korrekt konfiguriert sind.
    • Überprüfen Sie die Systemprotokolle, wenn der Auftrag nicht ausgeführt werden kann.
    •  Überprüfen Sie, ob das Skript über Ausführungsberechtigungen delta_share_to_azure_panda.py verfügt.
  2. Konfigurationsdatei:
    • Stellen Sie sicher, dass sich die Datei config.yaml im selben Verzeichnis wie das Skript befindet.
    • Sichern Sie die Datei, bevor Sie Änderungen vornehmen.

Unterstützen

Für weitere Hilfe:

  1. Überprüfen Sie die Skriptprotokolle auf detaillierte Fehlermeldungen.
  2. Überprüfen Sie die Datei config.yaml auf Fehlkonfigurationen.
  3. Wenden Sie sich an Ihren Systemadministrator, wenn Sie Fragen zu Berechtigungen haben.
  4. Wenden Sie sich bei Problemen im Zusammenhang mit dem Delta Share-Zugriff an den Procore Support.
  5. Überprüfen Sie das Protokoll auf fehlgeschlagene Tabellen: failed_tables.log.

Hinweise

  1. Sichern Sie immer Ihre Konfigurationsdateien, bevor Sie Änderungen vornehmen.
  2. Testen Sie neue Konfigurationen in einer Nicht-Produktionsumgebung, um Unterbrechungen zu vermeiden.

Herstellen einer Verbindung mit SQL Server mithilfe von Python Spark

Übersicht

Dieses Handbuch enthält detaillierte Anweisungen zum Einrichten und Verwenden des Delta Sharing-Integrationspakets auf einem Windows-Betriebssystem , um Daten nahtlos in Ihre Workflows mit Analytics zu integrieren. Das Paket unterstützt mehrere Ausführungsoptionen, so dass Sie die gewünschte Konfiguration und Integrationsmethode auswählen können.

Voraussetzungen

Stellen Sie sicher, dass Sie über Folgendes verfügen, bevor Sie fortfahren:

  • Analytics 2.0 SKU
  • Profildatei für die Delta-Freigabe:
    • Aktualisieren Sie das Token und den Endpunkt, die Sie von der Procore-Benutzeroberfläche in der Datei template_config.share (im heruntergeladenen Inhalt) erhalten haben, und benennen Sie template_config.share in config.share um.
    • Python-Umgebung:
      • Installieren Sie Python 3.9+ und pip auf Ihrem System.

Schritte

Vorbereiten des Pakets

  1. Erstellen Sie eine neue Datei mit dem Namen config.share mit Ihren Delta Share-Anmeldedaten im JSON-Format.

{
"shareCredentialsVersion": 1,
"bearerToken": "xxxxxxxxxxxxxxx",
"endpoint": "https://nvirginia.cloud.databricks.c...astores/xxxxxx

  1. Abrufen von Pflichtfeldern.
    Hinweis: Diese Details können über die Analytics-Webanwendung abgerufen werden.
    • ShareCredentialsVersion: Versionsnummer (derzeit 1).
    • BearerToken: Ihr Delta Share-Zugriffstoken.
    • Endpunkt: Die URL Ihres Delta Share-Endpunkts.
  2. Laden Sie das Paket herunter und extrahieren Sie es.
    Hinweis: Sie können das gezippte Paket aus dem Unternehmensebene Analytics-Tool herunterladen (über Analytics > Erste Schritte > Verbindungsoptionen > SQL Server).
  3. Entpacken Sie das Paket in ein Verzeichnis Ihrer Wahl.
  4. Kopieren Sie die *.share Delta Sharing-Profildatei in das Paketverzeichnis, um den Zugriff zu erleichtern.
    analytics-sql-windows2.png

Installieren von Abhängigkeiten

  1. Öffnen Sie ein Terminal im Paketverzeichnis.
  2. Führen Sie den folgenden Befehl aus, um die Abhängigkeiten zu installieren:
  3. pip install -r requirements.txt

Konfiguration generieren

  1. Generieren Sie die Datei config.yaml , indem Sie python user_exp.py ausführen:
    Dieses Skript hilft beim Generieren der Datei config.yaml, die die erforderlichen Anmeldedaten und Einstellungen enthält.
  2. Bei der Konfiguration der Datenquelle werden Sie aufgefordert, Folgendes anzugeben:
    • Liste der Tabellen (durch Kommas getrennt).
    • Lassen Sie das Feld leer, um alle Tabellen zu synchronisieren.
      Beispiel: 'Tabelle1, Tabelle2, Tabelle3'.
    • Pfad zu Ihrer 'config.share' Datei.
  3. Zum ersten Mal geben Sie Ihre Anmeldedaten wie den Speicherort der Delta Share-Quellkonfiguration, Tabellen, Datenbank, Host usw. an.
    Anmerkung: Danach können Sie die Konfiguration manuell oder durch das laufende Python-user_exp.py wiederverwenden oder aktualisieren.

Konfigurieren von Cron-Jobs und sofortiger Ausführung (optional)

  1. Entscheiden Sie, ob Sie einen Cronjob für die automatische Ausführung einrichten möchten.
  2. Stellen Sie einen Cron-Zeitplan bereit:
    • Format: * * * * * ( Minute, Stunde, Monatstag, Monat, Wochentag).
    • Beispiel für die tägliche Ausführung um 2 Uhr morgens: 0 2 * * *
    • Um die Planungsprotokolle zu überprüfen, wird die Datei 'procore_scheduling.log' erstellt, sobald die Terminplanung eingerichtet ist.

Sie können die Zeitplanung auch überprüfen, indem Sie den folgenden Befehl im Terminal ausführen:

Für Linux und MacOs:    

Bearbeiten/Löschen - Bearbeiten Sie den Terminplanungs-Cron mit:

'''Bash
EDITOR=nano crontab -e
```

  • Nachdem Sie den obigen Befehl ausgeführt haben, sollten Sie etwas Ähnliches wie das folgende sehen:
  • 2 * * * * /Benutzer/your_user/snowflake/venv/bin/python /Benutzer/your_user/snowflake/sql_server_python/connection_config.py 2>&1 | während der gelesenen Zeile; do echo "$(date) - $line"; Erledigt >> /Benutzer/your_user/snowflake/sql_server_python/procore_scheduling.log # procore-data-import
  • Sie können auch den Zeitplan anpassen oder die gesamte Zeile löschen, um zu verhindern, dass sie nach Zeitplan ausgeführt wird.

Für Windows:

  • Überprüfen Sie, ob die Terminplanaufgabe erstellt wurde:
    '''Powershell
    schtasks /query /tn "ProcoreDeltaShareScheduling" /fo LIST /v

    ```
  • So bearbeiten/löschen Sie die Planungsaufgabe:
    Öffnen Sie den Taskplaner:
    • Drücken Sie Win + R, geben Sie taskschd.msc ein. und drücken Sie die Eingabetaste.
    • Navigieren Sie zu den geplanten Aufgaben.
    • Erweitern Sie im linken Bereich die Taskplaner-Bibliothek.
    • Suchen Sie nach dem Ordner, in dem Ihre Aufgabe gespeichert ist (z. B. Taskplaner-Bibliothek oder ein benutzerdefinierter Ordner).
  • Finden Sie Ihre Aufgabe:
    • Suchen Sie nach dem Aufgabennamen ProcoreDeltaShareScheduling.
    • Klicken Sie darauf, um die Details im unteren Bereich anzuzeigen.
  • Überprüfen Sie den Zeitplan:
    • Überprüfen Sie die Registerkarte Trigger, um zu sehen, wann die Aufgabe ausgeführt werden soll.
    • Überprüfen Sie die Registerkarte Verlauf, um die letzten Ausführungen zu bestätigen.
  • So löschen Sie die Aufgabe:
    • Löschen Sie die Aufgabe aus der GUI.

Frage zur sofortigen Ausführung:

  • Option zum Ausführen eines Skripts zum Kopieren von Daten unmittelbar nach der Konfiguration.
  • Nach dem Generieren der config.yaml, Die CLI kann jederzeit unabhängig ausgeführt werden, indem je nach Paket ein Skript zum Kopieren von Daten ausgeführt wird. Siehe Beispiele unten:
    Python-delta_share_to_azure_panda.py
    ODER
    python delta_share_to_sql_spark.py
    ODER
    python delta_share_to_azure_dfs_spark.py

Ausführung und Wartung

Häufige Probleme und Lösungen

  1. Cron Job Einrichtung:
    • Stellen Sie sicher, dass die Systemberechtigungen korrekt konfiguriert sind.
    • Überprüfen Sie die Systemprotokolle, wenn der Auftrag nicht ausgeführt werden kann.
    •  Überprüfen Sie, ob das Skript über Ausführungsberechtigungen delta_share_to_azure_panda.py verfügt.
  2. Konfigurationsdatei:
    • Stellen Sie sicher, dass sich die Datei config.yaml im selben Verzeichnis wie das Skript befindet.
    • Sichern Sie die Datei, bevor Sie Änderungen vornehmen.

Unterstützen

Für weitere Hilfe:

  1. Überprüfen Sie die Skriptprotokolle auf detaillierte Fehlermeldungen.
  2. Überprüfen Sie die Datei config.yaml auf Fehlkonfigurationen.
  3. Wenden Sie sich an Ihren Systemadministrator, wenn Sie Fragen zu Berechtigungen haben.
  4. Wenden Sie sich bei Problemen im Zusammenhang mit dem Delta Share-Zugriff an den Procore Support.
  5. Überprüfen Sie das Protokoll auf fehlgeschlagene Tabellen: failed_tables.log.

Hinweise

  1. Sichern Sie immer Ihre Konfigurationsdateien, bevor Sie Änderungen vornehmen.
  2. Testen Sie neue Konfigurationen in einer Nicht-Produktionsumgebung, um Unterbrechungen zu vermeiden.

Herstellen einer Verbindung mit ADLS mithilfe von Azure Functions

Übersicht

Dieser Leitfaden führt Sie durch das Einrichten und Bereitstellen einer Azure-Funktion für die Integration von Delta Sharing-Daten in Analytics. Die Azure-Funktion ermöglicht effiziente Datenverarbeitungs- und Freigabeworkflows mit Delta Sharing-Profilen.

Voraussetzungen

  • Analytics 2.0 SKU.
  • Profildatei für die Delta-Freigabe:
    • Aktualisieren Sie das Token und den Endpunkt, die Sie von der Procore-Benutzeroberfläche in der Datei template_config.share (im heruntergeladenen Inhalt) erhalten haben, und benennen Sie template_config.share in config.share um.
    • Python-Umgebung:
      • Installieren Sie Python 3.9+ und pip auf Ihrem System.
  •  Azure-Einrichtung:
    • Die Azure CLI ist installiert und angemeldet.
    • Azure Functions Kerntools installiert.

Schritte

Vorbereiten des Pakets

  1. Laden Sie das erforderliche Paket herunter (adls_azure_function oder sql_server_azure_function).
    Hinweis: Sie können das gezippte Paket aus dem Unternehmensebene Analytics-Tool herunterladen (über Analytics > Erste Schritte > Verbindungsoptionen > Azure).
  2. Extrahieren Sie die Paketdateien in ein lokales Verzeichnis.
  3. Platzieren Sie die Delta-Sharing-Datei:
    • Kopieren Sie Ihre *.share Delta Sharing-Profildatei in das extrahierte Verzeichnis.

 Installieren von Abhängigkeiten

  1. Öffnen Sie ein Terminal im Paketverzeichnis.
  2. Führen Sie den folgenden Befehl aus, um die erforderlichen Python-Abhängigkeiten zu installieren:
    • pip install -r requirements.txt

Konfiguration generieren

  1. Generieren Sie die Datei config.yaml , indem Sie Folgendes ausführen:
    • Python-user_exp.py
  2. Das Skript fordert Sie auf, Anmeldedaten einzugeben, z. B.:
    • Tabellen
    • Name der Datenbank
    • Gastgeber
    • Zusätzliche Anmeldedaten.
  3. Die Konfiguration kann wiederverwendet oder manuell oder durch erneutes Ausführen  von python user_exp.pyaktualisiert werden.

 Einrichtung der Azure CLI

  1. Melden Sie sich bei Azure an.
  2. Führen Sie den folgenden Befehl aus, um sich anzumelden:
    az login
  3. Überprüfen des Azure-Kontos:
    • az account show
    • Wenn der Befehl az nicht verfügbar ist, installieren Sie die Azure CLI, indem Sie die Anweisungen befolgen, die Sie hier finden: Microsoft Learn.

Installieren von Azure Functions Kerntools

Gehe zu

Hier finden Sie Anweisungen zum Installieren von Azure Functions Kerntools.

Vorbereiten der Azure-Funktion

  1. Verwenden SieSo erstellen Sie Folgendes:
    • Eine Funktions-App
    • Eine Ressourcengruppe
    • Verbrauchsplan
    • Speicherkonto
  2. Benutzerdefinierten Cron-Zeitplan festlegen (optional).
    • Öffnen Sie function_app.py in einem Editor.
    • Suchen Sie die Zeile: @app.timer_trigger(schedule="0 0 */8 * * *",
  3. Ersetzen Sie den Terminplan durch Ihren benutzerdefinierten Cron-Ausdruck und speichern Sie die Datei.

Einsatz

  1. Öffnen Sie ein Terminal im Paketverzeichnis (adls_azure_function).
  2. Führen Sie den folgenden Bereitstellungsbefehl aus:
    • func azure functionapp publish <FunctionAppName> --build remote --python --clean
  3. Ersetzen Sie <FunctionAppName> durch den Namen Ihrer Azure-Funktions-App in Ihrem Azure-Abonnement.

Validierung

  • Stellen Sie sicher, dass die Bereitstellung erfolgreich ist, indem Sie im Azure-Portal den Status Ihrer Funktions-App überprüfen.
  • Überwachen Sie Protokolle, um zu überprüfen, ob die Funktion wie erwartet ausgeführt wird.

 

Herstellen einer Verbindung mit ADLS mithilfe von Python

Übersicht

Dieses Handbuch enthält detaillierte Anweisungen zum Einrichten und Verwenden des Delta Sharing-Integrationspakets auf einem Windows-Betriebssystem , um Daten nahtlos in Ihre Workflows mit Analytics zu integrieren. Das Paket unterstützt mehrere Ausführungsoptionen, so dass Sie die gewünschte Konfiguration und Integrationsmethode auswählen können.

Voraussetzungen

Stellen Sie sicher, dass Sie über Folgendes verfügen, bevor Sie fortfahren:

  • Analytics 2.0 SKU
  • Profildatei für die Delta-Freigabe:
    • Aktualisieren Sie das Token und den Endpunkt, die Sie von der Procore-Benutzeroberfläche in der Datei template_config.share (im heruntergeladenen Inhalt) erhalten haben, und benennen Sie template_config.share in config.share um.
    • Python-Umgebung:
      • Installieren Sie Python 3.9+ und pip auf Ihrem System.

Schritte

Vorbereiten des Pakets

  1. Erstellen Sie eine neue Datei mit dem Namen config.share mit Ihren Delta Share-Anmeldedaten im JSON-Format.

{
"shareCredentialsVersion": 1,
"bearerToken": "xxxxxxxxxxxxxxx",
"endpoint": "https://nvirginia.cloud.databricks.c...astores/xxxxxx

  1. Abrufen von Pflichtfeldern.
    Hinweis: Diese Details können über die Analytics-Webanwendung abgerufen werden.
    • ShareCredentialsVersion: Versionsnummer (derzeit 1).
    • BearerToken: Ihr Delta Share-Zugriffstoken.
    • Endpunkt: Die URL Ihres Delta Share-Endpunkts.
  2. Laden Sie das Paket herunter und extrahieren Sie es.
    Hinweis: Sie können das gezippte Paket aus dem Unternehmensebene Analytics-Tool herunterladen (über Analytics > Erste Schritte > Verbindungsoptionen > Azure).
  3. Entpacken Sie das Paket in ein Verzeichnis Ihrer Wahl.
  4. Kopieren Sie die *.share Delta Sharing-Profildatei in das Paketverzeichnis, um den Zugriff zu erleichtern.
    analytics-sql-windows2.png

Installieren von Abhängigkeiten

  1. Öffnen Sie ein Terminal im Paketverzeichnis.
  2. Führen Sie den folgenden Befehl aus, um die Abhängigkeiten zu installieren:
  3. pip install -r requirements.txt

Konfiguration generieren

  1. Generieren Sie die Datei config.yaml , indem Sie python user_exp.py ausführen:
    Dieses Skript hilft beim Generieren der Datei config.yaml, die die erforderlichen Anmeldedaten und Einstellungen enthält.
  2. Bei der Konfiguration der Datenquelle werden Sie aufgefordert, Folgendes anzugeben:
    • Liste der Tabellen (durch Kommas getrennt).
    • Lassen Sie das Feld leer, um alle Tabellen zu synchronisieren.
      Beispiel: 'Tabelle1, Tabelle2, Tabelle3'.
    • Pfad zu Ihrer 'config.share' Datei.
  3. Zum ersten Mal geben Sie Ihre Anmeldedaten wie den Speicherort der Delta Share-Quellkonfiguration, Tabellen, Datenbank, Host usw. an.
    Anmerkung: Danach können Sie die Konfiguration manuell oder durch das laufende Python-user_exp.py wiederverwenden oder aktualisieren.

Konfigurieren von Cron-Jobs und sofortiger Ausführung (optional)

  1. Entscheiden Sie, ob Sie einen Cronjob für die automatische Ausführung einrichten möchten.
  2. Stellen Sie einen Cron-Zeitplan bereit:
    • Format: * * * * * ( Minute, Stunde, Monatstag, Monat, Wochentag).
    • Beispiel für die tägliche Ausführung um 2 Uhr morgens: 0 2 * * *
    • Um die Planungsprotokolle zu überprüfen, wird die Datei 'procore_scheduling.log' erstellt, sobald die Terminplanung eingerichtet ist.

Sie können die Zeitplanung auch überprüfen, indem Sie den folgenden Befehl im Terminal ausführen:

Für Linux und MacOs:    

Bearbeiten/Löschen - Bearbeiten Sie den Terminplanungs-Cron mit:

'''Bash
EDITOR=nano crontab -e
```

  • Nachdem Sie den obigen Befehl ausgeführt haben, sollten Sie etwas Ähnliches wie das folgende sehen:
  • 2 * * * * /Benutzer/your_user/snowflake/venv/bin/python /Benutzer/your_user/snowflake/sql_server_python/connection_config.py 2>&1 | während der gelesenen Zeile; do echo "$(date) - $line"; Erledigt >> /Benutzer/your_user/snowflake/sql_server_python/procore_scheduling.log # procore-data-import
  • Sie können auch den Zeitplan anpassen oder die gesamte Zeile löschen, um zu verhindern, dass sie nach Zeitplan ausgeführt wird.

Für Windows:

  • Überprüfen Sie, ob die Terminplanaufgabe erstellt wurde:
    '''Powershell
    schtasks /query /tn "ProcoreDeltaShareScheduling" /fo LIST /v

    ```
  • So bearbeiten/löschen Sie die Planungsaufgabe:
    Öffnen Sie den Taskplaner:
    • Drücken Sie Win + R, geben Sie taskschd.msc ein. und drücken Sie die Eingabetaste.
    • Navigieren Sie zu den geplanten Aufgaben.
    • Erweitern Sie im linken Bereich die Taskplaner-Bibliothek.
    • Suchen Sie nach dem Ordner, in dem Ihre Aufgabe gespeichert ist (z. B. Taskplaner-Bibliothek oder ein benutzerdefinierter Ordner).
  • Finden Sie Ihre Aufgabe:
    • Suchen Sie nach dem Aufgabennamen ProcoreDeltaShareScheduling.
    • Klicken Sie darauf, um die Details im unteren Bereich anzuzeigen.
  • Überprüfen Sie den Zeitplan:
    • Überprüfen Sie die Registerkarte Trigger, um zu sehen, wann die Aufgabe ausgeführt werden soll.
    • Überprüfen Sie die Registerkarte Verlauf, um die letzten Ausführungen zu bestätigen.
  • So löschen Sie die Aufgabe:
    • Löschen Sie die Aufgabe aus der GUI.

Frage zur sofortigen Ausführung:

  • Option zum Ausführen eines Skripts zum Kopieren von Daten unmittelbar nach der Konfiguration.
  • Nach dem Generieren der config.yaml, Die CLI kann jederzeit unabhängig ausgeführt werden, indem je nach Paket ein Skript zum Kopieren von Daten ausgeführt wird. Siehe Beispiele unten:
    Python-delta_share_to_azure_panda.py
    ODER
    python delta_share_to_sql_spark.py
    ODER
    python delta_share_to_azure_dfs_spark.py

Ausführung und Wartung

Häufige Probleme und Lösungen

  1. Cron Job Einrichtung:
    • Stellen Sie sicher, dass die Systemberechtigungen korrekt konfiguriert sind.
    • Überprüfen Sie die Systemprotokolle, wenn der Auftrag nicht ausgeführt werden kann.
    •  Überprüfen Sie, ob das Skript über Ausführungsberechtigungen delta_share_to_azure_panda.py verfügt.
  2. Konfigurationsdatei:
    • Stellen Sie sicher, dass sich die Datei config.yaml im selben Verzeichnis wie das Skript befindet.
    • Sichern Sie die Datei, bevor Sie Änderungen vornehmen.

Unterstützen

Für weitere Hilfe:

  1. Überprüfen Sie die Skriptprotokolle auf detaillierte Fehlermeldungen.
  2. Überprüfen Sie die Datei config.yaml auf Fehlkonfigurationen.
  3. Wenden Sie sich an Ihren Systemadministrator, wenn Sie Fragen zu Berechtigungen haben.
  4. Wenden Sie sich bei Problemen im Zusammenhang mit dem Delta Share-Zugriff an den Procore Support.
  5. Überprüfen Sie das Protokoll auf fehlgeschlagene Tabellen: failed_tables.log.

Hinweise

  1. Sichern Sie immer Ihre Konfigurationsdateien, bevor Sie Änderungen vornehmen.
  2. Testen Sie neue Konfigurationen in einer Nicht-Produktionsumgebung, um Unterbrechungen zu vermeiden.

Herstellen einer Verbindung mit ADLS mithilfe von Spark

Übersicht

Dieses Handbuch enthält detaillierte Anweisungen zum Einrichten und Verwenden des Delta Sharing-Integrationspakets auf einem Windows-Betriebssystem , um Daten nahtlos in Ihre Workflows mit Analytics zu integrieren. Das Paket unterstützt mehrere Ausführungsoptionen, so dass Sie die gewünschte Konfiguration und Integrationsmethode auswählen können.

Voraussetzungen

Stellen Sie sicher, dass Sie über Folgendes verfügen, bevor Sie fortfahren:

  • Analytics 2.0 SKU
  • Profildatei für die Delta-Freigabe:
    • Aktualisieren Sie das Token und den Endpunkt, die Sie von der Procore-Benutzeroberfläche in der Datei template_config.share (im heruntergeladenen Inhalt) erhalten haben, und benennen Sie template_config.share in config.share um.
    • Python-Umgebung:
      • Installieren Sie Python 3.9+ und pip auf Ihrem System.

Schritte

Vorbereiten des Pakets

  1. Erstellen Sie eine neue Datei mit dem Namen config.share mit Ihren Delta Share-Anmeldedaten im JSON-Format.

{
"shareCredentialsVersion": 1,
"bearerToken": "xxxxxxxxxxxxxxx",
"endpoint": "https://nvirginia.cloud.databricks.c...astores/xxxxxx

  1. Abrufen von Pflichtfeldern.
    Hinweis: Diese Details können über die Analytics-Webanwendung abgerufen werden.
    • ShareCredentialsVersion: Versionsnummer (derzeit 1).
    • BearerToken: Ihr Delta Share-Zugriffstoken.
    • Endpunkt: Die URL Ihres Delta Share-Endpunkts.
  2. Laden Sie das Paket herunter und extrahieren Sie es.
    Hinweis: Sie können das gezippte Paket aus dem Unternehmensebene Analytics-Tool herunterladen (über Analytics > Erste Schritte > Verbindungsoptionen > Azure).
  3. Entpacken Sie das Paket in ein Verzeichnis Ihrer Wahl.
  4. Kopieren Sie die *.share Delta Sharing-Profildatei in das Paketverzeichnis, um den Zugriff zu erleichtern.
    analytics-sql-windows2.png

Installieren von Abhängigkeiten

  1. Öffnen Sie ein Terminal im Paketverzeichnis.
  2. Führen Sie den folgenden Befehl aus, um die Abhängigkeiten zu installieren:
  3. pip install -r requirements.txt

Konfiguration generieren

  1. Generieren Sie die Datei config.yaml , indem Sie python user_exp.py ausführen:
    Dieses Skript hilft beim Generieren der Datei config.yaml, die die erforderlichen Anmeldedaten und Einstellungen enthält.
  2. Bei der Konfiguration der Datenquelle werden Sie aufgefordert, Folgendes anzugeben:
    • Liste der Tabellen (durch Kommas getrennt).
    • Lassen Sie das Feld leer, um alle Tabellen zu synchronisieren.
      Beispiel: 'Tabelle1, Tabelle2, Tabelle3'.
    • Pfad zu Ihrer 'config.share' Datei.
  3. Zum ersten Mal geben Sie Ihre Anmeldedaten wie den Speicherort der Delta Share-Quellkonfiguration, Tabellen, Datenbank, Host usw. an.
    Anmerkung: Danach können Sie die Konfiguration manuell oder durch das laufende Python-user_exp.py wiederverwenden oder aktualisieren.

Konfigurieren von Cron-Jobs und sofortiger Ausführung (optional)

  1. Entscheiden Sie, ob Sie einen Cronjob für die automatische Ausführung einrichten möchten.
  2. Stellen Sie einen Cron-Zeitplan bereit:
    • Format: * * * * * ( Minute, Stunde, Monatstag, Monat, Wochentag).
    • Beispiel für die tägliche Ausführung um 2 Uhr morgens: 0 2 * * *
    • Um die Planungsprotokolle zu überprüfen, wird die Datei 'procore_scheduling.log' erstellt, sobald die Terminplanung eingerichtet ist.

Sie können die Zeitplanung auch überprüfen, indem Sie den folgenden Befehl im Terminal ausführen:

Für Linux und MacOs:    

Bearbeiten/Löschen - Bearbeiten Sie den Terminplanungs-Cron mit:

'''Bash
EDITOR=nano crontab -e
```

  • Nachdem Sie den obigen Befehl ausgeführt haben, sollten Sie etwas Ähnliches wie das folgende sehen:
  • 2 * * * * /Benutzer/your_user/snowflake/venv/bin/python /Benutzer/your_user/snowflake/sql_server_python/connection_config.py 2>&1 | während der gelesenen Zeile; do echo "$(date) - $line"; Erledigt >> /Benutzer/your_user/snowflake/sql_server_python/procore_scheduling.log # procore-data-import
  • Sie können auch den Zeitplan anpassen oder die gesamte Zeile löschen, um zu verhindern, dass sie nach Zeitplan ausgeführt wird.

Für Windows:

  • Überprüfen Sie, ob die Terminplanaufgabe erstellt wurde:
    '''Powershell
    schtasks /query /tn "ProcoreDeltaShareScheduling" /fo LIST /v

    ```
  • So bearbeiten/löschen Sie die Planungsaufgabe:
    Öffnen Sie den Taskplaner:
    • Drücken Sie Win + R, geben Sie taskschd.msc ein. und drücken Sie die Eingabetaste.
    • Navigieren Sie zu den geplanten Aufgaben.
    • Erweitern Sie im linken Bereich die Taskplaner-Bibliothek.
    • Suchen Sie nach dem Ordner, in dem Ihre Aufgabe gespeichert ist (z. B. Taskplaner-Bibliothek oder ein benutzerdefinierter Ordner).
  • Finden Sie Ihre Aufgabe:
    • Suchen Sie nach dem Aufgabennamen ProcoreDeltaShareScheduling.
    • Klicken Sie darauf, um die Details im unteren Bereich anzuzeigen.
  • Überprüfen Sie den Zeitplan:
    • Überprüfen Sie die Registerkarte Trigger, um zu sehen, wann die Aufgabe ausgeführt werden soll.
    • Überprüfen Sie die Registerkarte Verlauf, um die letzten Ausführungen zu bestätigen.
  • So löschen Sie die Aufgabe:
    • Löschen Sie die Aufgabe aus der GUI.

Frage zur sofortigen Ausführung:

  • Option zum Ausführen eines Skripts zum Kopieren von Daten unmittelbar nach der Konfiguration.
  • Nach dem Generieren der config.yaml, Die CLI kann jederzeit unabhängig ausgeführt werden, indem je nach Paket ein Skript zum Kopieren von Daten ausgeführt wird. Siehe Beispiele unten:
    Python-delta_share_to_azure_panda.py
    ODER
    python delta_share_to_sql_spark.py
    ODER
    python delta_share_to_azure_dfs_spark.py

Ausführung und Wartung

Häufige Probleme und Lösungen

  1. Cron Job Einrichtung:
    • Stellen Sie sicher, dass die Systemberechtigungen korrekt konfiguriert sind.
    • Überprüfen Sie die Systemprotokolle, wenn der Auftrag nicht ausgeführt werden kann.
    •  Überprüfen Sie, ob das Skript über Ausführungsberechtigungen delta_share_to_azure_panda.py verfügt.
  2. Konfigurationsdatei:
    • Stellen Sie sicher, dass sich die Datei config.yaml im selben Verzeichnis wie das Skript befindet.
    • Sichern Sie die Datei, bevor Sie Änderungen vornehmen.

Unterstützen

Für weitere Hilfe:

  1. Überprüfen Sie die Skriptprotokolle auf detaillierte Fehlermeldungen.
  2. Überprüfen Sie die Datei config.yaml auf Fehlkonfigurationen.
  3. Wenden Sie sich an Ihren Systemadministrator, wenn Sie Fragen zu Berechtigungen haben.
  4. Wenden Sie sich bei Problemen im Zusammenhang mit dem Delta Share-Zugriff an den Procore Support.
  5. Überprüfen Sie das Protokoll auf fehlgeschlagene Tabellen: failed_tables.log.

Hinweise

  1. Sichern Sie immer Ihre Konfigurationsdateien, bevor Sie Änderungen vornehmen.
  2. Testen Sie neue Konfigurationen in einer Nicht-Produktionsumgebung, um Unterbrechungen zu vermeiden.

Herstellen einer Verbindung mit Fabric Lakehouse mithilfe von Data Factory

Übersicht

Die Integration der Deltafreigabe in Microsoft Fabric Data Factory ermöglicht den nahtlosen Zugriff auf und die Verarbeitung freigegebener Delta-Tabellen für Ihre Analyseworkflows mit Analytics 2.0. Delta Sharing, ein offenes Protokoll für die sichere Datenzusammenarbeit, stellt sicher, dass Unternehmen Daten ohne Duplizierung austauschen können.

Voraussetzungen

  • Analytics 2.0 SKU
  • Anmeldeinformationen für die Delta-Freigabe:
    • Rufen Sie die share.json (oder eine gleichwertige) Delta Sharing-Anmeldedaten Datei von Ihrem Datenanbieter ab.
    • Diese Datei sollte Folgendes enthalten:
      • Endpunkt-URL: Die URL des Delta-Sharing-Servers.
      • Inhaber-Token: Wird für den sicheren Datenzugriff verwendet.
  • Microsoft Fabric-Einrichtung:
    • Ein Microsoft Fabric-Mandantenkonto mit einem aktiven Abonnement.
    • Zugriff auf einen Microsoft Fabric-fähigen Arbeitsbereich.

Schritte

Wechseln zur Data Factory-Umgebung

  1. Navigieren Sie zu Ihrem Microsoft Fabric Workspace.
    clipboard_efd065fed3e214b84c9b311d011d8ae67.png
     
  2. Wählen Sie Neu und dann Dataflow Gen2 aus.
    clipboard_e73cb72aa551cc8730795b5bd53bb8a7a.png

Konfigurieren des Datenflusses

  1. Wechseln Sie zum Datenfluss-Editor.
  2. Klicken Sie auf Daten abrufen und wählen Sie Mehr.
  3. Wählen Sie unter Neue Quelle die Option Deltafreigabe Andere als Datenquelle aus.
    clipboard_efb6b95e01a2211ba291f186035b8b4ab.png
  4. Geben Sie die folgenden Details ein:
    • URL: Aus Ihrer Konfigurationsdatei für die Deltafreigabe.
    • Bearer Token: Befindet sich in Ihrer config.share-Datei.
      clipboard_eb997dd0c67cf6e2bcf47cfc9d7e5d71c.png
  5. Klicken Sie auf Weiter und wählen Sie die gewünschten Tabellen aus.
  6. Klicken Sie auf Erstellen , um die Einrichtung abzuschließen.

Durchführen von Datentransformationen

Nachdem Sie den Datenfluss konfiguriert haben, können Sie nun Transformationen auf die freigegebenen Delta-Daten anwenden. Wählen Sie Ihre Option für die Delta-Freigabe von Daten aus der folgenden Liste aus:

  • Datenziel hinzufügen
  • Seehaus erstellen/öffnen

Datenziel hinzufügen

  1. Wechseln Sie zu Data Factory.
  2. Klicken Sie auf Datenziel hinzufügen.
  3. Wählen Sie Lakehouse als Ziel aus und klicken Sie auf Weiter.
  4. Wählen Sie Ihr Zielziel aus und bestätigen Sie mit einem Klick auf Weiter.

Create-Open Lakehouse

  1. Erstellen/öffnen Sie yourLakehouse und klicken Sie auf Daten abrufen.
  2. Wählen Sie Neuer Dataflow Gen2 aus.
  3. Klicken Sie auf Daten abrufen, dann auf Mehr , und suchen Sie nach Delta Sharing.
  4. Geben Sie das URL-Bearertoken  aus Ihrer config.share-Datei ein, und wählen Sie dann Next aus.
  5. Wählen Sie Ihre Daten/Tabellen zum Herunterladen aus und klicken Sie auf Weiter.
  6. Nach diesen Manipulationen sollten Sie alle ausgewählten Daten in Ihrem Fabric Lakehouse haben.

Validierung und Überwachung

Testen Sie Ihre Datenpipelines und -flüsse, um eine reibungslose Ausführung zu gewährleisten. Verwenden von Überwachungstools in Daten
Factory, um den Fortschritt und die Protokolle für jede Aktivität zu verfolgen.

Herstellen einer Verbindung mit Fabric Lakehouse mithilfe von Fabric-Notizbüchern

Übersicht

Die Verwendung von Data Factory in Microsoft Fabric mit Delta Sharing ermöglicht die nahtlose Integration und Verarbeitung freigegebener Delta-Tabellen als Teil Ihrer Analyseworkflows mit Analytics 2.0. Delta Sharing ist ein offenes Protokoll für den sicheren Datenaustausch, das die Zusammenarbeit zwischen Unternehmen ohne Duplizierung von Daten ermöglicht.

Dieser Leitfaden führt Sie durch die Schritte zum Einrichten und Verwenden von Data Factory in Fabric mit Delta Sharing, wobei Notebooks zum Verarbeiten und Exportieren von Daten in ein Lakehouse verwendet werden.

Voraussetzungen

  • Analytics 2.0 SKU
  • Anmeldeinformationen für die Delta-Freigabe:
    • Zugriff auf Delta Sharing-Anmeldedaten, die von einem Datenanbieter bereitgestellt werden.
    • Eine Freigabeprofildatei (config.share) enthaltend:
      • Endpunkt-URL (Delta-Sharing-Server-URL).
      • Access Token (Bearer-Token für sicheren Datenzugriff).
  • Erstellen Sie Ihre config.yaml-Datei mit bestimmten Anmeldedaten unter Verwendung der folgenden Vorlage:
    • {
      "shareCredentialsVersion": 1,
      "endpoint": "your-delta-sharing-server-url",
      "bearerToken": "your-master-token"
      }
  • Microsoft Fabric-Umgebung:
    • Ein Microsoft Fabric-Mandantenkonto mit einem aktiven Abonnement.
    • Ein Fabric-fähiger Arbeitsbereich.
  • Pakete und Skripte:
    • Laden Sie das fabric-lakehouse-Paket herunter. Das Verzeichnis sollte Folgendes enthalten:
      • ds_to_lakehouse.py: Notebook-Code.
      • readme.md: Anweisungen.
        Hinweis: Sie können das gezippte Paket aus dem Unternehmensebene Analytics-Tool herunterladen (über Analytics > Erste Schritte > Verbindungsoptionen > Azure).

Schritte

Konfiguration einrichten

  1. Erstellen der Datei config.yaml und definieren Sie die Konfiguration in der folgenden Struktur
    source_config:
        config_path: Pfad/zu/Ihrem/delta-sharing-credentials-file.share
    tables: # Optional - Lassen Sie das Feld leer, um alle Tabellen zu verarbeiten
        - table_name1
        - table_name2
    target_config:
        lakehouse_path: path/to/your/fabric/lakehouse/Tables/ # Pfad zum Fabric Lakehouse

Richten Sie Ihr Seehaus ein

  1. Öffnen Sie Ihren Microsoft Fabric-Arbeitsbereich.
  2. Navigieren Sie zu Ihrem Lakehouse und klicken Sie auf Notizbuch öffnen und dann auf Neues Notizbuch.
  3. Wenn Sie den Wert in config.yaml#lakehouse_path nicht kennen, Sie können es vom Bildschirm kopieren.
  4. Klicken Sie auf die Ellipse auf Dateien, und wählen Sie ABFS-Pfad kopieren aus:
    clipboard_e5dd266d8c6a622cceb30dd893a9106d7.png
    clipboard_e08827dbe6aeae6ac8f2bec7f5c758325.png
    clipboard_e390331535300f7f89fd0a91c9a3adebe.png

3. Kopieren Sie den Code der ds_to_lakehouse.py und fügen Sie ihn in das Notebook-Fenster ein (Pyspark Python):

clipboard_e5b5d27813f9bebdfbe7dae73291cb3ae.png

Der nächste Schritt besteht darin, Ihre eigenen config.yaml und config.share in den Ordner Resources des Lakehouse hochzuladen. Sie können Ihr eigenes Verzeichnis erstellen oder ein eingebautes Verzeichnis verwenden (das bereits von Lakehouse für Ressourcen erstellt wurde):


clipboard_eb5765c4bbf3ac93bd7c51ba6373f8049.png
clipboard_e86d913b62d37d237524537676680e4f3.png

Das folgende Beispiel zeigt ein integriertes Standardverzeichnis für eine config.yaml-Datei.
Hinweis: Stellen Sie sicher, dass Sie beide Dateien auf derselben Ebene und für die Eigenschaft config_path hochladen:

clipboard_e8ca378a5a0937b4b675d00adc2ec965f.png

4. Überprüfen Sie den Code des Notizbuchs, Zeilen 170-175.
Das folgende Beispiel zeigt die notwendigen Zeilenänderungen:

config_path = "./env/config.yaml"

An 

config_path = "./builtin/config.yaml"

Da sich die Dateien in einem eingebauten Ordner und nicht in einer benutzerdefinierten Umgebung befinden, sollten Sie Ihre eigene Struktur der Dateien überwachen. Sie können sie in verschiedene Ordner hochladen, aber in solchen Fällen aktualisieren Sie den Code des Notebooks, um die Datei config.yaml richtig zu finden.
 

clipboard_e44e5ad3be4a06929aba88716b0fdaa23.png

5. Klicken Sie auf Zelle ausführen:


clipboard_e381c59ce2e4e9471efc0e9e4cc663b6d.png

Validierung

  • Überprüfen Sie nach Abschluss des Auftrags, ob die Daten erfolgreich in Ihr Lakehouse kopiert wurden.
  • Überprüfen Sie die angegebenen Tabellen, und stellen Sie sicher, dass die Daten mit den freigegebenen Delta-Tabellen übereinstimmen.
  • Warten Sie, bis der Auftrag abgeschlossen ist, es sollten alle Daten kopiert werden.

Herstellen einer Verbindung mit SQL Server mithilfe von Azure Functions

Übersicht

Dieser Leitfaden führt Sie durch das Einrichten und Bereitstellen einer Azure-Funktion für die Integration von Delta Sharing-Daten in Analytics. Die Azure-Funktion ermöglicht effiziente Datenverarbeitungs- und Freigabeworkflows mit Delta Sharing-Profilen.

Voraussetzungen

  • Analytics 2.0 SKU.
  • Profildatei für die Delta-Freigabe:
    • Aktualisieren Sie das Token und den Endpunkt, die Sie von der Procore-Benutzeroberfläche in der Datei template_config.share (im heruntergeladenen Inhalt) erhalten haben, und benennen Sie template_config.share in config.share um.
    • Python-Umgebung:
      • Installieren Sie Python 3.9+ und pip auf Ihrem System.
  •  Azure-Einrichtung:
    • Die Azure CLI ist installiert und angemeldet.
    • Azure Functions Kerntools installiert.

Schritte

Vorbereiten des Pakets

  1. Laden Sie das erforderliche Paket herunter (adls_azure_function oder sql_server_azure_function).
    Hinweis: Sie können das gezippte Paket aus dem Unternehmensebene Analytics-Tool herunterladen (über Analytics > Erste Schritte > Verbindungsoptionen > Azure).
  2. Extrahieren Sie die Paketdateien in ein lokales Verzeichnis.
  3. Platzieren Sie die Delta-Sharing-Datei:
    • Kopieren Sie Ihre *.share Delta Sharing-Profildatei in das extrahierte Verzeichnis.

 Installieren von Abhängigkeiten

  1. Öffnen Sie ein Terminal im Paketverzeichnis.
  2. Führen Sie den folgenden Befehl aus, um die erforderlichen Python-Abhängigkeiten zu installieren:
    • pip install -r requirements.txt

Konfiguration generieren

  1. Generieren Sie die Datei config.yaml , indem Sie Folgendes ausführen:
    • Python-user_exp.py
  2. Das Skript fordert Sie auf, Anmeldedaten einzugeben, z. B.:
    • Tabellen
    • Name der Datenbank
    • Gastgeber
    • Zusätzliche Anmeldedaten.
  3. Die Konfiguration kann wiederverwendet oder manuell oder durch erneutes Ausführen  von python user_exp.pyaktualisiert werden.

 Einrichtung der Azure CLI

  1. Melden Sie sich bei Azure an.
  2. Führen Sie den folgenden Befehl aus, um sich anzumelden:
    az login
  3. Überprüfen des Azure-Kontos:
    • az account show
    • Wenn der Befehl az nicht verfügbar ist, installieren Sie die Azure CLI, indem Sie die Anweisungen befolgen, die Sie hier finden: Microsoft Learn.

Installieren von Azure Functions Kerntools

Gehe zu

Hier finden Sie Anweisungen zum Installieren von Azure Functions Kerntools.

Vorbereiten der Azure-Funktion

  1. Verwenden SieSo erstellen Sie Folgendes:
    • Eine Funktions-App
    • Eine Ressourcengruppe
    • Verbrauchsplan
    • Speicherkonto
  2. Benutzerdefinierten Cron-Zeitplan festlegen (optional).
    • Öffnen Sie function_app.py in einem Editor.
    • Suchen Sie die Zeile: @app.timer_trigger(schedule="0 0 */8 * * *",
  3. Ersetzen Sie den Terminplan durch Ihren benutzerdefinierten Cron-Ausdruck und speichern Sie die Datei.

Einsatz

  1. Öffnen Sie ein Terminal im Paketverzeichnis (adls_azure_function).
  2. Führen Sie den folgenden Bereitstellungsbefehl aus:
    • func azure functionapp publish <FunctionAppName> --build remote --python --clean
  3. Ersetzen Sie <FunctionAppName> durch den Namen Ihrer Azure-Funktions-App in Ihrem Azure-Abonnement.

Validierung

  • Stellen Sie sicher, dass die Bereitstellung erfolgreich ist, indem Sie im Azure-Portal den Status Ihrer Funktions-App überprüfen.
  • Überwachen Sie Protokolle, um zu überprüfen, ob die Funktion wie erwartet ausgeführt wird.

Herstellen einer Verbindung mit SQL Server mithilfe von Data Factory

Übersicht 

Dieses Dokument enthält Schritt-für-Schritt-Anleitungen zum Einrichten einer Datenpipeline in Microsoft Fabric zum Übertragen von Daten von Delta Share in ein SQL-Warehouse. Diese Konfiguration ermöglicht eine nahtlose Datenintegration zwischen Delta Lake-Quellen und SQL-Zielen.

Voraussetzungen

  • Aktives Microsoft Fabric-Konto mit den entsprechenden Berechtigungen.
  • Delta Share-Anmeldedaten.
  • Anmeldedaten für das SQL-Warehouse.
  • Zugriff auf Data Flow Gen2 in Fabric.

Schritte

Zugriff auf Data Flow Gen2

  1. Melden Sie sich bei Ihrem Microsoft Fabric-Konto an.
  2. Navigieren Sie zum Arbeitsbereich.
  3. Wählen Sie aus den verfügbaren Optionen "Datenfluss Gen2"  aus.

Konfigurieren der Datenquelle

  1. Klicken Sie auf "Daten aus einer anderen Quelle",  um die Konfiguration zu starten.
  2. Gehen Sie auf dem Bildschirm Daten abrufen wie folgt vor:
    • Suchen Sie die Suchleiste mit der Bezeichnung "Datenquelle auswählen".
    • Geben Sie "Delta Sharing"  in das Suchfeld ein.
    • Wählen Sie in den Ergebnissen Deltafreigabe aus.

Einrichten der Delta Share-Verbindung

  1. Geben Sie Ihre Delta Share-Anmeldedaten ein, wenn Sie dazu aufgefordert werden.
    • Stellen Sie sicher, dass alle erforderlichen Felder korrekt ausgefüllt sind.
    • Überprüfen Sie, wenn möglich, die Verbindung.
  2. Klicken Sie auf "Weiter",  um fortzufahren.
  3. Überprüfen Sie die Liste der verfügbaren Tabellen:
    • Es werden alle Tabellen angezeigt, auf die Sie Zugriff haben.
    • Wählen Sie die gewünschten Tabellen für die Übertragung aus.

Datenziel konfigurieren

  1. Klicken Sie auf "Datenziel hinzufügen".
  2. Wählen Sie als Ziel "SQL-Warehouse"  aus.
  3. Geben Sie die SQL-Anmeldedaten ein:
    • Server-Details.
    • Informationen zur Authentifizierung.
    • Datenbank-Spezifikationen.
    • Überprüfen Sie die Verbindungseinstellungen.

Finalisieren und Bereitstellen

  1. Überprüfen Sie alle Konfigurationen.
  2. Klicken Sie auf "Veröffentlichen",  um den Datenfluss bereitzustellen.
  3. Warten Sie auf die Bestätigungsmeldung.

Verifizierung

  1. Greifen Sie auf Ihr SQL-Warehouse zu.
  2. Stellen Sie sicher, dass die Daten verfügbar und richtig strukturiert sind.
  3. Führen Sie Testabfragen aus, um die Datenintegrität sicherzustellen.

Problembehebung

Häufige Probleme und Lösungen:

  • Verbindungsfehler: Überprüfen Sie die Anmeldedaten und die Netzwerkverbindung.
  • Fehlende Tabellen: Überprüfen Sie die Delta-Freigabeberechtigungen.
  • Leistungsprobleme: Überprüfen Sie die Einstellungen für die Ressourcenzuweisung und -optimierung.

Herstellen einer Verbindung mit SQL Server mithilfe von Fabric Notebook

Übersicht

Die Verwendung von Data Factory in Microsoft Fabric mit Delta Sharing ermöglicht die nahtlose Integration und Verarbeitung freigegebener Delta-Tabellen als Teil Ihrer Analyseworkflows mit Analytics 2.0. Delta Sharing ist ein offenes Protokoll für den sicheren Datenaustausch, das die Zusammenarbeit zwischen Unternehmen ohne Duplizierung von Daten ermöglicht.

Dieser Leitfaden führt Sie durch die Schritte zum Einrichten und Verwenden von Data Factory in Fabric mit Delta Sharing, wobei Notebooks zum Verarbeiten und Exportieren von Daten in ein Lakehouse verwendet werden.

Voraussetzungen

  • Analytics 2.0 SKU
  • Anmeldeinformationen für die Delta-Freigabe:
    • Zugriff auf Delta Sharing-Anmeldedaten, die von einem Datenanbieter bereitgestellt werden.
    • Eine Freigabeprofildatei (config.share) enthaltend:
      • Endpunkt-URL (Delta-Sharing-Server-URL).
      • Access Token (Bearer-Token für sicheren Datenzugriff).
  • Erstellen Sie Ihre config.yaml-Datei mit bestimmten Anmeldedaten unter Verwendung der folgenden Vorlage:
    • {
      "shareCredentialsVersion": 1,
      "endpoint": "your-delta-sharing-server-url",
      "bearerToken": "your-master-token"
      }
  • Microsoft Fabric-Umgebung:
    • Ein Microsoft Fabric-Mandantenkonto mit einem aktiven Abonnement.
    • Ein Fabric-fähiger Arbeitsbereich.
  • Pakete und Skripte:
    • Laden Sie das fabric-lakehouse-Paket herunter. Das Verzeichnis sollte Folgendes enthalten:
      • ds_to_lakehouse.py: Notebook-Code.
      • readme.md: Anweisungen.
        Hinweis: Sie können das gezippte Paket aus dem Unternehmensebene Analytics-Tool herunterladen (über Analytics > Erste Schritte > Verbindungsoptionen > Azure).

Schritte

Konfiguration einrichten

  1. Erstellen der Datei config.yaml und definieren Sie die Konfiguration in der folgenden Struktur
    source_config:
        config_path: Pfad/zu/Ihrem/delta-sharing-credentials-file.share
    tables: # Optional - Lassen Sie das Feld leer, um alle Tabellen zu verarbeiten
        - table_name1
        - table_name2
    target_config:
        lakehouse_path: path/to/your/fabric/lakehouse/Tables/ # Pfad zum Fabric Lakehouse

Richten Sie Ihr Seehaus ein

  1. Öffnen Sie Ihren Microsoft Fabric-Arbeitsbereich.
  2. Navigieren Sie zu Ihrem Lakehouse und klicken Sie auf Notizbuch öffnen und dann auf Neues Notizbuch.
  3. Wenn Sie den Wert in config.yaml#lakehouse_path nicht kennen, Sie können es vom Bildschirm kopieren.
  4. Klicken Sie auf die Ellipse auf Dateien, und wählen Sie ABFS-Pfad kopieren aus:
    clipboard_e5dd266d8c6a622cceb30dd893a9106d7.png
    clipboard_e08827dbe6aeae6ac8f2bec7f5c758325.png
    clipboard_e390331535300f7f89fd0a91c9a3adebe.png

3. Kopieren Sie den Code der ds_to_lakehouse.py und fügen Sie ihn in das Notebook-Fenster ein (Pyspark Python):

clipboard_e5b5d27813f9bebdfbe7dae73291cb3ae.png

Der nächste Schritt besteht darin, Ihre eigenen config.yaml und config.share in den Ordner Resources des Lakehouse hochzuladen. Sie können Ihr eigenes Verzeichnis erstellen oder ein eingebautes Verzeichnis verwenden (das bereits von Lakehouse für Ressourcen erstellt wurde):


clipboard_eb5765c4bbf3ac93bd7c51ba6373f8049.png
clipboard_e86d913b62d37d237524537676680e4f3.png

Das folgende Beispiel zeigt ein integriertes Standardverzeichnis für eine config.yaml-Datei.
Hinweis: Stellen Sie sicher, dass Sie beide Dateien auf derselben Ebene und für die Eigenschaft config_path hochladen:

clipboard_e8ca378a5a0937b4b675d00adc2ec965f.png

4. Überprüfen Sie den Code des Notizbuchs, Zeilen 170-175.
Das folgende Beispiel zeigt die notwendigen Zeilenänderungen:

config_path = "./env/config.yaml"

An 

config_path = "./builtin/config.yaml"

Da sich die Dateien in einem eingebauten Ordner und nicht in einer benutzerdefinierten Umgebung befinden, sollten Sie Ihre eigene Struktur der Dateien überwachen. Sie können sie in verschiedene Ordner hochladen, aber in solchen Fällen aktualisieren Sie den Code des Notebooks, um die Datei config.yaml richtig zu finden.
 

clipboard_e44e5ad3be4a06929aba88716b0fdaa23.png

5. Klicken Sie auf Zelle ausführen:


clipboard_e381c59ce2e4e9471efc0e9e4cc663b6d.png

Validierung

  • Überprüfen Sie nach Abschluss des Auftrags, ob die Daten erfolgreich in Ihr Lakehouse kopiert wurden.
  • Überprüfen Sie die angegebenen Tabellen, und stellen Sie sicher, dass die Daten mit den freigegebenen Delta-Tabellen übereinstimmen.
  • Warten Sie, bis der Auftrag abgeschlossen ist, es sollten alle Daten kopiert werden.

 

Herstellen einer Verbindung mit Databricks

 Hinweis
Diese Verbindungsmethode wird in der Regel von Datenexperten verwendet.
  1. Melden Sie sich bei Ihrer Databricks-Umgebung an.
  2. Navigieren Sie zum  Abschnitt Katalog .
  3. Wählen Sie im oberen Menü die Option Deltafreigabe aus .
  4. Wählen Sie Für mich freigegeben aus. 
  5. Kopieren Sie die für Sie bereitgestellte Freigabe-ID .
    analytics-delta-sharing1.png
  6. Klicken Sie in Procore auf das Symbol Konto und Profil im oberen rechten Bereich der Navigationsleiste.
    Account Icon.png
  7. Klicken Sie auf Meine Profileinstellungen
  8. Klicken Sie auf die Registerkarte Analytics .
  9. Geben Sie Ihren Databricks-Freigabebezeichner ein.
  10. Klicken Sie auf Verbinden.
    Hinweis: Sobald die Freigabe-ID zum Procore-System hinzugefügt wurde, wird die Procore Databricks-Verbindung auf der Registerkarte "Für mich freigegeben " unter "Anbieter" in Ihrer Databricks-Umgebung angezeigt. Es kann bis zu 24 Stunden dauern, bis die Daten angezeigt werden.
    analytics-delta-sharing2.png
  11. Wenn Ihre Procore Databricks-Verbindung auf der Registerkarte "Für mich freigegeben " sichtbar wird, wählen Sie den Procore-Indentifier aus und klicken Sie auf Katalog erstellen.
  12. Geben Sie Ihren bevorzugten Namen für den freigegebenen Katalog ein und klicken Sie auf Erstellen.
    analytics-delta-sharing3.png
  13. Ihr freigegebener Katalog und Ihre Tabellen werden nun unter dem angegebenen Namen in der Katalog-Explorer.
    analytics-delta-sharing4.png

    Hinweis: Bitte wenden Sie sich an den Procore Support, wenn Sie Fragen haben oder Hilfe benötigen.

Herstellen einer Verbindung mit Snowflake mithilfe von Python

Übersicht

Das Analytics Cloud Connect Access-Tool ist eine Befehlszeilenschnittstelle (CLI), mit der Sie Datenübertragungen von Procore zu Snowflake konfigurieren und verwalten können.

Es besteht aus zwei Hauptkomponenten: 

  • user_exp.py: Dienstprogramm zur Konfigurationseinrichtung
  • ds_to_snowflake.py: Skript zur Datensynchronisierung

Voraussetzungen

  • Python ist auf Ihrem System installiert 
  • Zugang zu Procore Delta Share
  • Anmeldedaten für das Snowflake-Konto 
  • Laden Sie das gezippte Paket aus dem Unternehmensebene Analytics-Tool herunter (über Analytics > Erste Schritte > Verbindungsoptionen > Snowflake).
  • Installieren Sie die erforderlichen Abhängigkeiten mit:
    • pip install -r requirements.txt 
  • Profildatei für die Delta-Freigabe:
    • Aktualisieren Sie das Token und den Endpunkt, die Sie von der Procore-Benutzeroberfläche in der Datei template_config.share (im heruntergeladenen Inhalt) erhalten haben, und benennen Sie template_config.share in config.share um.
    • Python-Umgebung:
      • Installieren Sie Python 3.9+ und pip auf Ihrem System.

Schritte

Erstkonfiguration

Führen Sie das Konfigurationsdienstprogramm mit Python user_exp.py aus.

Daten-Synchronisation

Nach der Konfiguration haben Sie zwei Möglichkeiten, die Datensynchronisierung auszuführen: 

  • Direkte Ausführung:
    • Python-ds_to_snowflake.py
  • Geplante Ausführung
    • Wenn Sie dies während des Setups konfigurieren, wird der Auftrag automatisch gemäß Ihrem Cron-Zeitplan ausgeführt.
    • Um die Planungsprotokolle zu überprüfen, wird die Datei 'procore_scheduling.log' erstellt, sobald die Planung eingerichtet wird.
    • Sie können die Planung auch überprüfen, indem Sie den folgenden Befehl im Terminal ausführen:

Für Linux und MacOS:

  • Bearbeiten/Löschen - Bearbeiten Sie den Terminplanungs-Cron mit:

    '''Bash

    EDITOR=nano crontab -e

    ```

  • Nachdem Sie den obigen Befehl ausgeführt haben, sollten Sie etwas Ähnliches wie das folgende sehen:

    2 * * * *
    /Benutzer/your_user/snowflake/venv/bin/python

     
    /Benutzer/your_user/Schneeflocke/sql_server_python/connection_config.py
    2>&1 | während der gelesenen Zeile; do echo "$(date) - $line"; Fertig>>

     
    /Benutzer/your_user/Schneeflocke/sql_server_python/procore_scheduling.log # Procore-Daten-Import 

     
  • Sie können auch den Zeitplan anpassen oder die gesamte Zeile löschen, um zu verhindern, dass sie nach Zeitplan ausgeführt wird.

Für Windows:

  • Überprüfen Sie, ob die Terminplanaufgabe erstellt wurde: 

    ```
        PowerShell (PowerShell) 

        schtasks /query /tn "ProcoreDeltaShareScheduling" /fo LIST /v 

    ``` 

  • Um die Planungsaufgabe zu bearbeiten/zu löschen , öffnen Sie den Taskplaner.
  • Drücken Sie Win + R, geben Sie taskschd.msc ein. und drücken Sie die Eingabetaste. 
  • Navigieren Sie zu den geplanten Aufgaben. 
  • Erweitern Sie im linken Bereich die Taskplaner-Bibliothek. 
  • Suchen Sie nach dem Ordner, in dem Ihre Aufgabe gespeichert ist:
    Beispiel:  Taskplaner-Bibliothek oder ein benutzerdefinierter Ordner.
  • Finde deine Aufgabe.
  • Suchen Sie nach dem Namen der Aufgabe: ProcoreDeltaShareScheduling
  • Klicken Sie darauf, um die Details im unteren Bereich anzuzeigen. 
  • Überprüfen Sie den Zeitplan: 
    • Überprüfen Sie die Registerkarte Trigger, um zu sehen, wann die Aufgabe ausgeführt werden soll. 
    • Überprüfen Sie die Registerkarte Verlauf, um die letzten Ausführungen zu bestätigen. 
  • So löschen Sie die Aufgabe: 
    • Löschen Sie die Aufgabe aus der GUI.

Konfiguration der Delta-Freigabe

  • Erstellen der config.share-Datei 
  • Bevor Sie das Konfigurationsdienstprogramm ausführen können, müssen Sie eine config.share-Datei mit Ihren Delta Share-Anmeldedaten erstellen. Die Datei sollte im JSON-Format vorliegen: 

    "shareCredentialsVersion": 1, 
    "bearerToken": "xxxxxxxxxxxxxxx", 
    "endpoint": "https://nvirginia.cloud.databricks.c...astores/xxxxxx

     

  • Pflichtfelder: 
    • ShareCredentialsVersion: Versionsnummer (derzeit 1). 
    • BearerToken: Ihr Delta Share-Zugriffstoken.
    • Endpunkt: Die URL Ihres Delta Share-Endpunkts.
    • Diese Details können über die Procore-Web-Benutzeroberfläche abgerufen werden.
  • Schritte zum Erstellen von config.share: 
    • Erstellen Sie eine neue Datei mit dem Namen config.share.
    • Kopieren Sie die obige JSON-Vorlage. 
    • Ersetzen Sie die Platzhalterwerte durch Ihre tatsächlichen Anmeldedaten. 
    • Speichern Sie die Datei an einem sicheren Ort. 
    • Sie müssen den Pfad zu dieser Datei während der Konfiguration angeben. Bei der Konfiguration der Datenquelle werden Sie aufgefordert, Folgendes anzugeben:
      • Liste der Tabellen (durch Kommas getrennt).
      • Lassen Sie das Feld leer, um alle Tabellen zu synchronisieren.
      • Beispiel: Tabelle1, Tabelle2, Tabelle3.
  • Pfad zu Ihrer config.share-Datei .

Snowflake-Konfiguration

Sie müssen die folgenden Snowflake-Details angeben:

  • Authentifizierung (wählen Sie eine aus): 
    • Benutzer-Authentifizierung 
      • Nutzername 
      • Passwort (sicher eingegeben) 
  • Schlüsselpaar-Authentifizierung
    • Nutzername 
    • Dateipfad des privaten Schlüssels
    • Passwort für die Datei mit privatem Schlüssel 
  • Details zur Verbindung: 
    • Konto-ID 
    • Name des Lagers 
    • Name der Datenbank 
    • Name des Schemas 
    • Anzahl gleichzeitiger Threads 

Optionen für die Planung

Das Tool bietet die Möglichkeit, eine automatische Datensynchronisierung zu planen.

  • Cronjob-Konfiguration 
    • Auswählen, ob Sie ein tägliches Projekt einrichten möchten 
    • Wenn ja, geben Sie einen Cron-Zeitplan an 
    • Format: * * * * * (Minute, Stunde, Monat, Monat, Wochentag)
    • Beispiel für täglich um 2 Uhr morgens: 0 2 * * * 
  • Sofortige Ausführung 
    • Option zum sofortigen Ausführen der ds_to_snowflake.py nach der Konfiguration  
  • Datei-Struktur

    Unset 
    ├── requirements.txt                    # Abhängigkeiten 
    ├── user_exp.py                                # Konfigurations-Dienstprogramm
    ├── ds_to_snowflake.py                # Skript zur Datensynchronisierung
    ├── config.yaml                                  # Generierte Konfiguration
    ├── config.share                               # Delta-Share-Konfigurationsdatei
    ├── procore_scheduling.log       # Protokoll der Terminierungsläufe 


    Beispiel für die Verwendung 
    • Schritt 1: Installieren von Abhängigkeiten 
      $ pip install -r requirements.txt
    • Schritt 2: Konfigurationsdienstprogramm ausführen 
      $ python user_exp.py 
    • Procore Analytics Cloud Connect-Zugriff 
      • Diese CLI hilft Ihnen bei der Auswahl Ihres Quell- und Zielspeichers für den Zugriff/das Schreiben von Procore-Daten in Snowflake. 
      • Drücken Sie die Eingabetaste, um fortzufahren.
      • Geben Sie die Liste der Tabellen ein (durch Kommas getrennt), lassen Sie sie für alle Tabellen leer: Projekte, Benutzer, Aufgaben.
      • Geben Sie den Pfad zu config.share ein: /Pfad/zur/config.share.
      • Geben Sie den Benutzernamen ein: snowflake_user.
      • Welchen Authentifizierungstyp möchten Sie verwenden? (Benutzer/key_pair): Eingabetaste.
      • 1 für Benutzer,
      • 2 für Schlüsselpaar:
      • Passwort eingeben: ******** 
      • Konto eingeben: my_account 
      • Lager eingeben: my_warehouse 
      • Geben Sie den Datenbanknamen ein: procore_db
      • Geben Sie den Schemanamen ein: procore_schema 
      • Anzahl der Threads eingeben: 4 
      • Möchten Sie dies als täglichen Job auf cron konfigurieren? (Ja/Nein): Ja 
      • Geben Sie den Zeitplan im Cron-Format ein (z. B. * * * * * ): 0 2 * * * 
      • Möchten Sie den Auftrag jetzt ausführen? (Ja/Nein): Ja 
    • Schritt 3: Manuelle Ausführung (falls erforderlich)
      $ python ds_to_snowflake.py 
  • Wiederverwendung von Konfigurationen
    Das Tool speichert Ihre Konfiguration in der Datei config.yaml und bietet die Möglichkeit, zuvor gespeicherte Einstellungen wiederzuverwenden: 
    • Die Quellkonfiguration kann wiederverwendet werden.
    • Die Zielkonfiguration (Snowflake) kann wiederverwendet werden. 
    • Sie können wählen, ob Sie beide Konfigurationen unabhängig voneinander aktualisieren möchten.

Bewährte Methoden 

  • Authentifizierung
    • Verwenden Sie, wenn möglich, die Authentifizierung von Schlüsselpaaren.
    • Wechseln Sie die Anmeldedaten regelmäßig. 
    • Verwenden Sie die minimal erforderlichen Berechtigungen.
  • Leistung 
    • Passen Sie die Threadanzahl basierend auf Ihren Systemfunktionen an. 
    • Beginnen Sie mit einer kleineren Teilmenge von Tabellen zum Testen.

Fehlerbehebung 

  • Häufige Probleme und Lösungen: 
    • Ungültiger Authentifizierungstyp 
      • Stellen Sie sicher, dass Sie entweder "1" (Benutzer) oder "2" (key_pair) auswählen, wenn Sie dazu aufgefordert werden.
  • Cronjob einrichten  
    • Stellen Sie sicher, dass Sie über die entsprechenden Systemberechtigungen verfügen.
    • Überprüfen Sie die Systemprotokolle, wenn der Auftrag nicht ausgeführt werden kann.
    • Stellen Sie sicher, dass das ds_to_snowflake.py über die richtigen Berechtigungen verfügt. 
    • Überprüfen Sie die Einrichtung des Cron-Jobs, indem Sie die Systemprotokolle überprüfen:
      Siehe Datei 'procore_scheduling.log'.
  • Konfigurationsdatei
    • Befindet sich im selben Verzeichnis wie das Skript
    • Mit dem Namen config.yaml.
    • Sichern Sie, bevor Sie Änderungen vornehmen.
  • Unterstützen
    • Überprüfen Sie die Protokollausgabe des Skripts. 
    • Überprüfen Sie die Datei config.yaml
    • Wenden Sie sich an Ihren Systemadministrator, wenn Sie Fragen zu Berechtigungen haben.
    • Wenden Sie sich bei Problemen mit dem Delta Share-Zugriff an den Procore Support.

Anmerkung: Denken Sie daran, Ihre Konfiguration immer zu sichern, bevor Sie Änderungen vornehmen, und neue Konfigurationen zuerst in einer Nicht-Produktionsumgebung zu testen.
 

Herstellen einer Verbindung mit Amazon S3 mithilfe von Python

Übersicht

Das Analytics Cloud Connect Access-Tool ist eine Befehlszeilenschnittstelle (CLI), mit der Sie Datenübertragungen von Procore zu Amazon S3 mit Analytics 2.0 konfigurieren und verwalten können. 

Es besteht aus zwei Hauptkomponenten: 

  • user_exp.py: Dienstprogramm zur Konfigurationseinrichtung
  • delta_share_to_s3.py: Skript zur Datensynchronisierung

Voraussetzungen

  • Analytics 2.0 SKU
  • Python ist auf Ihrem System installiert
  • Zugang zu Procore Delta Share
  • S3-Zugriffstasten
  • Laden Sie das gezippte Paket aus dem Unternehmensebene Analytics-Tool herunter (über Analytics > Getting Started > Connection Options > AWS).
  • Installation der erforderlichen Abhängigkeiten mit:
    • pip install -r requirements.txt 

Schritte

Erstkonfiguration

Führen Sie das Konfigurationsdienstprogramm mit python user_exp.py aus.

Dies wird Ihnen bei der Einrichtung helfen:

  • Konfiguration der Delta-Freigabe
  • S3-Zielkonfiguration
  • Einstellungen für die Terminplanung 

Konfiguration der Delta-Freigabe

  • Erstellen der config.share-Datei 
  • Bevor Sie das Konfigurationsdienstprogramm ausführen können, müssen Sie eine config.share-Datei mit Ihren Delta Share-Anmeldedaten erstellen. Die Datei sollte im JSON-Format vorliegen: 

    "shareCredentialsVersion": 1, 
    "bearerToken": "xxxxxxxxxxxxxxx", 
    "Endpunkt": "xxxxxx"

  • Pflichtfelder: 
    • ShareCredentialsVersion: Versionsnummer (derzeit 1). 
    • BearerToken: Ihr Delta Share-Zugriffstoken.
    • Endpunkt: Die URL Ihres Delta Share-Endpunkts.
    • Diese Details können über die Procore-Web-Benutzeroberfläche abgerufen werden.
  • Schritte zum Erstellen von config.share: 
    • Erstellen Sie eine neue Datei mit dem Namen config.share.
    • Kopieren Sie die obige JSON-Vorlage. 
    • Ersetzen Sie die Platzhalterwerte durch Ihre tatsächlichen Anmeldedaten. 
    • Speichern Sie die Datei an einem sicheren Ort. 
    • Sie müssen den Pfad zu dieser Datei während der Konfiguration angeben. Bei der Konfiguration der Datenquelle werden Sie aufgefordert, Folgendes anzugeben:
      • Liste der Tabellen (durch Kommas getrennt).
      • Lassen Sie das Feld leer, um alle Tabellen zu synchronisieren.
      • Beispiel: Tabelle1, Tabelle2, Tabelle3.
  • Pfad zu Ihrer config.share-Datei .

S3-Konfiguration

Sie müssen die folgenden S3-Details angeben:

  • Authentifizierung:
    • Zugriffsschlüssel
    • Geheimer Schlüssel
    • Bucket-Name ohne s3://
    • Schlüssel - Verzeichnis 

Optionen für die Planung

Das Tool bietet die Möglichkeit, eine automatische Datensynchronisierung zu planen.

  • Cronjob-Konfiguration 
    • Wählen Sie aus, ob Sie ein tägliches Projekt einrichten möchten. 
    • Wenn ja, geben Sie einen Cron-Zeitplan an. 
    • Format: * * * * * (Minute, Stunde, Monat, Monat, Wochentag).
    • Beispiel für täglich um 2 Uhr morgens: 0 2 * * * 
    • Um die Terminierungsprotokolle zu überprüfen, wird die Datei 'procore_scheduling.log' erstellt, sobald die Terminierung eingerichtet ist.

Sie können die Zeitplanung auch überprüfen, indem Sie den Befehl in terminal ausführen

Für Linux und MacOs:    

Bearbeiten/Löschen - Bearbeiten Sie den Terminplanungs-Cron mit:

'''Bash
EDITOR=nano crontab -e
```

  • Nachdem Sie den obigen Befehl ausgeführt haben, sollten Sie etwas Ähnliches wie das folgende sehen:
  • 2 * * * * /Benutzer/your_user/snowflake/venv/bin/python /Benutzer/your_user/snowflake/sql_server_python/connection_config.py 2>&1 | während der gelesenen Zeile; do echo "$(date) - $line"; Erledigt >> /Benutzer/your_user/snowflake/sql_server_python/procore_scheduling.log # procore-data-import
  • Sie können auch den Zeitplan anpassen oder die gesamte Zeile löschen, um zu verhindern, dass sie nach Zeitplan ausgeführt wird.

Für Windows:

  • Überprüfen Sie, ob die Terminplanaufgabe erstellt wurde:
    '''Powershell
    schtasks /query /tn "ProcoreDeltaShareScheduling" /fo LIST /v

    ```
  • So bearbeiten/löschen Sie die Planungsaufgabe:
    Öffnen Sie den Taskplaner:
    • Drücken Sie Win + R, geben Sie taskschd.msc ein. und drücken Sie die Eingabetaste.
    • Navigieren Sie zu den geplanten Aufgaben.
    • Erweitern Sie im linken Bereich die Taskplaner-Bibliothek.
    • Suchen Sie nach dem Ordner, in dem Ihre Aufgabe gespeichert ist (z. B. Taskplaner-Bibliothek oder ein benutzerdefinierter Ordner).
  • Finden Sie Ihre Aufgabe:
    • Suchen Sie nach dem Aufgabennamen ProcoreDeltaShareScheduling.
    • Klicken Sie darauf, um die Details im unteren Bereich anzuzeigen.
  • Überprüfen Sie den Zeitplan:
    • Überprüfen Sie die Registerkarte Trigger, um zu sehen, wann die Aufgabe ausgeführt werden soll.
    • Überprüfen Sie die Registerkarte Verlauf, um die letzten Ausführungen zu bestätigen.
  • So löschen Sie die Aufgabe:
    • Löschen Sie die Aufgabe aus der GUI.
  • Sofortige Ausführung 
    • Option zum Ausführen der delta_share_to_s3_.pDatei-Struktur
  • Unset 

    ├── requirements.txt                    # Abhängigkeiten 
    ├── user_exp.py                                # Konfigurations-Dienstprogramm
    ├── delta_share_to_s3.py            # Skript zur Datensynchronisierung
    ├── config.yaml                                  # Generierte Konfiguration
    ├── config.share                               # Delta-Share-Konfigurationsdatei
    ├── procore_scheduling.log       # Protokoll der Terminierungsläufe 


    Beispiel für die Verwendung 
    • Schritt 1: Installieren von Abhängigkeiten 
      $ pip install -r requirements.txt
    • Schritt 2: Konfigurationsdienstprogramm ausführen 
      $ python user_exp.py 
    • Procore Analytics Cloud Connect-Zugriff 
      • Diese CLI hilft Ihnen bei der Auswahl Ihres Quell- und Zielspeichers für den Zugriff/das Schreiben von Procore-Daten in S3. 
      • Drücken Sie die Eingabetaste, um fortzufahren.
      • Geben Sie die Liste der Tabellen ein (durch Kommas getrennt), lassen Sie sie für alle Tabellen leer: Projekte, Benutzer, Aufgaben.
      • Geben Sie den Pfad zu config.share ein: /Pfad/zur/config.share.
      • Geben Sie den Zugriffsschlüssel ein: s3-Schlüssel.
      • Geben Sie secret: secret ein.
      • Geben Sie bucket ein: Bucket-Name.
      • Möchten Sie dies als täglichen Job auf cron konfigurieren? (Ja/Nein): Ja 
      • Geben Sie den Zeitplan im Cron-Format ein (z. B. * * * * * ): 0 2 * * * 
      • Möchten Sie den Auftrag jetzt ausführen? (Ja/Nein): Ja 
    • Schritt 3: Manuelle Ausführung (falls erforderlich)
      $ python delta_share_to_s3.py 
  • Wiederverwendung von Konfigurationen
    Das Tool speichert Ihre Konfiguration in der Datei config.yaml und bietet die Möglichkeit, zuvor gespeicherte Einstellungen wiederzuverwenden: 
    • Die Quellkonfiguration kann wiederverwendet werden.
    • Die Zielkonfiguration (S3) kann wiederverwendet werden. 
    • Sie können wählen, ob Sie beide Konfigurationen unabhängig voneinander aktualisieren möchten.

Fehlerbehebung 

Häufige Probleme und Lösungen

  • Cronjob einrichten  
    • Stellen Sie sicher, dass die Systemberechtigungen korrekt konfiguriert sind.
    • Überprüfen Sie die Systemprotokolle, wenn der Auftrag nicht ausgeführt werden kann.
    • Überprüfen des Skripts (delta_share_to_s3.py) Ausführen von Berechtigungen.
  • Konfigurationsdatei
    • Vergewissern Sie sich, dass sich die Datei config.yaml im selben Verzeichnis wie das Skript befindet.
    • Sichern Sie, bevor Sie Änderungen vornehmen.
  • Unterstützen
    • Überprüfen Sie die Skriptprotokolle auf detaillierte Fehlermeldungen.
    • Überprüfen Sie die Datei config.yaml auf Fehlkonfigurationen.
    • Wenden Sie sich an Ihren Systemadministrator, wenn Sie Fragen zu Berechtigungen haben.
    • Wenden Sie sich bei Problemen mit dem Delta Share-Zugriff an den Procore Support.
    • Überprüfen Sie die Einrichtung von Cron-Jobs, indem Sie die Systemprotokolle überprüfen: Siehe 'procore_scheduling_log' -Datei.

Hinweise:

  1. Denken Sie daran, Ihre Konfiguration immer zu sichern, bevor Sie Änderungen vornehmen.
  2. Testen Sie neue Konfigurationen zunächst in einer Nicht-Produktionsumgebung.

Bauen Sie Ihre eigene Verbindung auf

Übersicht

Delta Sharing ist ein offenes Protokoll für den sicheren Datenaustausch in Echtzeit, das es Unternehmen ermöglicht, Daten über verschiedene Computerplattformen hinweg gemeinsam zu nutzen. Dieser Leitfaden führt Sie durch den Prozess der Verbindung mit und des Zugriffs auf Daten über Delta Sharing.

Optionen für den Delta Sharing Connector

  • Python-Konnektor
  • Apache Spark-Konnektor
  • Einrichten einer interaktiven Shell
  • Einrichten eines eigenständigen Projekts

Python-Konnektor

Der Delta Sharing Python Connector ist eine Python-Bibliothek, die das Delta Sharing Protocol implementiert, um Tabellen von einem Delta Sharing-Server zu lesen. Sie können freigegebene Tabellen als Pandas-DataFrame oder als Apache Spark-DataFrame laden, wenn sie in PySpark mit installiertem Apache Spark Connector ausgeführt werden.

Systemanforderungen

  • Python 3.8+ für Delta-Sharing Version 1.1+
  • Python 3.6+ für ältere Versionen
  • Wenn Sie Linux verwenden,  Glibc Version >= 2.31
  • Für die automatische Installation des delta-kernel-rust-sharing-wrapper-Pakets lesen Sie bitte den nächsten Abschnitt für weitere Details.

Installationsprozess

Unset
pip3 Delta-Sharing installieren

  • Wenn Sie Databricks Runtime verwenden, können Sie [1] die Dokumentation zu Databricks-Bibliotheken befolgen, um die Bibliothek auf Ihren Clustern zu installieren.
  • Wenn dies aufgrund eines Problems beim Herunterladen von delta-kernel-rust-sharing-wrapper nicht funktioniert, versuchen Sie Folgendes:
    •  Überprüfen Sie python3 Version >= 3.8
    •  Aktualisieren Sie Ihr pip3 auf die neueste Version

Zugriff auf freigegebene Daten

Der Connector greift auf freigegebene Tabellen basierend auf Profildateien zu, bei denen es sich um JSON-Dateien handelt, die die Anmeldedaten eines Benutzers für den Zugriff auf einen Delta Sharing-Server enthalten. Wir haben mehrere Möglichkeiten, um loszulegen:

Vorbereitungen

  • Laden Sie eine Profildatei von Ihrem Datenanbieter herunter.

Zugriff auf Optionen für gemeinsam genutzte Daten

Nachdem Sie die Profildatei gespeichert haben, können Sie sie im Connector verwenden, um auf freigegebene Tabellen zuzugreifen.

delta_sharing importieren

  • Zeigen Sie auf die Profildatei. Dabei kann es sich um eine Datei im lokalen Dateisystem oder um eine Datei auf einem Remotespeicher handeln.
    • profile_file = "<profile-file-path>"
  • Erstellen Sie einen SharingClient.
    • Client = delta_sharing. SharingClient(profile_file)
  • Listet alle freigegebenen Tabellen auf.
    • client.list_all_tables()
  • Erstellen Sie eine URL für den Zugriff auf eine freigegebene Tabelle.
  • Ein Tabellenpfad ist der Profildateipfad, gefolgt von "#" und dem vollqualifizierten Namen einer Tabelle.
  • <share-name><schema-name><table-name>('..').
    • table_url = profile_file + "#..<share-name> <schema-name><table-name>"
  • Rufen Sie 10 Zeilen aus einer Tabelle ab, und konvertieren Sie sie in einen Pandas DataFrame. Dies kann verwendet werden, um Beispieldaten aus einer Tabelle zu lesen, die nicht in den Speicher passen.
    • delta_sharing.load_as_pandas(table_url, limit=10)
  •  Laden Sie eine Tabelle als Pandas-DataFrame. Dies kann verwendet werden, um Tabellen zu verarbeiten, die in den Speicher passen.
    • delta_sharing.load_as_pandas(table_url)
  •  Laden einer Tabelle als Pandas-DataFrame explizit im Delta-Format
    • delta_sharing.load_as_pandas(table_url, use_delta_format = Wahr)
  • Wenn der Code mit PySpark ausgeführt wird, können Sie "load_as_spark" verwenden, um die Tabelle als Spark-DataFrame zu laden.
    • delta_sharing.load_as_spark(table_url)
  • Wenn die Tabelle die Verlaufsfreigabe unterstützt (tableConfig.cdfEnabled=true auf dem OSS-Deltafreigabeserver), kann der Konnektor Tabellenänderungen abfragen.
  • Laden Sie Tabellenänderungen von Version 0 auf Version 5 als Pandas-DataFrame.
    • delta_sharing.load_table_changes_as_pandas(table_url, starting_version=0, ending_version=5)
  • Wenn der Code mit PySpark ausgeführt wird, können Sie Tabellenänderungen als Spark DataFrame laden.
    • delta_sharing.load_table_changes_as_spark(table_url, starting_version=0, ending_version=5)

Apache Spark-Konnektor

Der Apache Spark Connector implementiert das Delta Sharing Protocol , um freigegebene Tabellen von einem Delta Sharing Server zu lesen. Es kann in SQL, Python, Java, Scala und R verwendet werden.

Systemanforderungen

Zugriff auf freigegebene Daten

Der Konnektor lädt BenutzerAnmeldedaten aus Profildateien.

Konfigurieren von Apache Spark

Sie können Apache Spark so einrichten, dass der Delta Sharing-Connector in den folgenden beiden Fällen geladen wird
Wege:

  • Interaktiv ausführen: Starten Sie die Spark-Shell (Scala oder Python) mit dem Delta Sharing-Connector, und führen Sie die Codeausschnitte interaktiv in der Shell aus.
  • Als Projekt ausführen: Richten Sie ein Maven- oder SBT-Projekt (Scala oder Java) mit dem Delta Sharing-Connector ein, kopieren Sie die Codeausschnitte in eine Quelldatei, und führen Sie das Projekt aus.

Wenn Sie Databricks Runtime verwenden, können Sie diesen Abschnitt überspringen und der Dokumentation zu den Databricks-Bibliotheken folgen, um den Connector in Ihren Clustern zu installieren.

Einrichten einer interaktiven Shell

Um den Delta Sharing-Connector interaktiv in der Scala/Python-Shell von Spark zu verwenden, können Sie die Shells wie folgt starten.

PySpark-Hülle

Unset
pyspark --packages io.delta:delta-sharing-spark_2.12:3.1.0

 

Scala-Shell

Unset
bin/spark-shell --pakete
io.delta:delta-sharing-spark_2.12:3.1.0

Einrichten eines eigenständigen Projekts

Wenn Sie ein Java/Scala-Projekt mit dem Delta Sharing Connector aus dem Maven Central Repository erstellen möchten, können Sie die folgenden Maven-Koordinaten verwenden.

Experte

Sie schließen den Delta Sharing Connector in Ihr Maven-Projekt ein, indem Sie ihn als Abhängigkeit in Ihrer POM-Datei hinzufügen. Der Delta Sharing Connector wurde mit Scala 2.12 kompiliert.

<dependency><Abhängigkeit>


<groupId>io.delta</groupId>


<artifactId>delta-sharing-spark_2.12</artifactId>


<version>3.1.0</version>


</dependency></Abhängigkeit>

Herstellen einer Verbindung mit BigQuery

Ziel

Das Analytics Cloud Connect Access-Tool ist ein Notebook , mit dem Sie Datenübertragungen von Procore zu BigQuery mit Analytics 2.0 konfigurieren und verwalten können. 

Voraussetzungen

  • Analytics 2.0 SKU
  • Zugriff auf die Google Cloud Platform (GCP)
  • Erforderliche Berechtigungen für Delta Share und BigQuery
  • Laden Sie das ZIP-Paket aus dem Unternehmensebene Analytics-Tool herunter (über Analytics > Erste Schritte > Verbindungsoptionen > BigQuery).

Schritte

  1. Konfiguration einrichten
  2. BigQuery-Anwendung ausführen

Konfiguration einrichten 

Konfiguration der Delta-Freigabe 

  1. Erstellen Sie eine Datei mit dem Namen config.share mit Ihren Delta Share-Anmeldedaten im JSON-Format.
  2. Abrufen von Pflichtfeldern.
    Hinweis: Diese Details können über die Analytics-Webanwendung abgerufen werden.
    • bearerToken: Ihr Delta Share-Zugriffstoken.
    • Endpunkt: Ihre Delta Share-Endpunkt-URL.
    • shareCredentialsVersion: Versionsnummer (derzeit 1).
Beispiel für eine config.share-Datei

{
"shareCredentialsVersion": 1,
"bearerToken": "",
"Endpunkt": ""
}

BIGQUERY-KONFIGURATION 

  1. Laden Sie die bigquery.zip Datei aus der Analytics-Webanwendung herunter. 
    Hinweis: Sie können das gezippte Paket aus dem Unternehmensebene Analytics-Tool herunterladen (über Analytics > Erste Schritte > Verbindungsoptionen > BigQuery).
  2. Extrahieren Sie das Paket in ein Verzeichnis Ihrer Wahl.
  3. Öffnen Sie die Datei config.yaml, und ändern Sie die folgenden Parameter:
    • source_config.config_path: Pfad zur Delta Share-Konfigurationsdatei.
    • source_config.Tabellen: Optionale Liste spezifischer Tabellen, die verarbeitet werden sollen. Lassen Sie es leer, um alle Tabellen zu verarbeiten.
    • target_config.project_id: GCP-Projekt-ID für BigQuery.
    • target_config.dataset: Name des BigQuery-Datasets.
    • target_config.threads: Anzahl der gleichzeitigen Tabellenprozesse.
Beispiel für eine config.yaml-Datei

source_config:
config_path: "<path_to_delta_share_config>"
tables: # Optional - Liste der zu verarbeitenden Tabellen
- "Tabelle1"
- "Tabelle2"

target_config:
project_id: "<your-gcp-project-id>"
Datensatz: "<bigquery-dataset-name>"
target_type: bigquery

Konfigurationsdatei hochladen
  1. Laden Sie die Datei config.yaml und die Datei config.share in den gs-Bucket hoch.
    1. Google Cloud-Speicher (GCS)

BigQuery-Anwendung ausführen

  1. Erstellen Sie ein Python-Notebook, und installieren Sie die folgenden Pakete:
    • %pip Delta-Sharing installieren
    • pip install pandas-gbq -U
  2. Kopieren Sie den Code von delta_share_to_bq.py, fügen Sie ihn in Ihr Notebook ein, aktualisieren Sie den Konfigurationspfad (config.yaml), und führen Sie es aus.

Überwachung und Protokollierung

Die Anwendung bietet eine detaillierte Protokollierung mit:

  • Bearbeitungsstatus für jede Tabelle.
  • Fehlermeldungen und Ausnahmen.
  • Gleichzeitige Verarbeitung von Informationen.

Best Practices

  • Performance-Optimierung
    • Passen Sie die Anzahl der Threads basierend auf den Systemressourcen an.
    • Überwachen Sie die Speicherauslastung mit großen Tabellen.
    • Berücksichtigen Sie Tabellengrößen, wenn Sie gleichzeitige Prozesse festlegen.
  • Fehlermanagement
    • Überwachen Sie Anwendungsprotokolle.
    • Richten Sie eine entsprechende Warnung ein.
    • Pflegen Sie Backup-Konfigurationen.

Problembehebung

Häufige Probleme und Lösungen:

  • Verbindungsfehler
    • Überprüfen Sie die Netzwerkverbindung.
    • Überprüfen Sie die Gültigkeit der Anmeldeinformationen.
    • Bestätigen Sie die Berechtigungen für das Servicekonto.
  • Verarbeitungsfehler
    • Überprüfen Sie das Vorhandensein der Tabelle.
    • Überprüfen Sie die Zugriffsberechtigungen für die Tabelle.
    • Überprüfen Sie die Konfigurationseinstellungen.
  • Leistungsprobleme
    • Reduzieren Sie die Anzahl gleichzeitiger Threads.
    • Überwachen Sie die Systemressourcen.

Unterstützen

Für weitere Hilfe:

  • Überprüfen Sie die Anwendungsprotokolle auf Fehlerdetails.
  • Überprüfen Sie die Konfigurationseinstellungen.
  • Stellen Sie sicher, dass alle Voraussetzungen erfüllt sind.
  • Wenden Sie sich an Ihren Systemadministrator, wenn Sie Fragen zu Berechtigungen haben.

Verbinden mit Microsoft Excel mit Exponam

Übersicht

Dieser Leitfaden enthält Schritt-für-Schritt-Anleitungen zum Importieren von Analytics-Daten aus Delta Share direkt in Microsoft Excel mithilfe des Add-Ins Exponam.Connect.

Mit dieser Methode können Sie:

  • Greifen Sie direkt in Excel auf Ihre Procore-Daten zu, ohne CSVs manuell herunterladen zu müssen.

  • Filtern und wählen Sie vor dem Import bestimmte Spalten aus, um sicherzustellen, dass Sie nur die Daten laden, die Sie benötigen.

  • Arbeiten Sie mit großen Datasets, deren Verarbeitung andernfalls möglicherweise zu langsam wäre.

Voraussetzungen

  • Delta Share-Anmeldeinformationen. Zugriff auf die Datei config.share, die die Delta Sharing-Anmeldedatenenthält.

  • Lizenzierung:

    • Exponam.Connect Free: Beschränkt auf den Import von 100 Datenzeilen.

    • Exponam.Connect Pro: Erforderlich für den Import größerer Datensätze (bis zu 1 Million+ Zeilen).

Exponam Add-in installieren

  1. Laden Sie die Exponam.Connect herunter Installationsprogramm für Ihr Betriebssystem (Windows oder Mac).

  2. Führen Sie die Installationsdatei aus und folgen Sie den Anweisungen auf dem Bildschirm.

  3. Sobald die Installation abgeschlossen ist, starten Sie Microsoft Excel und öffnen Sie eine neue Arbeitsmappe.

Initialisieren der Delta-Freigabe-Verbindung

  1. Navigieren Sie in Microsoft Excel zur Registerkarte Exponam Pro .
    Analytics - Verbinden mit Microsoft Excel mit Exponam - Registerkarte Exponam Pro

  2. Klicken Sie auf Daten importieren.

  3. Klicken Sie auf das Symbol Delta Share .
    Analytics - Verbinden mit Microsoft Excel über Exponam - Schaltfläche "Daten importieren" und Delta Share-Symbol

  4. Suchen Sie die Datei config.share und wählen Sie sie aus.

  5. Klicken Sie auf Öffnen.

Auswählen und Filtern von Daten

Die Exponam-Schnittstelle zeigt nun eine Liste aller verfügbaren Datentabellen an.

  1. Klicken Sie auf den Namen der Tabelle, auf die Sie zugreifen möchten.

  2. Verwenden Sie die Exponam-Schnittstelle, um Ihre Daten vor dem Import in Excel zu verfeinern. Sie können beispielsweise Filter anwenden, bestimmte Spalten auswählen und vieles mehr.
    Analytics - Verbinden mit Microsoft Excel mit Exponam - Auswählen und Filtern von Daten für den Import

In Excel importieren

  1. Überprüfen Sie Ihre Konfiguration und Zeilenanzahl.
    Hinweis: Stellen Sie sicher, dass die Zeilenanzahl innerhalb Ihres Lizenzlimits liegt.

  2. Klicken Sie auf In Excel importieren.
    Die Daten werden in Ihr aktives Excel-Arbeitsblatt eingefügt.

Verifizierung

  • Stellen Sie sicher, dass die Spalten und Zeilen in Excel mit dem übereinstimmen, was Sie im Exponam-Fenster ausgewählt haben.

  • Überprüfen Sie, ob die Datentypen (Datumsangaben, Währungen usw.) richtig formatiert sind.

Problembehebung

  • Es fehlt die Registerkarte "Exponam Pro". Stellen Sie sicher, dass die Installation erfolgreich war, und überprüfen Sie die Excel-Einstellungen für "Add-ins", um zu bestätigen, dass sie aktiviert ist.

  • Verbindungsfehler. Stellen Sie sicher, dass Ihre config.share-Datei noch gültig ist und dass Sie über eine aktive Internetverbindung verfügen.

  • Zeilenlimit erreicht. Wenn nur 100 Zeilen angezeigt werden, überprüfen Sie Ihren Lizenzstatus in den Exponam-Einstellungen.