Business Intelligence

Fach Fach

Klasse 10

Autor Wimmer96

Veröffentlicht am 06.11.2018

Schlagwörter

Business Intelligence I

Zusammenfassung

Das Thema des Business intelligence (BI) erfährt vor allem in der derzeitigen Zeit einen regelrechten Hype unter den Unternehmen. Diese Referate sollen einen allgemeinen Überblick über diese Themen geben.

Business Intelligence

Introduction to BI
Dimensionen von Big Data:
Dimension: Volume (Daten als Größe)
Unternehmen sind ertränkt von den immer weiter wachsenden Daten. Terabyte bis zu Pentabyte an Daten
Dimension: Velocity (Daten in Bewegung)
Manchmal sind 2 Stunden zu lange: Für zeitintensive Prozesse, z.B. Aufdecken von Betrug, muss Big Data als Strom in das Unternehmen genutzt werden, um den Wert zu maximieren.
Dimension: Variety (Daten in vielen Formen, strukturiert, unstrukturiert, Text, Multimedia) Big data ist irgendein Typ von Daten
Dimension: Veracity (Daten Unsicherheit)
Verwalten der Zuverlässigkeit und Vorhersagbarkeit von grundsätzlich unpräzisen Datentypen

Changing Business Environment and Computerized Decision Support
Unternehmen nehmen immer mehr Computerized Support für deren Operations in Anspruch => BI
Unternehmen nutzen BI um den Herausforderungen der Geschäftsumwelt und den gebotenen Möglichkeiten (z.B. Globalisierung, Kundennachfrage, Regulierung…) fundierte Entscheidungen, Vorhersagen und Analysen treffen zu können. Dadurch werden z.B. Strategien, höhere Produktivität oder neue Geschäftsmodelle gefunden.
Hauptziel von Computerized Decision Support (CDS) ist es, das Schließen der Lücke zwischen aktueller und erhoffter Performance einer Organisation, ausgedrückt durch die Mission, Ziele und Strategie, zu erleichtern.

A Framework for BI
Definition von BI:
• Ist ein Überbegriff der Architekturen, Werkzeuge, Datenbanken, Analyse-Tools und Methodologien miteinander verbindet.
• Für verschiedene Menschen verschiedene Bedeutungen hat.
• Technologien wie Information gesammelt, analysiert und visualisiert wird
• BI’s Hauptziel ist es leichten Zugang zu (Daten und Modellen) zu schaffen, um Manager mit der Fähigkeit Analysen durchführen zu können anzubieten.

• BI hilft, Daten in Info (Wissen), zu Entscheidungen und schließlich zur Handlungen zu
transformieren.
Architektur (4 Hauptkomponenten)

  1. Ein Data Warehouse mit Source Data
    a. Eckstein eines jeden mittel bis großen BI Systems
    i. Ursprünglich waren nur historische Daten beinhaltet die organisiert und zusammengefasst wurden, si dass sie leicht eingesehen und manipuliert werden konnten.
    ii. Heute beinhalten sie auch aktuelle Daten, um eine Echtzeit Entscheidungshilfe bieten zu können.
  2. Business Analytics, eine Sammlung von Werkzeugen um die Daten zu manipulieren, sie hervorzuheben und zu analysieren bzw. die Daten in Wissen zu transformieren (z.B. Umfragen, data/text mining Werkzeuge…)
  3. Business Performance Management (BPM) zum überwachen und analysieren der Performance. Oft auch Corporate Performance Management (CPM) genannt. Ist ein entstehendes Portfolio an Anwendungen im BI System das Unternehmenstools bietet um besser die Prozesse zu managen.
  4. Ein User Interface (z.B. Dashboard) bieten eine umfassende grafische Sicht von Unternehmenskennzahlen, Trends und von Besonderheiten.

Styles von BI

  1. Report Sendung und Alarmierung
  2. Unternehmensreporting (Dashboards und Scorecards)
  3. Cube Analysis (auch als slice-and-dice analysis bekannt)
  4. Ad-hoc Abfragen
  5. Statistiken und Data Mining

Fähigkeit genaue Info sobald benötigt anzubieten, beinhaltet eine Echtzeit Sicht der Unternehmens Performance und ihren Teilen.

Transaction processing versus Analytic Processing
Transaktionsabwickelnde Systeme sind ständig daran beteiligt Updates (z.B. hinzufügen, löschen…) von operativen Datenbanken zu bearbeiten.
• Bankautomaten (Überweisungen, Auszahlungen…)
• Onlinetransaction processing (OLTP) bearbeiten die Geschäftsroutinen.
• ERP, SCM oder CRM Systeme generieren und speichern Daten in OLTP Systemen
Hauptziel ist eine hohe Effizienz
Online analytic processing (OLAP) Systeme sind beteiligt, Infos aus Daten die von OLTP Systemen gespeichert wurden zu extrahieren.
• Verkaufsreporting nach Produkt, Region, Verkäufer…
• Oft auf Data Warehouses gebaut, wo die Daten nicht Transaktional sind.
Hauptziel ist Effektivität, erst dann Effizienz – Bieten korrekte Infos in einer zeitlichen Methode

Data Warehousing
Definitions and Concepts
Definition:
Ein physikalisches Archiv in dem relationale Daten speziell organisiert werden, um
Unternehmensweite, gereinigte Daten in einem standardisierten Format anzubieten.

Charakteristika:

• Subjektorientiert (Gespeicherte Daten zielen auf bestimmtes Subjekt ab, z.B. Verkäufe)

• Integriert (Homonyme, Synonyme, Dirty Data, Flat Files vs. RDB)

o Gründe für Dirty Data z.B. (Dummy Values, Fehlen von Daten, kryptische Daten, Mehrzweck Felder, Widersprechende Daten, Verletzung von Business Regeln, Wiederverwendete Hauptschlüssel, mehrmalige Identifizierungsmerkmale, Daten- Integrationsprobleme)
• Zeitlich veränderlich (Zeitreihen)
• Nicht volatil Zusätzlich:
• Zusammengefasst
• Nicht normalisiert
• Metadada (Daten über Daten)
o Metadaten werden seit dem Aufkommen von Data Warehouses als Entschidungshilfe, genau wie die Unternehmensdaten die sie beschreiben, als Ressource gesehen.

o Zerstreuungen -> hochrangige Daten die kurzgefasste Beschreibungen von untergeordneteren Daten bieten.
o Essenzielles Werkzeug bei der Transformation von Rohdaten in Wissen
o Aufgaben: Welche Tabellen, Attribute und Schlüssel hat ein DW? Wo kommen die Daten her? Was für Transformationen wurden vorgenommen? Wie haben sich die Metadaten über die Zeit verändert? Wie oft werden Daten neugeladen?
• Web basiert, relational/multi-dimensional
• Client/Server
• Echtzeit und/oder rechtzeitig
Architectures

Development
DW Entwicklungsziele:
• Inmon Model: EDW approach (top-down):
Wo wird abgespeichert, dann, woher kommen die Daten?
• Kimball Model: Data mart approach (bottom-up):
Welches Modell besser ist, hängt von der eigenen Unternehmung ab.
• Welches Modell ist das Beste? Durch SAP Fragestellung quasi abgenommen Keine ‘eine-Größe-passt-zu-allem’ Strategie für DW’s
Eine Alternative: gemietetes Warehouse DW Struktur:
• The Star Schema vs. Relational

Representation of Data
• Dimensional Modeling – nutzt stets die Konzepte von Fakten (Messungen) und Dimensionen (Kontext)
• Abruf-basiertes System das ‘high-volume’ Zugang unterstützt.
• Star schema – Meist genutzte und der leichteste Style von dimensionalem modeling.
o Hat einen ‘fact table’ umgeben und verbunden durch ‘dimension tables‘.
o ‘Fact table’ beinhaltet descriptive Attribute (numerische Werte) die für Entscheidungsanalysen und Abfrage Reporting gebraucht warden.
o ‘Dimension tables’ beinhalten Klassifizierungs- und Aggregationsinfo über die Werte des Fact tables.
=>Repräsentation und Speicherung der Daten sollte den Prozess komplexer Abfragen erleichtern.

Star schema
Wir wollen eigentlich normalisieren, Dimensionstabellen jedoch nicht normalisiert, dadurch Redundanzen möglich.

Snowflake Schema
Ist eine erweiterte Version des Star Schemas in dem ‘Dimension tables’ normalisiert werden in verschiedene, in Verbindung stehende Tabellen.
Vorteile:
• Etwas gesparter Speicherplatz => Speicherplatz jedoch sehr billig mittlerweile
• Normalisierte Struktur ist leichter upzudaten und zu warten => Konsistenz! Nachteile:
• Weniger intuitiv
• Fähigkeit durch den Inhalt zu ‘browsen’ schwer
• Wegen zusätzlicher Verknüpfungen Abfrage-Fähigkeit weniger ausgeprägt
Multidimensionality
Definition: Fähigkeit Daten über verschiedene Dimensionen z.B. nach Region, Produkt, Verkäufer oder Zeit, zu organisieren, präsentieren und analysieren.
Multidimensionale Präsentation:

Dimensionen (Produkte, Verkäufer, Marktsegmente, Geschäftseinheiten, geo. Ort, Vertriebskanal, Land oder Industrie)
Maße (Geld, Verkaufsvolumen, Inventarprofit, Ist vs. Vorhersage)
Zeit (täglich, wöchentlich, monatlich, jedes Quartal oder jährlich)