Kenntnisse in der Datenanalyse
2024-10-22 16:19:20 106 0 Bericht 0
0
Anmelden, um den vollständigen Inhalt anzuzeigen
Diese Mindmap bietet einen umfassenden Überblick über die wesentlichen Kenntnisse in der Datenanalyse. Sie deckt grundlegende Konzepte wie Statistik, Hypothesentests und Parameterschätzungsmethoden ab, einschließlich diskreter und kontinuierlicher Verteilungen sowie der Maximum-Likelihood-Methode. Die Bedeutung der linearen Algebra wird durch Eigenwerte und Eigenvektoren hervorgehoben. Im Bereich der Analysetools wird die Anwendung von R und Python detailliert beschrieben, von der Datenvorverarbeitung bis zur Visualisierung und Optimierung von Machine Learning-Algorithmen. Zusätzlich werden SQL-Kenntnisse und die Nutzung kommerzieller Analyse-Software wie SPSS, Stata und Eviews thematisiert. Abschließend werden Techniken zur Datensammlung, Modellanalyse und -optimierung behandelt.
Andere Kreationen des Autors
Gliederung/Inhalt
Grundlagen der Datenanalyse
Statistikvorrat
diskrete Verteilung und kontinuierliche Verteilung
Hypothesentest
Parameterprüfung
Nicht-parametrische Tests
Normaleitest
Verteilungstest
Selbst konstruierte Hypothesentests: Die signifikante Wirkung von Betriebsaktivitäten
Parameterschätzungsmethoden
Maximum-Likelihood-Methode
Momenten-Schätzung
Lineare Algebra
Eigenwerte und Eigenvektoren
Die Bedeutung der Matrixberechnungen
Analysiere Sprache und Werkzeuge
R
Datenvorverarbeitung
Schreibe eine Funktion: Kreuzvalidierung implementieren, Newton-Iterationsalgorithmus usw.
Visualisierung: ggplot2-Standarddiagramme & Machine Learning-Visualisierungsergebnisse
Machine Learning-Parameter-Optimierung
Python
Datenvorverarbeitung
Python-Datenanalyse
Implementierung von Machine Learning-Algorithmen
Visualisierung
Python-Algorithmusstruktur
Crawler und Natural Language Processing
SQL
Gruppieren nach & Vereinigen
Syntax- und Ausführungsreihenfolge
Hive-Optimierung: Sortier-Optimierung und Verbindungs-Optimierung usw.
Hadoop-Prinzipien und -Erfahrungen
Skriptausführungsskripts schreiben (Perl und Shell)
SPSS, Stata und Eviews sind kommerzielle Analyse-Software.
Algorithmus-Prinzip
Kategorie
Klassifizierungsalgorithmen
Regressionsalgorithmus
Assoziationsanalyse
Cluster
Integratives Lernen
Der Grundsatz von Bootstrap, Bagging usw.
Unterschiede und Anwendungsbereiche
Anwendung: Prinzipien von Random Forest, XGBoost usw.
Modellauswahl und -bewertung
Anwendungsfall des Modells
Modellparameter optimieren und bewerten
Datenanalysetechnik-Wissen
Daten sammeln
Auswerte-Dimensionen definieren
Indikatoren aus verschiedenen Dimensionen extrahieren
Datenvorverarbeitung
Formatumwandlung
Variable generieren
Fehlende Werte behandeln
Variablen-Diskreterisierung
······
Modellanalyse
Test-/Trainingsdatensatz-Zuordnung
Modellauswahl
Parameterauswahl
Modellbewertung
Genauigkeit
ROC und AUC
Confusion Matrix
Zielfunktion
······
Modelloptimierung und -überwachung
Die anschließende Anpassung des Modells

Sammeln

Sammeln

Sammeln

Sammeln
0 Kommentare
Nächste Seite
Empfohlen für Sie
Mehr anzeigen