Conocimientos de análisis de datos
2024-10-22 16:19:20 1 Reportar
Iniciar sesión para ver el contenido completo
Otras creaciones del autor
Esquema/Contenido
Conocimientos básicos de análisis de datos
Reservas estadísticas
Distribución discreta y distribución continua
Prueba de hipótesis
Prueba de parámetros
Prueba no paramétrica
Prueba de normalidad
Prueba de ajuste de distribución
Autoconstruir la prueba de hipótesis: la significatividad de las actividades operativas
Métodos de estimación de parámetros
Método de máxima verosimilitud
estimación por momentos
Álgebra lineal
valores propios y vectores propios
El significado de las operaciones matriciales
Analizar idioma y herramientas
R
Preprocesamiento de datos
Escribir funciones: implementación de la validación cruzada, el algoritmo de Newton y otros
Visualización: gráficos comunes de ggplot2 y resultados de visualización de aprendizaje automático
ajuste de parámetros de aprendizaje automático
python
Preprocesamiento de datos
Análisis de datos en Python
Implementación de algoritmos de aprendizaje automático
visualizar
Estructura de algoritmos en Python
Crawlers y procesamiento del lenguaje natural
SQL
grupo por y unión
Orden de sintaxis y orden de ejecución
Optimización de Hive: optimización de ordenamientos y conexiones
Principios y experiencia de uso de Hadoop
Escribir scripts de ejecución (Perl y shell)
SPSS, Stata y Eviews, entre otros software de análisis comercial
Principios del algoritmo
Categoría
Algoritmos de clasificación
Regresión
Análisis de asociación
agrupación
Aprendizaje integrado
el principio de boostrap, bagging, etc.
Similitudes y ámbitos de aplicación
Aplicación: principios de bosques aleatorios, xgboost, etc.
Selección y evaluación de modelos
Escenarios de aplicación del modelo
Ajuste de parámetros y evaluación del modelo
Conocimientos técnicos de análisis de datos
recolección de datos
Definir dimensiones de análisis
Extracción de indicadores en cada dimensión
Preprocesamiento de datos
conversión de formato
Generación de variables
Tratamiento de valores faltantes
Discretización de variables
······
Análisis de modelado
División de conjuntos de prueba/entrenamiento
Selección de modelo
Selección de parámetros
Evaluación del modelo
exactitud
ROC y AUC
Matriz de confusión
función objetivo
······
Optimización y monitoreo de modelos
El ajuste posterior del modelo
Recolectar
Recolectar
Recolectar
Recolectar
0 Comentarios
Siguiente página
Recomendado para ti
Ver Más