Conhecimentos de análise de dados
2024-10-25 09:23:03 0 Relatar
Faça login para ver o conteúdo completo
Outras criações do autor
Esboço/Conteúdo
Conhecimentos básicos de análise de dados
Estatísticas de reserva
Distribuição discreta e distribuição contínua
Teste de hipótese
Verificação de parâmetros
Teste não-paramétrico
Teste de Normalidade
Teste de ajuste de distribuição
Construa seu próprio teste de hipóteses: a significância das atividades operacionais
Método de estimativa de parâmetros
Método de máxima verossimilhança
estimativa por momentos
Álgebra Linear
Valores e Vetores Propios
O significado das operações matriciais
Analisar linguagens e ferramentas
R
Preparação de dados
Escrever função: implementação de validação cruzada & algoritmo de iteração de Newton
Visualização: gráficos comuns do ggplot2 e resultados de visualização de aprendizado de máquina
ajuste de parâmetros de aprendizado de máquina
Python
Preprocessamento de dados
Análise de dados com Python
Implementação de algoritmos de aprendizado de máquina
Visualização
Estrutura de Algoritmos em Python
Crawlers e processamento de linguagem natural
SQL
grupo por e união
Ordem sintática e ordem de execução
Otimização do Hive: otimização de classificação e otimização de junção, entre outros
Princípios e experiência de uso do Hadoop
Escrever scripts de execução (Perl e shell)
SPSS, Stata e Eviews, softwares comerciais de análise
Princípios do Algoritmo
Categoria
Algoritmos de classificação
Regressão algorítmica
Análise de associação
agrupamento
Aprendizado integrado
princípios do boostrap, bagging, etc.
Diferenças e escopo de aplicação
Aplicação: princípios de florestas aleatórias, xgboost, etc.
Seleção e avaliação de modelos
Cenário de aplicação do modelo
Ajuste e avaliação de modelos
Conhecimentos de tecnologia de análise de dados
Coleta de dados
Definir dimensões de análise
Extrair indicadores de cada dimensão
Preprocessamento de dados
conversão de formato
Gerar variáveis
Tratamento de valores ausentes
Discretização de variáveis
······
Análise de modelagem
Divisão de conjuntos de teste/treinamento
Seleção de modelo
Seleção de parâmetros
Avaliação do modelo
Precisão
ROC e AUC
Matriz de confusão
função objetivo
······
Otimização e monitoramento do modelo
A adaptação subsequente do modelo
0 Comentários
Próxima página
Recomendado para você
Ver mais