數據分析基礎知識
2024-10-25 09:23:03 0 舉報
登錄查看完整內容
作者其他創作
大綱/內容
數據分析基礎知識
統計學儲備
离散分布和连续性分布
假设檢驗
参数檢驗
非参数檢驗
正态性檢驗
分布拟合检验
自己构造假设檢驗:營運活動的顯著性
参数估计方法
极大似然法
矩估计
线性代数
特徵值和特徵向量
矩阵运算的意义
分析語言和工具
R
數據預處理
编写函數:交叉驗證實現函數&牛頓迭代演算法等
視覺化:ggplot2常規圖&機器學習視覺化結果呈現等
機器學習調參
Python
數據預處理
Python數據分析
機器學習演算法實現
視覺化
Python算法结构
爬蟲和自然語言處理
结构化查询语言
按群组&联合
语法顺序和執行順序
Hive優化:排序優化和連接優化等
Hadoop原理和使用经验
編寫執行腳本(Perl和shell)
SPSS、Stata和Eviews等商業分析軟體
演算法原理
類別
分類演算法
回归算法
关联分析
聚类
集成学习
boostrap、bagging等的原理
異同和適用範圍
應用:隨機森林、xgboost等的原理
模型選擇和評估
模型適用情境
模型調參和評估
数据分析技术知识
資料搜集
划定分析维度
各個維度提取指標
數據預處理
格式转换
變數生成
缺失值处理
變數離散化
······
建模分析
測試集/訓練集划分
模型選擇
參數選擇
模型評價
準確率
受试者工作特征曲线和曲线下面积
混淆矩陣
目標函數
······
模型優化和監控
模型後續的適配情況
0 條評論
下一頁
為你推薦
查看更多