數據分析基礎知識
2024-10-25 09:23:03 0 舉報
登錄查看完整內容
作者其他創作
大綱/內容
离散分布和连续性分布
参数檢驗
正态性檢驗
分布拟合检验
非参数檢驗
自己构造假设檢驗:營運活動的顯著性
假设檢驗
极大似然法
矩估计
参数估计方法
特徵值和特徵向量
矩阵运算的意义
线性代数
統計學儲備
數據預處理
编写函數:交叉驗證實現函數&牛頓迭代演算法等
視覺化:ggplot2常規圖&機器學習視覺化結果呈現等
機器學習調參
R
Python數據分析
機器學習演算法實現
視覺化
Python算法结构
爬蟲和自然語言處理
Python
按群组&联合
语法顺序和執行順序
Hive優化:排序優化和連接優化等
Hadoop原理和使用经验
編寫執行腳本(Perl和shell)
结构化查询语言
SPSS、Stata和Eviews等商業分析軟體
分析語言和工具
分類演算法
回归算法
关联分析
聚类
類別
boostrap、bagging等的原理
異同和適用範圍
應用:隨機森林、xgboost等的原理
集成学习
模型適用情境
模型調參和評估
模型選擇和評估
演算法原理
數據分析基礎知識
划定分析维度
各個維度提取指標
資料搜集
格式转换
變數生成
缺失值处理
變數離散化
······
測試集/訓練集划分
模型選擇
參數選擇
建模分析
準確率
受试者工作特征曲线和曲线下面积
混淆矩陣
目標函數
模型評價
模型後續的適配情況
模型優化和監控
数据分析技术知识
數據分析知識
0 條評論
回復 刪除
下一頁