データ分析の知識
2024-10-22 16:19:19 0 報告
ログインして完全な内容を表示
著者の他の作品
概要/内容
データ分析の基础知识
統計学の蓄積
離散分布と連続分布
仮説検定
パラメータ検証
非参数検定
正态性検定
分布拟合検定
自分で仮説検定を構成します:運営活動の有意性
パラメータ推定方法
极大似然法
矩の推定
線形代数
特徴値と特徴ベクトル
行列演算の意味
言語とツールの分析
R
データ前処理
関数の作成:交差検証実装関数&ニュートンの繰返しアルゴリズム等
可視化:ggplot2標準グラフ&機械学習可視化結果表示等
機械学習のパラメータ調整
Python
データ前処理
Pythonデータ分析
機械学習アルゴリズムの実装
可視化
Pythonアルゴリズム構造
クローラと自然言語処理
SQL
グループバイ&ユニオン
文法の順序と実行順序
Hiveの最適化:ソート最適化と結合最適化など
Hadoopの原理と使用経験
実行スクリプト(Perlとシェル)の作成
SPSS、Stata、Eviewsなどの商用分析ソフトウェア
アルゴリズムの原理
カテゴリ
分類アルゴリズム
回帰アルゴリズム
関連分析
クラスタリング
統合学習
ブーストラップ、バギングなどの原理
異同と適用範囲
アプリケーション:ランダムフォレスト、xgboostなどの原理
モデル選択と評価
モデルに適用されるシナリオ
モデルのパラメータ調整と評価
データ分析技術知識
データ収集
分析の視点を定める
各维度から指標を抽出する
データ前処理
形式変換
変数生成
欠損値処理
変数の離散化
······
モデリング分析
テストセット/トレーニングセットの分割
モデル選択
パラメーター選択
モデル評価
精度
ROCとAUC
混乱マトリックス
目的関数
······
モデル最適化と監視
モデルの後続的なフィッティング状況
0 コメント
次のページ