西南財經大學招收碩士生考試說明及考試大綱
適用專業:大數據管理
考試科目:《數據挖掘綜合》
第一部分:考試內容及要求
一. 數據挖掘概述
考試內容
數據挖掘的概念 知識發現過程 數據挖掘數據類型 數據挖掘功能和模式 數據挖掘可利用的技術 數據挖掘應用 數據挖掘的主要問題
考試要求
1.了解數據庫系統技術的演變過程;理解數據挖掘的概念;掌握知識發現過程的7個步驟。
2.掌握數據挖掘的數據類型;掌握數據挖掘功能和模式;理解數據挖掘與統計學、機器學習的聯系和區別;了解數據挖掘的應用領域;了解數據挖掘的主要問題。
二. 數據預處理
考試內容
數據屬性 數據基本描述統計 數據預處理概述 數據質量 數據預處理的主要步驟 數據清理 數據集成 數據變換 數據規約 數據離散化
考試要求
1.了解數據對象與屬性類型。
2.理解數據的基本統計描述,掌握均值、中位數、眾數、極差、四分位數、方差、標準差和四分位數極差的概念和計算方法;了解數據基本統計描述的圖形顯示;了解度量數據的相似性和相異性。
3.了解進行數據預處理的原因及其重要性;了解數據質量涉及的因素;掌握數據預處理的主要步驟。
4.了解數據清理的概念;了解處理數據缺失值的方法;了解處理噪音數據的方法。
5.理解數據集成的概念;掌握冗余和相關性分析的方法(

6.了解數據變換的策略;掌握數據規范化的計算方法(最小-最大規范化、z分數規范化、按小數定標規范化)。
7.理解數據歸約的概念;了解數據歸約的策略;了解線性回歸、對數線性模型、直方圖、聚類、抽樣等數據歸約方法。
8.理解數據離散化和概念分層的概念;了解數據離散化的方法(分箱、直方圖分析、聚類分析、相關分析)。
三.數據倉庫和聯機分析處理
考試內容
數據倉庫基本概念 OLTP和OLAP 數據立方體 數據倉庫的數據模型 概念分層 典型的OLAP操作 數據倉庫的設計 數據倉庫的實現 數據倉庫和數據挖掘
考試要求
1.理解數據倉庫的概念和關鍵特征;了解OLTP和OLAP的概念和主要區別。
2.了解數據倉庫模型的種類;了解元數據庫的概念以及與其他數據的區別。
3.理解數據立方體的概念;了解數據倉庫的數據模型(星型模式、雪花模式、事實星座模式);了解典型的OLAP操作方法。
4.了解數據倉庫設計的四種視圖, 了解數據倉庫的設計過程和步驟;了解OLAP查詢處理的步驟。
5.了解三類數據倉庫應用;了解多維數據挖掘的重要性。
四. 挖掘頻繁模式、關聯和相關性
考試內容
頻繁項集概念 頻繁項集挖掘方法 Apriori算法 FP-growth算法
考試要求
1.理解項集、閉項集、頻繁項集和關聯規則的概念 ;了解規則興趣度的兩種度量(支持度和置信度)。
2.了解關聯規則挖掘的步驟。
3.了解Apriori算法的步驟;了解FP-growth算法的步驟和優缺點;掌握相關性度量提升度(lift)的計算方法。
五. 分類和預測
考試內容
數據分類和預測的概念 判定樹歸類算法 信息增益 樹剪枝 回歸分析 分類法的準確性 組合分類器 類不平衡問題
考試要求
1.理解數據分類的概念;了解分類的兩個過程;理解監督學習和非監督學習的區別;了解分類和預測的數據預處理方法;掌握評估分類和預測方法的標準。
2.了解決策樹的概念和優缺點;了解決策樹歸分類的主要步驟;了解常用的屬性選擇度量,掌握信息增益度量的求法;理解兩種常用的樹剪枝方法。
3.了解評估分類器性能的度量;了解評估分類和預測準確率的方法(混淆矩陣、靈敏度和特小型、F度量)。
4.了解K-折交叉驗證和自助法的基本思想;了解ROC曲線的概念和特點。
5.了解組合分類器的概念和常用的組合分類方法;了解裝袋和提升的基本思想以及兩者的區別;了解隨機森林的基本思想。
6.了解類不平衡問題的概念;了解提高類不平衡數據分類準確率的一般方法。
六. 聚類分析
考試內容
聚類分析的概念 聚類方法的分類 算法方法的距離度量 劃分方法 層次方法 基于密度的方法 基于網格的方法 聚類評估
考試要求
1.理解聚類分析的概念;了解聚類分析的應用領域;了解比較聚類方法的標準;了解數據挖掘對聚類的典型要求;了解比較聚類方法的各個方面。
2.理解劃分方法的概念和一般特點,以及典型算法;理解層次方法的概念和一般特點,以及典型算法;理解基于密度的聚類方法的概念和一般特點,以及典型算法;理解基于網格的聚類方法的概念和一般特點,以及典型算法;
3.理解K-均值算法的步驟和優缺點;
4.了解算法方法的距離度量。
5.了解聚類評估概念和主要任務;了解測定聚類質量的方法。
第二部分:考試方法和考試時間
數據挖掘綜合考試采用閉卷、筆試形式,考試時間為180分鐘。
第三部分:試卷結構及參考書目
(一)題分:試卷滿分為150分
(二)題型比例:
選擇題與判斷題 約40%
簡答題和計算題 約60%
(三)參考書目:
《數據挖掘 概念與技術》(原書第3版),作者:Jiawei Han(韓家煒),出版社:機械工業出版社。
原文鏈接:http://yz.swufe.edu.cn/web/2020-09/16/202009161510146840.html
以上就是“2021考研大綱:西南財經大學817數據挖掘綜合2021年碩士研究生入學考試自命題科目考試大綱及參考書目”的全部內容,更多考研大綱信息,請多多關注!