现在位置: 首页  教学资源

大数据技术与应用实验大纲

2014-10-19

《大数据技术与应用》实验课程教学大纲

实验课程名称《大数据技术与应用》实验课程号XX110750
实验中心名称 计算机基础实验室
  • 适用课程与专业
1、适用课程

大数据技术与应用

2、适用专业 

计算机科学与技术、网络工程、应用数学

二、学时数      

18

三、实验课程教学目的与任务

在学习了互联网大数据挖掘技术的基础知识和基本原理的基础上,利用Matlab实现并验证相关算法,从而使学生加深对相关理论知识的理解并增强其动手能力。

四、考核与评分

学生根据实验要求编程实现相关功能并撰写实验报告,根据最终完成的程序和实验报告情况给分。

五、实验项目表

实验项目名称

(小于16个字)

时数

(2~4学时)

每组

人数

实验

类型

开课实验室

名称

备注
1Map-Reduce算法的应用21验证  
2最小哈希计算方法的应用21验证  
3LSH函数的应用21验证  
4流中独立元素的数目统计21验证  
5窗口中的计数21验证  
6PageRank值的计算21验证  
7A-Priori算法的应用21验证  
8层次聚类算法的应用21验证  
9K-均值算法的应用21验证  
10      

注:依据大纲要求,实验开出率为: 100     %

 

 

 

 

六、实验项目内容与要求

  1. 实验项目名称 Map-Reduce算法的应用

实验内容: 

对于由整数构成的大文件,利用Map-Reduce算法获取最大整数,所有整数的平均值,整数的集合且每个整数只出现一次,输入中不同整数的出现次数

实验要求:

掌握Map-Reduce算法的应用

  1. 实验项目名称 最小哈希计算方法的应用

实验内容:

对于给定的矩阵,根据不同的哈希函数,计算矩阵的最小哈希签名

实验要求:

掌握最小哈希计算方法

  1. 实验项目名称 LSH函数的应用

实验内容:

基于给定的LSH函数族,根据规则构造新的函数族,并计算其假阳率和假阴率

实验要求:

掌握LSH函数族的应用

  1. 实验项目名称 流中独立元素的数目统计

实验内容:

根据给定的流和哈希函数,计算流元素的尾长和独立元素的数目

实验要求:

掌握流中独立元素数目统计的方法

  1. 实验项目名称 窗口中的计数

实验内容:

对于给定的窗口,利用DGIM算法进行计数,并给出估计结果与真实值的差异

实验要求:

掌握DGIM算法

  1. 实验项目名称 PageRank值的计算

实验内容:

对于给定的网页链接图,计算每个网页的PageRank值

实验要求:

掌握PageRank值的计算方法

  1. 实验项目名称 A-Priori算法的应用

实验内容:

利用A-Priori算法计算给定数据集的频繁项对

实验要求:

掌握A-Priori算法

  1. 实验项目名称 层次聚类算法的应用

实验内容:

利用层次聚类算法对给定的数据集进行聚类

实验要求:

掌握层次聚类算法

  1. 实验项目名称K-均值算法的应用

实验内容:

利用K-均值算法对给定的数据集进行聚类

实验要求:

掌握K-均值算法

七、主要参考资料

1)大数据:互联网大规模数据挖掘与分布式处理,Anand Rajaraman, Jeffrey David Ullman 编著,王斌 译,人民邮电出版社, 2012-9 

2)数据挖掘:概念与技术,韩家炜 等编著,范明等译,机械工业出版社, 2012-8

3)数据挖掘导论,陈封能、斯坦巴赫、库玛尔 编著,范明等译,人民邮电出版社,2011-1

审批人:                审核人:                编写人:          

审核日期:

编号: C4/JW-7016/025

 

给我留言