《大数据技术与应用》实验课程教学大纲
实验课程名称 | 《大数据技术与应用》实验 | 课程号 | XX110750 |
实验中心名称 | 计算机基础实验室 | ||
| |||
1、适用课程 大数据技术与应用 | |||
2、适用专业 计算机科学与技术、网络工程、应用数学 | |||
二、学时数 18 | |||
三、实验课程教学目的与任务 在学习了互联网大数据挖掘技术的基础知识和基本原理的基础上,利用Matlab实现并验证相关算法,从而使学生加深对相关理论知识的理解并增强其动手能力。 | |||
四、考核与评分 学生根据实验要求编程实现相关功能并撰写实验报告,根据最终完成的程序和实验报告情况给分。 |
五、实验项目表
序 | 实验项目名称 (小于16个字) | 时数 (2~4学时) | 每组 人数 | 实验 类型 | 开课实验室 名称 | 备注 |
1 | Map-Reduce算法的应用 | 2 | 1 | 验证 | ||
2 | 最小哈希计算方法的应用 | 2 | 1 | 验证 | ||
3 | LSH函数的应用 | 2 | 1 | 验证 | ||
4 | 流中独立元素的数目统计 | 2 | 1 | 验证 | ||
5 | 窗口中的计数 | 2 | 1 | 验证 | ||
6 | PageRank值的计算 | 2 | 1 | 验证 | ||
7 | A-Priori算法的应用 | 2 | 1 | 验证 | ||
8 | 层次聚类算法的应用 | 2 | 1 | 验证 | ||
9 | K-均值算法的应用 | 2 | 1 | 验证 | ||
10 |
注:依据大纲要求,实验开出率为: 100 %
六、实验项目内容与要求 |
实验内容: 对于由整数构成的大文件,利用Map-Reduce算法获取最大整数,所有整数的平均值,整数的集合且每个整数只出现一次,输入中不同整数的出现次数 |
实验要求: 掌握Map-Reduce算法的应用 |
实验内容: 对于给定的矩阵,根据不同的哈希函数,计算矩阵的最小哈希签名 |
实验要求: 掌握最小哈希计算方法 |
实验内容: 基于给定的LSH函数族,根据规则构造新的函数族,并计算其假阳率和假阴率 |
实验要求: 掌握LSH函数族的应用 |
实验内容: 根据给定的流和哈希函数,计算流元素的尾长和独立元素的数目 |
实验要求: 掌握流中独立元素数目统计的方法 |
实验内容: 对于给定的窗口,利用DGIM算法进行计数,并给出估计结果与真实值的差异 |
实验要求: 掌握DGIM算法 |
实验内容: 对于给定的网页链接图,计算每个网页的PageRank值 |
实验要求: 掌握PageRank值的计算方法 |
实验内容: 利用A-Priori算法计算给定数据集的频繁项对 |
实验要求: 掌握A-Priori算法 |
实验内容: 利用层次聚类算法对给定的数据集进行聚类 |
实验要求: 掌握层次聚类算法 |
实验内容: 利用K-均值算法对给定的数据集进行聚类 |
实验要求: 掌握K-均值算法 |
七、主要参考资料 1)大数据:互联网大规模数据挖掘与分布式处理,Anand Rajaraman, Jeffrey David Ullman 编著,王斌 译,人民邮电出版社, 2012-9 2)数据挖掘:概念与技术,韩家炜 等编著,范明等译,机械工业出版社, 2012-8 3)数据挖掘导论,陈封能、斯坦巴赫、库玛尔 编著,范明等译,人民邮电出版社,2011-1 |
审批人: 审核人: 编写人:
审核日期:
编号: C4/JW-7016/025