前言
“没有什么可以阻挡一个人的梦想,当你愿意真心的全力以赴时,全宇宙都会联合起来帮你的忙”。因此,只要决定了报考清华深研院数据科学和信息技术专业,便只顾风雨兼程即可。盛世清北专注清北10余年,为给考生更多的鼓励,特整理相关专业信息,共报考清华深研院数据科学和信息技术专业的同学参考。
一、院系及专业内部情况分析
院系实力分析
清华大学深圳研究生院是清华大学和深圳市合作创建的高层次人才培养基地和科技创新基地,直属清华大学,为清华大学唯一的异地办学机构,是清华大学教育改革的试验田和创建世界一流大学的重要组成部分。清华大学深圳研究生院的师资力量和北京部分相当,深圳也蛮有资本的,而且处于技术的前沿阵地,在深圳的实习机会比较多,后续发展也是很不错的。
截至2017年12月,清华大学深圳研究生院占地面积为20.06万平方米,建筑面积为18.39万平方米,有博士、学术型硕士、专业学位硕士三种培养类别,涵盖19个一级学科,有专职教师148人,有在校全日制研究生为3027人,其中硕士生2683人,博士生344人。
专业介绍
数据科学和信息技术(数据科学交叉学科)项目是文理工商大交叉、深度融合,横跨信息系统和信息器件两个方向,在当前数据爆炸和信息技术对社会、经济生活等各方面渗透的大背景下,利用前沿的数据科学和信息技术,探索自然科学、工程、经济、社会等多学科的交叉领域。
2016年5月10日,清华大学与美国加州大学伯克利分校共同签署清华-伯克利双硕士学位项目协议,该项目已在2016年秋季启动,符合两校入学条件和学位要求的学生将有机会通过2年半到3年时间的学习就可同时获得清华大学的工学硕士学位和加州大学伯克利分校的工程硕士学位(工程领导力)。
项目师资由清华大学、加州大学伯克利分校以及全球招聘的国际一流水平教授组成,并邀请工业界导师加入指导组,旨在培养全球科技领袖和未来企业家,为解决区域和全球性重大工程技术和科学研究课题输送高素质人才。
就业情况
数据科学和信息技术专业的研究方向:
传感与测控领域
光电子领域
智能电网与可再生能源领域
工业工程与运筹学领域
智能交通与物流领域
低碳经济与金融风险分析研究领域
大数据与人工智能领域
计算机系统研究领域
学习数据科学和信息技术专业的就业方向有很多,以下这些是比较热门的职业:
1、数据分析师。2、商业分析师。3、数据工程师。
二、专业复习规划指导
说在前头
报考清华大学研究生,要脚踏实地,不要妄图走所谓的“捷径”。在这里,盛世清北提醒大家:想要考上清华深研院数据科学和信息技术硕士,重要的是基础知识掌握是否扎实、能否将所学灵活运用,而不是投机取巧,不能轻信押题,压中或者压不中,这个结果只能自己承担。
考试科目
专业名称 | 数据科学和信息技术 | 专业代码 | 0812J3 | ||
所属院系 | 清华大学深圳国际研究生院 | ||||
研究方向 | 01(全日制)数据科学交叉学科 | ||||
考试科目 | 科目一 | 科目二 | 专业课一 | 专业课二 | 复试科目 |
101 思想政治理论 | 201 英语(一) | 301 数学(一) | 962 数学-数据方向基础综合 |
盛世清北老师解读:
1、清华深研院数据科学和信息技术硕士专业划分为1个研究方向;
2、四门科目分为两门公共课考研外语和考研政治各100分,一门基础专业课150分,另一门专业课150分,总分500分;专业课分数占到了300分,同学们一定要重视专业课的重要作用。
3、24年计划招收 42人。
参考书(仅供参考,可能会随年份变化,可咨询盛世清北老师)
《数据结构》(C语言版) 清华大学出版社 严蔚敏、吴伟民
考情分析
真题解读:
经近几年的历年真题分析,盛世清北老师得出如下结论:
专业课 | 题型 | 数量 | 分值 | 备注 |
962 数学-数据方向基础综合 | 选择题 | 16 | 48分 | 总分150分,考试时间180分钟 |
填空题 | 19 | 38分 | ||
简答题 | 3 | 39分 | ||
证明题 | 2 | 25分 |
解读:
1、深研院数据科学和信息技术专业课历年考试难度大,考题较为灵活,与社会热点关联更深。同时,也关注考生的知识面。
2、报考清华也需要有扎实的基础,并非通过所谓的押题和划重点就能考上的。
历年分数线
年份 | 政治 | 外语 | 专业课一 | 专业课二 | 总分 | 拟录取人数 | 录取最高分/最低分 |
2023 | 50 | 50 | 80 | 70 | 330 | 44 | 411/337 |
2022 | 50 | 50 | 90 | 90 | 340 | 48 | 445/342 |
解读:
根据近2年分数线及复试情况,盛世清北老师分析如下:
(1)近两年来,各科目分数线趋于波动状态,而总分数线也存在波动,且2023年分数线最低,意味着当年的考题较难,应更加重视专业课的复习,要早复习,避免走弯路。
(2)近两年录取最低分是337分,最高分445分,意味着分数在337-445之间的考生,是有机会进入复试的。
(3)2022年拟录取人数为48人,2023年录取人数44人,意味着本专业有缩减趋势,考生们要抓住机会。
(4)深研院数据科学和信息技术硕士的复试录取比例较大,复试会淘汰一部分,要非常重视复试。
考点梳理(仅供参考,可能会随年份变化,可咨询盛世清北老师)
962数学-数据方向基础综合
1.1什么是数据结构
1.2基本概念和术语
1.3抽象数据类型的表示与实现
1.4算法和算法分析
1.4.1算法
1.4.2算法设计的要求
1.4.3算法效率的度量
1.4.4算法的存储空间需求
2线性表
2.1线性表的类型定义
2.2线性表的顺序表示和实现
2.3线性表的链式表示和实现
2.3.1线性链表
2.3.2循环链表
2.3.3双向链表
2.4一元多项式的表示及相加
3栈和队列
3.1栈
3.1.1抽象数据类型栈的定义
3.1.2栈的表示和实现
3.2栈的应用举例
3.2.1数制转换
3.2.2括号匹配的检验
3.2.3行编辑程序
3.2.4迷宫求解
3.2.5表达式求值
3.3栈与递归的实现
3.4队列
3.4.1抽象数据类型队列的定义
3.4.2链队列——队列的链式表示和实现
3.4.3循环队列——队列的顺序表示和实现
3.5离散事件模拟
4串
4.1串类型的定义
4.2串的表示和实现
4.2.1定长顺序存储表示
4.2.2堆分配存储表示
4.2.3串的块链存储表示
4.3串的模式匹配算法
4.3.1求子串位置的定位函数 Index(S,T,pos)
4.3.2模式匹配的一种改进算法
4.4串操作应用举例
4.4.1文本编辑
4.4.2建立词索引表
5数组和广义表
5.1数组的定义
5.2数组的顺序表示和实现
5.3矩阵的压缩存储
5.3.1特殊矩阵
5.3.2稀疏矩阵
5.4广义表的定义
5.5广义表的存储结构
5.6m 元多项式的表示
5.7广义表的递归算法
5.7.1求广义表的深度
5.7.2复制广义表
5.7.3建立广义表的存储结构
6树和二叉树
6.1树的定义和基本术语
6.2二叉树
6.2.1二叉树的定义
6.2.2二叉树的性质
6.2.3二叉树的存储结构
6.3遍历二叉树和线索二叉树
6.3.1遍历二叉树
6.3.2线索二叉树
6.4树和森林
6.4.1树的存储结构
6.4.2森林与二叉树的转换
6.4.3树和森林的遍历
6.5树与等价问题
6.6赫夫曼树及其应用
6.6.1最优二叉树(赫夫曼树)
6.6.2赫夫曼编码
6.7回溯法与树的遍历
6.8树的计数
7图
7.1图的定义和术语
7.2图的存储结构
7.2.1数组表示法
7.2.2邻接表
7.2.3十字链表
7.2.4邻接多重表
7.3图的遍历
7.3.1深度优先搜索
7.3.2广度优先搜索
7.4图的连通性问题
7.4.1无向图的连通分量和生成树
7.4.2有向图的强连通分量
7.4.3最小生成树
7.4.4关节点和重连通分量
7.5有向无环图及其应用
7.5.1拓扑排序
7.5.2关键路径
7.6最短路径
7.6.1从某个源点到其余各顶点的最短路径
7.6.2每一对顶点之间的最短路径
8动态存储管理
8.1概述
8.2可利用空间表及分配方法
8.3边界标识法
8.3.1可利用空间表的结构
8.3.2分配算法
8.3.3回收算法
8.4伙伴系统
8.4.1可利用空间表的结构
8.4.2分配算法
8.4.3回收算法
8.5无用单元收集
8.6存储紧缩
9查找
9.1静态查找表
9.1.1顺序表的查找
9.1.2有序表的查找
9.1.3静态树表的查找
9.1.4索引顺序表的查找
9.2动态查找表
9.2.1二叉排序树和平衡二叉树
9.2.2B 树和B+树
9.2.3键树
9.3哈希表
9.3.1什么是哈希表
9.3.2哈希函数的构造方法
9.3.3处理冲突的方法
9.3.4哈希表的查找及其分析
10内部排序
10.1概述
10.2插入排序
10.2.1直接插入排序
10.2.2其他插入排序
10.2.3希尔排序
10.3快速排序
10.4选择排序
10.4.1简单选择排序
10.4.2树形选择排序
10.4.3堆排序
10.5归并排序
10.6基数排序
10.6.1多关键字的排序
10.6.2链式基数排序
10.7各种内部排序方法的比较讨论
11外部排序
11.1外存信息的存取
11.2外部排序的方法
11.3多路平衡归并的实现
11.4置换一选择排序
11.5最佳归并树
12文件
12.1有关文件的基本概念
12.2顺序文件
12.3索引文件
12.4ISAM 文件和VSAM 文件
12.4.1ISAM 文件
12.4.2VSAM 文件
12.5直接存取文件(散列文件)
12.6多关键字文件
12.6.1多重表文件
12.6.2倒排文件。
真题试题
2022年清华大学大数据962考研真题(回忆版)
一、选择题,16*3分
1. 复杂度的概念
3. 单链表头尾节点的特性
4. 汉诺塔次数递推
14. 简单选择排序的比较次数和移动次数
15. 稳定性判定
16. 什么文件适合磁带储存
二、填空题,2分一空,共38分
1. 评价算法的两个重要概念
3. 队列的几个复杂度
4. KMP算法复杂度
9. 伙伴系统求地址
三、简答题,39分
1. 算术表达式转化二叉树 *12
2. 哈希表除余取留法、线性再探测、成功查找长度*12
3. demonstrate()函数,字符串常见assign/concat/substring/replace,求输出 *15
四、证明题:25分
1. (1)证2n-1个节点,只有0和2度的二叉树 *5
(2)证明叶子结点的层数li,满足求和:2的li -1 次方的倒数之和为1 *5
2. (1)证明AVL树最少节点的递推公式*5
(2)证明通项公式,斐波那契数列,爱咋求咋求,查分方程,构造特征方程、数归暴力也行*5
(3)证明AVL树查找复杂度为O(logn) *5
三、复试内容
1.总成绩计算办法和排序规则
面试组由5位以上具有研究生指导资格的专家组成,专家依据考生的现场表现按百分制独立打分给出面试成绩,平均计算每位学生的面试成绩。根据初试成绩、复试第一部分(即笔试变形)成绩、复试第二部分(面试)成绩计算考生总成绩。考生分类别进行名次排序,按总成绩排序,择优录取。
总成绩计算方法:
总成绩(满分1000)=初试成绩(满分500)+复试第一部分(满分100)×1+复试第二部分(满分100)×4
2.组织形式
复试包括笔试变形(即线上综合材料审核)和线下面试环节(具体时间地点另行通知),考生需线下到清华大学深圳国际研究生院复试,复试主要在学习目的、基础知识、外语能力、语言表达、逻辑思维、组织管理能力、综合能力、思想状况等方面对复试考生进行考察。复试将在3月23日完成,具体安排请见邮件通知,如有变化请以最新通知为准。
3.缴纳复试费
考生必须在参加复试前通过我校研究生申请服务系统完成复试费缴费,费用标准为100元。缴费后因各种原因未参加复试者,已支付的复试费不退。
4.考生资格审查注意事项
考生在资格审查前登录我校研究生申请服务系统(https://yzbm.tsinghua.edu.cn)提交以下材料的电子文档,并备好原件供现场查验。
(1)初试准考证;
(2)有效二代居民身份证;
(3)学历学位证书(应届生提供学生证);
(4)大学期间成绩单原件或档案中成绩单复印件(加盖档案单位红章);
(5)考生诚信承诺书;
(6)考生自述(包括政治表现、外语水平、业务和科研能力、研究计划等)。
未进行资格审查或资格审查未通过的考生一律不予录取。
5.复试安排
(1)资格审查时间地点:2023年3月22日,考生需线下到清华大学深圳国际研究生院信息楼参与资格审查。
(2)复试第一部分时间地点:2023年3月20日前完成,考生需在TBSI招生系统(https://admission.tbsi.edu.cn/user/login/tbsi)按规定完成材料提交。
(3)复试第二部分时间地点:2023年3月23日,考生需线下到清华大学深圳国际研究生院信息楼参加面试。
具体时间安排及详情请耐心等待后续邮件通知。
6.复试考核注意事项:
(1)复试第一部分(即笔试变形)安排:
形式:考生在TBSI招生系统(https://admission.tbsi.edu.cn/user/login/tbsi)按规定完成材料提交。
考查内容:综合考察考生的科研潜力、学术水平、语言水平等。由考生提供全英文个人简历、全英文个人陈述、全英文研究计划、获奖证明、学术成果、英语水平证明等辅助申请材料作为评分素材,均无模板、字数要求,共100分。
(2)复试第二部分安排:
形式:线下考核,全英文面试,20分钟。
考查内容:主要在学习目的、基础知识、外语表达能力、逻辑思维、组织管理能力、综合能力、思想状况等方面对复试考生进行考察。请考生准备个人自述3-5分钟,包括个人学习情况、实践活动与获奖、学术成果、特长爱好、人际关系、对报考专业的科研了解情况等,考核内容包括教育背景、科研经历、思想状况、对本学科发展动态的了解以及在本专业领域发展的潜力、思维的敏锐性、逻辑思维能力、语言表达能力、专业基础知识、相关实践能力等。
英语听力与口语测试:在面试过程中进行,以回答英文提问的方式考核,主要考核专业英语听说能力。
请考生携带中英文个人简历、中英文个人陈述纸质版材料各七份,无格式、模板、字数要求。
7.计划调整情况:
因推免生流失,2023年将数据科学和信息技术专业(代码:0812J3)招生计划调整为45个。
四、学长成功经验
以下是由盛世清北为考生整理的关于备考清华深研院数据科学和信息技术硕士的复习经验,其备考方法可供参考。
备考心得
所以考研路上不能自怨自艾,要有“明知山有虎,偏向虎山行”的勇气与毅力。考研室孤独的,是一个人的战斗,所有的备考工作都需要自己做好做全,除了对基础知识的复习之外,还要对自己的项目非常熟悉,通过一年的努力,全力以赴的拼搏,定会在孤独之后拥有美好的结局。
注意事项
1、专业课早做正确准备是考上清华北大的最大关键点,没有之一。这是备考普通院校和清华北大的重大区别,要特别注意。
2、对于参考书,要早点看,因为从你想好要看到真正开始看是有一定时间差的,且刚开始看的时候开头看不懂就多看几遍
备考攻略
清华大学962数学-数据方向基础综合考研试题重视基础及灵活运用,即使是同一本教材,但是掌握程度与考生高校要求不可同日而语。盛世清北老师提醒考生一定要注重基础理论的沉淀、理解、总结归纳、形成学科知识体系,结合真题考点进行习题训练,加深理解和掌握,而不是死记硬背书本,按自己的理解去学习很容易走弯路,导致失败。
针对于数据科学与信息技术来说,2020年起更改了专业课内容,原来需要考察数据结构,运筹学和随机过程三门专业课,现在专业课只涉及数据结构的内容。而962数学-数据方向基础综合官方规定的教材是严蔚敏老师的书,大纲内容为《数据结构》,而且这门课需要一点点c语言基础,会最基本的知识即可。
对于本科期间学过c语言,但是学得一般的同学,并不足以应对清华的考研试题。所以正式学习数据结构之前,建议翻一翻清华大学出版社谭浩强老师的C程序设计(第四版),因为只需要了解一些C语言的基础知识,所以这个过程很快。
翻看的参考书的过程,盛世清北建议大家使用知识点目录法、考点体系法、应试问题法来了解及记忆参考书的知识点,因为这些方法都是针对报考清华北大等名校成功考生经验基础上总结的。
万事开头难,我刚开始看这本书的时候真的很难,因为以前没有接触过,所以难免抵触,但一旦开始看了,就可以看进去了。而对于自己不熟悉的知识点,可以听听盛世清北的专业课程,老师讲的细致而且容易理解,然而真正熟练掌握一个算法原理还是要靠亲自实现,我在备考当中对于诸如Dijkstra等算法还是亲自用C++算法实现了一遍,事实证明通过亲自实践后对于算法有了更深的体会。
清华伯克利的面试时间通常在三月末的一个周末,2020年和2021年均采用线上面试的形式,取消笔试,改成了材料审核环节,占100分。TBSI往年复试包含笔试和面试,笔试占10%,面试占40%,面试共20分钟,一般是前3-5分钟让你做自我介绍,然后是英文问答。给我面试的是track2的老师们。老师们都非常好,听不懂的问题他们会重复甚至用中文问你,所以不要紧张,尽量用英语回答,实在不行也可以用中文回答。老师们一般会关注的有你的简历上的实习与项目经历等,一定要准备好,可能问的很细节;其次是本科成绩单上考得好和考的不好的科目,最好复习复习这些科目,巩固基础知识。
但是TBSI的复试面试是真正的重点,要求进行全英文作答,需要对相关的专业名词非常熟悉,而且要有一定的口语和听力能力。因此,对于保研的同学更是要求英语六级500分以上,建议提前准备,因为复试时提供英语成绩也是一个加分点。
最后总结
虽然我在复习过程中做了大量的题,但千万不能掉入做题的陷阱,不要以为自己做了很多题就万无一失了。一定要确保自己做的题记在脑子里了,否则做多少题也只是浪费时间罢了。其次,每个人的情况都不同,不要过度迷信别人的经验,无论是老师的选择,用书的选择还是复习进度,都要在不同的尝试之下找到最适合自己的方式,然后脚踏实地,无愧于心!最后盛世清北愿各位今年都能够成功上岸,一研为定!
本文部分信息来自网络,如有疏漏或转载授权问题,请联系盛世清北,以便及时纠正。