当前位置: 首页> 清北学长说-清华学长说 > 内容

清华深研院数据科学和信息技术考研高分经验分享

时间:2022-08-16 访问量:1085 来源:管理员

前言

“没有什么可以阻挡一个人的梦想,当你愿意真心的全力以赴时,全宇宙都会联合起来帮你的忙”。因此,只要决定了报考清华深研院数据科学和信息技术专业,便只顾风雨兼程即可。盛世清北专注清北近10年,为给考生更多的鼓励,特整理相关专业信息,共报考清华深研院数据科学和信息技术专业的同学参考。

一、院系及专业内部情况分析

院系实力分析

清华大学深圳研究生院是清华大学和深圳市合作创建的高层次人才培养基地和科技创新基地,直属清华大学,为清华大学唯一的异地办学机构,是清华大学教育改革的试验田和创建世界一流大学的重要组成部分。清华大学深圳研究生院的师资力量和北京部分相当,深圳也蛮有资本的,而且处于技术的前沿阵地,在深圳的实习机会比较多,后续发展也是很不错的。

截至2017年12月,清华大学深圳研究生院占地面积为20.06万平方米,建筑面积为18.39万平方米,有博士、学术型硕士、专业学位硕士三种培养类别,涵盖19个一级学科,有专职教师148人,有在校全日制研究生为3027人,其中硕士生2683人,博士生344人。

专业介绍

数据科学和信息技术(数据科学交叉学科)项目是文理工商大交叉、深度融合,横跨信息系统和信息器件两个方向,在当前数据爆炸和信息技术对社会、经济生活等各方面渗透的大背景下,利用前沿的数据科学和信息技术,探索自然科学、工程、经济、社会等多学科的交叉领域。

2016年5月10日,清华大学与美国加州大学伯克利分校共同签署清华-伯克利双硕士学位项目协议,该项目已在2016年秋季启动,符合两校入学条件和学位要求的学生将有机会通过2年半到3年时间的学习就可同时获得清华大学的工学硕士学位和加州大学伯克利分校的工程硕士学位(工程领导力)。

项目师资由清华大学、加州大学伯克利分校以及全球招聘的国际一流水平教授组成,并邀请工业界导师加入指导组,旨在培养全球科技领袖和未来企业家,为解决区域和全球性重大工程技术和科学研究课题输送高素质人才。

就业情况

数据科学和信息技术专业的研究方向:

传感与测控领域

光电子领域

智能电网与可再生能源领域

工业工程与运筹学领域

智能交通与物流领域

低碳经济与金融风险分析研究领域

大数据与人工智能领域

计算机系统研究领域

学习数据科学和信息技术专业的就业方向有很多,以下这些是比较热门的职业:

1、数据分析师。2、商业分析师。3、数据工程师。

二、专业复习规划指导

说在前头

报考清华大学研究生,要脚踏实地,不要妄图走所谓的“捷径”。在这里,盛世清北提醒大家:想要考上清华深研院数据科学和信息技术硕士,重要的是基础知识掌握是否扎实、能否将所学灵活运用,而不是投机取巧,不能轻信押题,压中或者压不中,这个结果只能自己承担。

考试科目

盛世清北老师解读:

1、清华深研院数据科学和信息技术硕士专业划分为1个研究方向;

2、四门科目分为两门公共课考研外语和考研政治各100分,一门基础专业课150分,另一门专业课150分,总分500分;专业课分数占到了300分,同学们一定要重视专业课的重要作用。

3、22年计划招收 43人。

参考书(仅供参考,可能会随年份变化,可咨询盛世清北老师)

《数据结构》(C语言版) 清华大学出版社 严蔚敏、吴伟民

考情分析

真题解读:

经近几年的历年真题分析,盛世清北老师得出如下结论:

解读:

1、深研院数据科学和信息技术专业课历年考试难度大,考题较为灵活,与社会热点关联更深。同时,也关注考生的知识面。

2、报考清华也需要有扎实的基础,并非通过所谓的押题和划重点就能考上的。

历年分数线

根据分数线及复试情况,盛世清北老师分析如下:解读:

(1)数据科学和信息技术方向2022年首次招生;

(2)2022录取最低分是342分,最高分445,意味着分数在342-445之间的考生,是有机会进入复试的。

(3)2022年计划招生43人,拟录取人数为48人,意味着本专业有扩招趋势,可以抓住机会。

(4)深研院数据科学和信息技术硕士的复试录取比例较大,复试会淘汰一部分,要非常重视复试。

考点梳理(仅供参考,可能会随年份变化,可咨询盛世清北老师)

962数学-数据方向基础综合

1.1什么是数据结构

1.2基本概念和术语

1.3抽象数据类型的表示与实现

1.4算法和算法分析

1.4.1算法

1.4.2算法设计的要求

1.4.3算法效率的度量

1.4.4算法的存储空间需求

2线性表

2.1线性表的类型定义

2.2线性表的顺序表示和实现

2.3线性表的链式表示和实现

2.3.1线性链表

2.3.2循环链表

2.3.3双向链表

2.4一元多项式的表示及相加

3栈和队列

3.1栈

3.1.1抽象数据类型栈的定义

3.1.2栈的表示和实现

3.2栈的应用举例

3.2.1数制转换

3.2.2括号匹配的检验

3.2.3行编辑程序

3.2.4迷宫求解

3.2.5表达式求值

3.3栈与递归的实现

3.4队列

3.4.1抽象数据类型队列的定义

3.4.2链队列——队列的链式表示和实现

3.4.3循环队列——队列的顺序表示和实现

3.5离散事件模拟

4串

4.1串类型的定义

4.2串的表示和实现

4.2.1定长顺序存储表示

4.2.2堆分配存储表示

4.2.3串的块链存储表示

4.3串的模式匹配算法

4.3.1求子串位置的定位函数 Index(S,T,pos)

4.3.2模式匹配的一种改进算法

4.4串操作应用举例

4.4.1文本编辑

4.4.2建立词索引表

5数组和广义表

5.1数组的定义

5.2数组的顺序表示和实现

5.3矩阵的压缩存储

5.3.1特殊矩阵

5.3.2稀疏矩阵

5.4广义表的定义

5.5广义表的存储结构

5.6m 元多项式的表示

5.7广义表的递归算法

5.7.1求广义表的深度

5.7.2复制广义表

5.7.3建立广义表的存储结构

6树和二叉树

6.1树的定义和基本术语

6.2二叉树

6.2.1二叉树的定义

6.2.2二叉树的性质

6.2.3二叉树的存储结构

6.3遍历二叉树和线索二叉树

6.3.1遍历二叉树

6.3.2线索二叉树

6.4树和森林

6.4.1树的存储结构

6.4.2森林与二叉树的转换

6.4.3树和森林的遍历

6.5树与等价问题

6.6赫夫曼树及其应用

6.6.1最优二叉树(赫夫曼树)

6.6.2赫夫曼编码

6.7回溯法与树的遍历

6.8树的计数

7图

7.1图的定义和术语

7.2图的存储结构

7.2.1数组表示法

7.2.2邻接表

7.2.3十字链表

7.2.4邻接多重表

7.3图的遍历

7.3.1深度优先搜索

7.3.2广度优先搜索

7.4图的连通性问题

7.4.1无向图的连通分量和生成树

7.4.2有向图的强连通分量

7.4.3最小生成树

7.4.4关节点和重连通分量

7.5有向无环图及其应用

7.5.1拓扑排序

7.5.2关键路径

7.6最短路径

7.6.1从某个源点到其余各顶点的最短路径

7.6.2每一对顶点之间的最短路径

8动态存储管理

8.1概述

8.2可利用空间表及分配方法

8.3边界标识法

8.3.1可利用空间表的结构

8.3.2分配算法

8.3.3回收算法

8.4伙伴系统

8.4.1可利用空间表的结构

8.4.2分配算法

8.4.3回收算法

8.5无用单元收集

8.6存储紧缩

9查找

9.1静态查找表

9.1.1顺序表的查找

9.1.2有序表的查找

9.1.3静态树表的查找

9.1.4索引顺序表的查找

9.2动态查找表

9.2.1二叉排序树和平衡二叉树

9.2.2B 树和B+树

9.2.3键树

9.3哈希表

9.3.1什么是哈希表

9.3.2哈希函数的构造方法

9.3.3处理冲突的方法

9.3.4哈希表的查找及其分析

10内部排序

10.1概述

10.2插入排序

10.2.1直接插入排序

10.2.2其他插入排序

10.2.3希尔排序

10.3快速排序

10.4选择排序

10.4.1简单选择排序

10.4.2树形选择排序

10.4.3堆排序

10.5归并排序

10.6基数排序

10.6.1多关键字的排序

10.6.2链式基数排序

10.7各种内部排序方法的比较讨论

11外部排序

11.1外存信息的存取

11.2外部排序的方法

11.3多路平衡归并的实现

11.4置换一选择排序

11.5最佳归并树

12文件

12.1有关文件的基本概念

12.2顺序文件

12.3索引文件

12.4ISAM 文件和VSAM 文件

12.4.1ISAM 文件

12.4.2VSAM 文件

12.5直接存取文件(散列文件)

12.6多关键字文件

12.6.1多重表文件

12.6.2倒排文件。

真题试题

2022年清华大学大数据962考研真题(回忆版)

一、选择题,16*3分

1. 复杂度的概念

3. 单链表头尾节点的特性

4. 汉诺塔次数递推

14. 简单选择排序的比较次数和移动次数

15. 稳定性判定

16. 什么文件适合磁带储存

二、填空题,2分一空,共38分

1. 评价算法的两个重要概念

3. 队列的几个复杂度

4. KMP算法复杂度

9. 伙伴系统求地址

三、简答题,39分

1. 算术表达式转化二叉树 *12

2. 哈希表除余取留法、线性再探测、成功查找长度*12

3. demonstrate()函数,字符串常见assign/concat/substring/replace,求输出 *15

四、证明题:25分

1. (1)证2n-1个节点,只有0和2度的二叉树 *5

(2)证明叶子结点的层数li,满足求和:2的li -1 次方的倒数之和为1 *5

2. (1)证明AVL树最少节点的递推公式*5

(2)证明通项公式,斐波那契数列,爱咋求咋求,查分方程,构造特征方程、数归暴力也行*5

(3)证明AVL树查找复杂度为O(logn) *5

三、学长成功经验

以下是由盛世清北为考生整理的关于备考清华深研院数据科学和信息技术硕士的复习经验,其备考方法可供参考。

备考心得

所以考研路上不能自怨自艾,要有“明知山有虎,偏向虎山行”的勇气与毅力。考研室孤独的,是一个人的战斗,所有的备考工作都需要自己做好做全,除了对基础知识的复习之外,还要对自己的项目非常熟悉,通过一年的努力,全力以赴的拼搏,定会在孤独之后拥有美好的结局。

注意事项

1、专业课早做正确准备是考上清华北大的最大关键点,没有之一。这是备考普通院校和清华北大的重大区别,要特别注意。

2、对于参考书,要早点看,因为从你想好要看到真正开始看是有一定时间差的,且刚开始看的时候开头看不懂就多看几遍

备考攻略

清华大学962数学-数据方向基础综合考研试题重视基础及灵活运用,即使是同一本教材,但是掌握程度与考生高校要求不可同日而语。盛世清北老师提醒考生一定要注重基础理论的沉淀、理解、总结归纳、形成学科知识体系,结合真题考点进行习题训练,加深理解和掌握,而不是死记硬背书本,按自己的理解去学习很容易走弯路,导致失败。

针对于数据科学与信息技术来说,2020年起更改了专业课内容,原来需要考察数据结构,运筹学和随机过程三门专业课,现在专业课只涉及数据结构的内容。而962数学-数据方向基础综合官方规定的教材是严蔚敏老师的书,大纲内容为《数据结构》,而且这门课需要一点点c语言基础,会最基本的知识即可。

对于本科期间学过c语言,但是学得一般的同学,并不足以应对清华的考研试题。所以正式学习数据结构之前,建议翻一翻清华大学出版社谭浩强老师的C程序设计(第四版),因为只需要了解一些C语言的基础知识,所以这个过程很快。

翻看的参考书的过程,盛世清北建议大家使用知识点目录法、考点体系法、应试问题法来了解及记忆参考书的知识点,因为这些方法都是针对报考清华北大等名校成功考生经验基础上总结的。

万事开头难,我刚开始看这本书的时候真的很难,因为以前没有接触过,所以难免抵触,但一旦开始看了,就可以看进去了。而对于自己不熟悉的知识点,可以听听盛世清北的专业课程,老师讲的细致而且容易理解,然而真正熟练掌握一个算法原理还是要靠亲自实现,我在备考当中对于诸如Dijkstra等算法还是亲自用C++算法实现了一遍,事实证明通过亲自实践后对于算法有了更深的体会。

清华伯克利的面试时间通常在三月末的一个周末,2020年和2021年均采用线上面试的形式,取消笔试,改成了材料审核环节,占100分。TBSI往年复试包含笔试和面试,笔试占10%,面试占40%,面试共20分钟,一般是前3-5分钟让你做自我介绍,然后是英文问答。给我面试的是track2的老师们。老师们都非常好,听不懂的问题他们会重复甚至用中文问你,所以不要紧张,尽量用英语回答,实在不行也可以用中文回答。老师们一般会关注的有你的简历上的实习与项目经历等,一定要准备好,可能问的很细节;其次是本科成绩单上考得好和考的不好的科目,最好复习复习这些科目,巩固基础知识。

但是TBSI的复试面试是真正的重点,要求进行全英文作答,需要对相关的专业名词非常熟悉,而且要有一定的口语和听力能力。因此,对于保研的同学更是要求英语六级500分以上,建议提前准备,因为复试时提供英语成绩也是一个加分点。

最后总结

虽然我在复习过程中做了大量的题,但千万不能掉入做题的陷阱,不要以为自己做了很多题就万无一失了。一定要确保自己做的题记在脑子里了,否则做多少题也只是浪费时间罢了。其次,每个人的情况都不同,不要过度迷信别人的经验,无论是老师的选择,用书的选择还是复习进度,都要在不同的尝试之下找到最适合自己的方式,然后脚踏实地,无愧于心!最后盛世清北愿各位今年都能够成功上岸,一研为定!

本文部分信息来自网络,如有疏漏或转载授权问题,请联系盛世清北,以便及时纠正。


电话咨询
微信咨询
在线咨询