机器学习 2019 考试回忆
一、(集成学习)阐述 Boosting 和 Bagging 的适用场合
二、(决策树+朴素贝叶斯)给一个二维表,包含四个属性和一个标记,有 8 个有标签数据,
3 个无标签数据。
a) 求根节点的信息熵
b) 画出完整的决策树
c) 根据决策树判断 3 个无标签数据的类别
d) 使用朴素贝叶斯判断其中 1 个无标签数据的类别
三、(感知机)给了一个二层神经网络的图,两个输入节点,一个隐层(两个节点),一个
输出。给了连接关系,包括权值、bias。隐层采用线性激活 f(x)=cx,输出采用 sigmoid
激活。
a) 写出 p(y=1|x,w)的表达式(神经网络的表达式)、分类边界
b) 阐述如果隐层均使用线性激活函数,多层神经网络=单层神经网络。
四、(SVM)给了一个与式的例子(线性不可分),包括正例点 x1=(0,1)、x2=(1,0),反例点
x3=(0,0)、x4=(1,1)。
a) 给出核函数∅(x),并画出在新二维平面的坐标
b) 求解 SVM 的表达式(带核函数的),并给出所有的支持向量
五、(聚类)书上的 K-means 算法例子改造,给了一种新的聚类方式:一开始选 K 个中心,
然后每个点选择距离最近的中心加入;完成一轮后,计算类中每个点到其他点的距离的
偏差,以最小偏差的点为新中心,继续迭代,直到中心不变化。
a) 给了 30 个点,让运行一轮算法,给出一轮迭代后的类划分和新聚类中心。
六、在 KNN 中,K 值与偏差和方差的关系
七、(应用)给了求职者的信息、雇主的信息、求职者和雇主关联的信息(三个表)
a) 数据中含有数值型数据怎么处理、数据中缺失值怎么处理
b) 给出一种方案,完成向求职者推荐岗位,向雇主推荐求职者