logo资料库

2019-ml-exam.pdf

第1页 / 共1页
资料共1页,全文预览结束
机器学习 2019 考试回忆 一、(集成学习)阐述 Boosting 和 Bagging 的适用场合 二、(决策树+朴素贝叶斯)给一个二维表,包含四个属性和一个标记,有 8 个有标签数据, 3 个无标签数据。 a) 求根节点的信息熵 b) 画出完整的决策树 c) 根据决策树判断 3 个无标签数据的类别 d) 使用朴素贝叶斯判断其中 1 个无标签数据的类别 三、(感知机)给了一个二层神经网络的图,两个输入节点,一个隐层(两个节点),一个 输出。给了连接关系,包括权值、bias。隐层采用线性激活 f(x)=cx,输出采用 sigmoid 激活。 a) 写出 p(y=1|x,w)的表达式(神经网络的表达式)、分类边界 b) 阐述如果隐层均使用线性激活函数,多层神经网络=单层神经网络。 四、(SVM)给了一个与式的例子(线性不可分),包括正例点 x1=(0,1)、x2=(1,0),反例点 x3=(0,0)、x4=(1,1)。 a) 给出核函数∅(x),并画出在新二维平面的坐标 b) 求解 SVM 的表达式(带核函数的),并给出所有的支持向量 五、(聚类)书上的 K-means 算法例子改造,给了一种新的聚类方式:一开始选 K 个中心, 然后每个点选择距离最近的中心加入;完成一轮后,计算类中每个点到其他点的距离的 偏差,以最小偏差的点为新中心,继续迭代,直到中心不变化。 a) 给了 30 个点,让运行一轮算法,给出一轮迭代后的类划分和新聚类中心。 六、在 KNN 中,K 值与偏差和方差的关系 七、(应用)给了求职者的信息、雇主的信息、求职者和雇主关联的信息(三个表) a) 数据中含有数值型数据怎么处理、数据中缺失值怎么处理 b) 给出一种方案,完成向求职者推荐岗位,向雇主推荐求职者
分享到:
收藏