logo资料库

2008年江苏南京农业大学信息检索考研真题.doc

第1页 / 共6页
第2页 / 共6页
第3页 / 共6页
第4页 / 共6页
第5页 / 共6页
第6页 / 共6页
资料共6页,全文预览结束
2008 年江苏南京农业大学信息检索考研真题 一.名词解释(每小题 2 分,共 12 分) 1.信息可视化 2.文献语词矩阵 3.机械分词法 4.萨尔顿 5.多媒体数据压缩比
6.自动抽词标引 二.名词辩析(每题 6 分,共 24 分) 1.一次文献、二次文献、三次文献 2.文献检索、事实检索、数据检索 3.目录、题录、文摘 4.标引、标目、参照 三. 计算题(前三题每小题 6 分,第四小题 8 分,共 26 分
1.将测试文档分到十个类目,程序运行结束后,得到的测评数据如下: 求宏观分准率、宏观分全率、微观分准率、微观分全率及各类的分准率、分全率。 2.对某一检索系统的测评发现,当查全率为 0.25、0.5、0.75 时,对应的查准率分别为 0.8、 0.5、0.2,求此时的 AP 值。可否求得此时的 AR?该测评方法的名称分别是什么? 3.推导并计算等级聚类法的时间复杂性。 4.设有文档 d1=(2,1)、d2=(1,3)、d3=(6,7)、d4=(4,7)和类日中心 cl(4,3)、C2 二(5,5), 以余弦函数法为相关性测度计算公式,将山、d2、d3 全部就近归类(归类过程中类目中心不 移动)。 四.简答题(每小题 6 分,共 48 分)
1.何谓信息检索经典模型,都有哪几种? 2.基于篇章结构的网页自要摘要算法中,可用什么方法合并段落? 3.从信息检索的角度如何看待邮件过滤技术? 4.TREC 有哪些局限性? 5.信息检索中的同义词与语言学中的同义词有何区别? 6.试比较印刷型文献和电子型文献。
7.引文索引的用途是什么? 8.简介世界三大农业文献数据库。 五.论述题(每小题 10 分,共 40 分) 1.请归纳综述目前多媒体信息检索技术的发展现状。 2.请评价向量空间模型在信息检索发展史上的意义。 3.请分析查全率、查准率的用户独立性,并给出理由。 4.请看下列索引片段或检索式,然后回答问题:
(1)GrapeSugarseeGlucose(索引片段) (2)SeedseealsoGrain(索引片段) (3)Mercury(Planet)(索引片段) (4)(riceandbreeds).ti.(检索式) (5)notEnglishinla(检索式) 请分别写出每个表达式的含义。
分享到:
收藏