前言
通过理论联系实际,巩固所学的知识,提高处理实际问题的能力,为顺利毕业
进行做好充分的准备,并为自己能顺利与社会环境接轨做准备。通过这次实习,可
以进一步理解和领会所学的基本理论,了解计算机技术的发展及应用,较为系统地
掌握计算机应用技能,把所学知识与解决实际问题相联系,能够利用计算机处理工
作中的各种信息,培养我们发现问题、分析问题和解决问题的能力,从而提高我们
从事实际工作的能力。
毕业实习是一个极为重要的实践性教学环节。通过实习,使学生在社会实践中
接触与本专业相关的实际工作,增强感性认识,培养和锻炼学生综合运用所学的基
础理论、基本技能和专业知识,去独立分析和解决实际问题的能力,把理论和实践
结合起来,提高实践动手能力,为学生毕业后走上工作岗位打下一定的基础;同时
可以检验教学效果,为进一步提高教育教学质量,培养合格人才积累经验。计算机
是一门对实践要求较高的学科,通过专业实习,使学生能熟悉有关计算机专业的各
个领域,使学生毕业后能胜任与本专业相关的工作。
目录
一、实习目的 ·································································· 2
二、企业概况 ·································································· 2
三、实习内容 ·································································· 2
(一)熟悉数据库整理的基本规范 ·············································· 3
(二)文档库整理 ····································································3
四、实习体会 ·································································· 4
(一)勤做学习笔记 ····························································· 5
(二)坚持不懈的学习 ·························································· 5
(三)与同行分享自己的技术和心得 ········································ 5
(四)学会提问和帮助别人 ···················································· 6
五、实习总结 ·································································· 6
1
一、实习目的
1.深入社会实践,接触实际工作,了解企业现实状况和现代企业管理理念,特
别是软件开发发展趋势。
2.将学校所学的理论知识同企业实际开发操作结合起来,理论联系实际,以加
深对所学专业理论知识的理解。
3.掌握企业组织形式与基本方法,综合运用所学知识进行调查研究,以培养发
现问题解决问题的能力。
4.通过深入企业实习及社会调查,为毕业论文写作收集资料。
二、企业概况
北京超星数图信息技术有限公司是中国规模最大的数字图书馆解决方案提供商
和数字图书资源提供商。业务范围包括数字图书资源加工、供应、采集、管理以及
提供数字图书的创作、发布和交流为一体的完整平台。以先进、实用为指导思想,
超星公司锐意创新,在数字图书馆相关技术的研发方面取得了显著的成效。超星公
司经过 17 年的努力,构建了全球最大的中文数字图书馆。“珍藏科学著作,传承科
学精神”,以实际行动推进中国数字图书馆事业,为科教兴国战略做出自己的贡献
超星公司成立于 1993 年,长期致力于数字图书馆技术的开发及相关应用与推
广。超星数字图书馆,是全球最大的中文数字图书馆之一,超星书库内含图书资源
数百万种,涵盖中图法 22 个大类。其中 2005 年后的新书达到数十万种,基本涵盖
了近几年新出版的所有图书。而且超星拥有国内最大、最先进的图书资料数字化生
产线,年加工能力为 20 余万种图书以上。丰富的资源积累、领先业界的加工技术、
一流的数字化生产线,保证了超星数字图书馆资源丰富、全面和更新。被公认为中
国数字图书馆行业的第一品牌。超星数字图书馆为满足客户的不同需求,提供远程
包库和本地镜像两种专业服务平台。
超星数字图书馆综合资源服务平台产品系列:
●100 万册中文图书资源
●读秀知识库
●Metalink 外文数据库服务平台
●超星名师讲坛视频数据库
三、实习内容
2
此次实习安排我进入北京超星数图技术有限公司读秀分公司进行为期 4 周的实
习。实习期间,我主要负责数据库整理工作及文档下载的工作。具体内容包括文档
下载是用编程语句配置脚本使用下载工具获取有用的信息,然后用 SQL 语句进行更
新,删除一些无用的信息,对不规范的索引进行整理和删除,确定唯一字段以保证
索引的正常使用。
(一)熟悉数据库整理的基本规范
1.对 access 库进行分析
通过 Url 察看 access 库中各个字段的内容是否与页面一致,如果一致,在导
入到 SQL 数据库,否则注明或重新下载。如果不是自己下载的数据则返回给下载人
并通知其重新下载。
2.数据转换
a.以 ACCESS、文本、Excel 等格式存储的数据均统一导入 SQL 数据库存放。
b.对新数据添加标识列,并确定为主键。“唯一”命名规范为:数据来源(分配
任务时由频道负责人确定)_+yymmdd_+序号(序号由添加标识列获取)。
c.对 SQL 数据库中的数据要进行字段类型和长度的检查,合理设置数据的字段
类型、字符长度,将原表的各个字段转换类型,规范为 varchar 类型,如有 ntext
类型的要规范成 nvarchar(max)。
3.数据表命名
在命名表名时,注意对表名的统一规范,同一网站来源的数据以相同名字命
名且用日期加以区分。一般用数据来源的全拼+日期(分配任务时获取)作为该表的
表
名。在规范的过程中生成的问题表采用“XXXX(原表名)_yymmdd_(原因)”命
名,最终生成的表采用“XXXX(原表名)yymmdd_完成日期”,例如:百度百科站点的
原表,乱码表和最终表可命名为百度百科 100420_from,百度百科 100420_luanma
和百度百科_100420。
(二)文档库整理
1.整理前的准备工作
(1)整理前需要在原始库上添加唯一标识,并备份原表。
(2)查看各字段的长度,在保证信息不被截断丢失的前提下,将字段修改成合
理的类型和长度。
3
(3)可将不用的字段在整理库中删除,保留字段见下表。如果有其他具有检索
意义的字段或字段名称不一致,讨论后再做处理
2.整理过程
首先要把所有字段中为空的数据替换成 null。去掉除正文以外所有字段的数据
左右两边的空格,按照题名,链接,md5,文档大小分组查重。
1.唯一值 规则见全文数据整理流程。
2.名称 数据类型 nvarchar(200)不能有空字段和乱码内容,替换掉所有的
转义字符。对于“无标题”,标题为空这样没有实际意义的数据要提到问题表中。
3.文档大小 数据类型 varchar(50),由页面下载或者专用工具提取,格式
规范为 数字+'k',不要有其他杂乱内容。
4.文档类型 数据类型 varchar(50),规范为文档的后缀名,如 pdf,doc 等
等 ,不要有其他内容。
5.file 路径 nvarchar(50),上传到文档服务器上的相对路径,路径中不能
出现中文,不能出现带有实际信息的内容,如 xiazai,sougou 这样的,不能 用下载
人的名字命名整理人员要随机抽取几条检查地址是否正确。
6.url 数据类型 nvarchar(200),文档的下载地址,留作备份及滤重使用
7.分类 id 数据类型 nvarchar(50) 根据文档的题名或其他关键词为文档分类,
添加分类号,如果遇到分类表上没有的分类,可以向负责人提出增加新的分类。
8.Md5 数据类型 nvarchar(50) 使用专用工具提出,做查重条件,非 Null 值。
9.来源 数据类型 nvarchar(50) 文档的数据来源,参考负责人分派的任务。
10.正文 数据类型 nvarchar(max),非下载文档的页面数据。有文档的话此字
段为 Null 值。要保证正文内容有意义,文本内容为空而且无图片的数据也是无效数
据。使用筛选条件 not
LIKE '%[吖-座]%'查找出来的正文要分析一下内容是英文,
还是只有 Html 代码,只有代码的也为空内容。正文中不能存在超链接,和来源网站
相关的信息要去掉,图片的相对地址要改为服务器上的相对路径,替换完毕后要测
试一下图片是否能正确显示。
四、实习体会
一个月的实习生活,一眨眼的功夫就过去了。从刚开始的不谙世事,到现在的
得心应手。实习期间我们可以把在学校学到的各种知识应用到实际当中。在理论与
实践相结合的时候,能够更快更好的体会到理论的精髓所在,体会到理论与实践的
4
区别。从而巩固自己所学的知识,增强发现问题、分析问题、解决问题的能力。从
而做到理论与实际的融会贯通。以下是我的几点实习体会:
(一)勤做学习笔记
“好记性不如烂笔头”,不论是看一本技术书籍也好,还是一个程序实现也好。
在实施的时候觉得份外清醒,但当几个月后需要进行改进的时候,或许已经忘记得
七七八八了,做好笔记,把当时的思路、想法、遇到的疑难和解决办法都记录下来,
日后随时翻阅、扩充,会成为自己的一份财富。而且在书面进行记录的时候,记得
写完某一章节,背面一定留空白,不要舍不得一点纸张,那样在进行资料扩充的时
候非常方便。
(二)坚持不懈的学习
IT行业都要面临知识高速更新的现实,“八小时求生存,八小时求发展”的观
点已经被我们这个时代的人所接受。但事实上,很少有人在工作后,还能坚持每天
看书的。工作的劳累等因素使得每个月系统地看完一本书都成为了一个奢侈的计划。
仔细总结一下,每天总有那么一些时间被我们浪费过去了,充分利用起来会聚沙成
塔的。“但求每日有所获”便是我给自己定下的标准。
在短暂的实习过程中,我深深的感觉到自己所学知识的肤浅和在实际运用中的
专业知识的匮乏,这时才真正领悟到“学无止境”的含义。这也许是我一个人的感
觉,在学习和实践中的确是有一段距离的。而当我熟悉了维护站的日常工作,工作
也渐渐上了正轨。此时此刻最深切的心得就是,无论从何处起步,无论具体从事哪
种工作,认真和踏实的态度才是最根本的。
通过这次实习,让我知到了怎样与人相处和真正认识到什么是“一分耕耘一分
收获”,从这次实习中,我体会到了实际的工作与书本上的知识是有一定距离的,
并且需要进一步再学习。不可以再像以前那样,要珍惜每一段学习的机会。使自己
知道“将来出来从事工作的时候,无论做什么岗位什么职位都好,都要实事求是,
按部就班,要把自己放在最低层次,要从低做起,千万别把自己看得高高在上。我
要不断努力提高自身素质,为我即将走上工作岗位增添了信心。
(三)分享自己的技术和心得
中国有句古话“同行是冤家”。但闭关自守的人终究会变成井底之蛙,将自己
5
在日常工作的经验、体会通过各种方式与同行之间交流讨论。事实上随着网络的高
速发展工作需要同行们的协力。在与同行的交流中共同进步共同提高,不论对个人
还是对整个网络环境的建设都是大有好。通过在职的这几个月里,我深感自己的不
足,我会在以后的工作学习中更加努力,取长补短,需心求教。相信自己会在以后
的工作中更加得心应手,表现更加出色!
(四)学会提问和帮助别人
没有人是天生就什么都会的。除了自己努力学习外,通过口头询问/新闻组/论
坛以及Email等方式寻求帮助也是一个进步的捷径。关于这点,我就不罗嗦了,至于
帮助别人,那不是浪费自己的时间么?不会的,因为没有一个人会对所有的操作系
统都熟悉,所有的硬件设备都熟悉的。多看看别人的问题(当然是有价值的),耐
心的思考和提出自己的解决方法,并关注该问题的最后解决过程。谁也不敢保证,
自己以后就不会遇到同样的问题。帮助别人,很多时候就是帮助了自己。
五、实习总结
认识并融入这个团队,一直是实习期间对自己的要求。学习是拉近距离、融入
团队的最好办法,一个月的时间里,在老师的指导下,向行业学习知识,向前辈请
教经验,向同事传授工作技巧,正是在这个过程中,认识到自己的弱处和不足,也
深刻体会到了团队的力量和魅力。
在学习中做事。任何细节都有它的专业规律,任何人都有其独特比较优势;养
成个性谦虚才能不断进步,踏实肯干才能表现专业。在超星实习的期间内,努力做
好任何一件事情,用心记录每一个积累。通过踏踏实实的做事,让自己有了进步的
机会,也让自己感受到自己的价值所在。
实习期间,心境有时还显浮躁,做事偶尔还有粗心;这两点是在日后须牢记心
中,并不断努力改进的地方。
总之我相信,经过这次实习,在我以后的人生道路中,我一定会走得越来越好。
6
导师评语:
7