logo资料库

信息分类和编码的基本原则与方法.pdf

第1页 / 共17页
第2页 / 共17页
第3页 / 共17页
第4页 / 共17页
第5页 / 共17页
第6页 / 共17页
第7页 / 共17页
第8页 / 共17页
资料共17页,剩余部分请下载后查看
ICS 01120 A 00 噶日 中 华 人 民 共 和 国 国 家 标 准 GB/T 7027-2002 代替 GB/T 7027-1986 信 息分 类和 编码 的基 本原 则 与方 法 Basic principles and methods for information classifying and coding 2002一07门 8发 布 2002一12一01实 施 中 华 人 民 共 和 国 国 家 质 量 监 督 检 验 检 疫 总 局 发 布
GB/T 7027- 2002 目 次 前 言 ····························································。·····················································…… 1 引 言 ·······························。··················································································…… N 1 范 围 ·..············································································································… … 1 2 规范性 引用文件 ···················································································.············…… 1 3 术语和定义 ··············································。·······················································…… 1 4 信息的分类与编码 ·····························································································…… 1 4. 1 信息分类 ······································································。·······························…… 1 4. 2 信息编码 ······································································································…… 1 5 信息分类的基本原则 ·············。·······································。····································…… 2 5.1 科 学 性 ····························,····················。·······················································… … 2 5.2 系 统 性 ·········································································································… … 2 5. 3 可扩延性 ······························,·······································,························。······…… 2 5.4 兼容性 ·····························································。···········································…… 2 5. 5 综合实用性 ······················。············································································…… 2 6 信息分类的基本方法 ·············。············································································…… 2 6. 1 概 述 ············································································································… … 2 6.2 线 分类法 ,··,·、 ····、、· 、···· ···、····‘、··‘ ··· ······································一 2 6 3 面 分 类 法 ······································································································… … 3 6.4 混合分类法 ··················································································。···············.…… 3 7 信息编码的基本原则 ···········。·····································。········································…… 3 7. 1 唯 一 性 ················。························································································… … 3 7.2 合理性 ·······················。·。···············································································…… 3 7. 3 可扩充性 ······································································································…… 3 7.4 简 明 性 ·········································································································… … 3 7. 5 适 用 性 ·········································································································… … 3 7. 6 规 范 性 ·······。·································································································… … 3 8 信息编码的基本方法 ··························································································…… 4 8. 1 通 则 ············································································································… … 4 8.2 代 码类型 ····。·································································································…… 4 8. 3 代 码 特 征 ·····································································································… … 7 8.4 代码 表现形 式 ································································································… … 8 8. 5 代 码设计······································································································…… 10 8. 6 代码 赋值约定································································································…… n 附录 A(资料性附录) 各 种信息分类编码方法的优缺点 ················································…… 12 A.1 信息分类方法优缺点 ···················································································.…… 12 A.2 各种类型代码编码方法优缺点 ···················································....·.......·.......…… 12
GB/'r 7027- 2002 前 言 本标准是对 GB/T 7027- 1986《标准化工作 导则 信 息分类编码的基本原则和方法 》的修订 。在信 息编 码部分 内容上 ,本标 准参考 了国际技术报 告 ISO/IEC TR 9789:1994(E)《信息技术— 数据交换 用数据元素组织与表示指 南— 编码方法与原理 》,采纳 了其 中比较 成熟 的相关技术 内容 。 本标 准 代 替 GB/T 7027- 1986《标 准 化 工作 导 则 信 息分 类 编码 的基 本 原 则 和方 法 》 同 GB/T 7027- 1986相比,本次修 订所 作的主要修改是 : 修改 了标准 的名称 。标准名称改为《信息分类和编码的基本原则与方法 》。 标准的总体 编排 和结构按 GB/T 1. 1-200。进行了修改 ,增 加了 目次、前言 、引言和附录 Ao 一 对原标准 的内容进行 r相应的增删 增补 的内容包 括 :第 2章“规 范性引用文件 ”、第 3章“术语 和定 义”和第 4章“信息 的分 类与编码 ”概述 删除的 内容是 原标准 的第 2. 4条“代码 的校验 ”的有关 算 法 。 一一对原标准 的结构 进行了调整 :原标准的第 1. 1条“信息分类的基本原则”调整为第 5章 ,原标 准 的第 1.2条“信息分类的基本方法 ”调整为第 6章 ,原标准的第 2. 2条“编码的基本原则”调 整为第 7章 , 原标 准的第 2. 3条“代码 的种类 ”和第 2. 5条“代 码的类型 ”与 ISO/IEC TR 9789的相关技术 内容经过 整理共 同构成第 8章“信息编码 的基本方法”,原标 准中分散叙述的各个 信息分类和编码力法 的优缺点 集 中汇总调 整为“附录 A 各种 信息分类编码方法 的优缺点 ”。 一 对 原标准 中的代码名 称进行 了若干项调 整:原标 准中 的“特征 组合码”对应于本标准 的“并置 码”,原标准 中的“复合码 ”对应于木标准 的“组合码”,原标准 中的“数值化字母顺序码”被本标准的“约定 顺序码 ”所涵盖 在信息分类 编码标准化领域 ,本标准应 与GB/丁 20001.3-2001《标准编写规则 第 3部分 :信息分 类编码 》和 GB/T 10113《分类 编码 通用术语 》两项 标准配套应用 。 本标准 的附录 A 是资料性附录 。 本标准 由中国标准研究 中心提出并 归口 本标准 主要 起草单位 :中国标 准研究中心 。 本标准 主要起 草人 李 小林 、冯卫 、胡嘉璋 。 GB/T 7027于 1986年 11月首次发 布,本次修订为第一 次修订。
Gs/T 7027- 2002 引 言 在通常情况下 ,人们对信 息的理解是 :一切有含义 的具 体或抽象事物或 概念的真相 及相 关陈述 ,通 过数据 、消息及其进 一步细节表达出来 。 在信息 分类编码领域 ,信息的表现形式是数据 。 客观 、明确的信息是计 算机建立信息系统 以及数据在其 中进行 交换的先决条件 。 在信息系统 中,数据是用 字符(通 常为数字或字母 )、算 术符号以及描 述来表示 ,这些表示形式 应该 对其所 涉及的每一个数据都有一个 明确 稳定 的含义 ,从 而达到处理 与交流的 目的 。 信息 要被不同用户组 或应用系统所共享 ,就必 须有一致认可 的定 义 ,举 例来说 ,要有概念 的语 义含 义 (内涵)、概念的全部实例 (外延 )以及一致认可的表示法 。 对各 类信息概念 的正 确理 解需要依赖 于信息分类 ;对各类信息作 出一致认可 的表示需要依赖 于信 息 编 码 。
GB/'r 7027-2002 信息分类和编码的基本原则与方法 范 围 本标 准规定了信息分类编码 的基本原则 和方法,适用 于各类信 息分类编码标准的编制 2 规 范 性 引用 文 件 下列 文件中的条款通过本标准 的引用 而成为本标准的条款 。凡是注 日期 的引用文件 ,其 随后所有 的 修改单 (不包括勘误 的内容 )或修订版均不适 用于本标准 ,然 而,鼓励根据本标准达成协议 的各方研究是 否可使用这些文 件的最新版本 。凡是不注 日期的引用文件 ,其最新 版本适用 于本标准。 GB/T 1988-1998 信息技 术 信息交换用七位编码字符 集(eqv ISO/IEC 646:1991) GB 2312- 198。 信息交换用汉字编码字符集 基本集 GB/T 2260-2002 中华人 民共和国行政区划代码 GB/T 2659- 2000 世界各 国和地区名称代码 (eqv ISO 3166-1:1997) GB/T 4657-2002 中央党政机关、人民团体及其他机构代码 GB/T 7408-1994 数据 元和交换格式 信息交换 日期 和时间表示 法(eqv ISO 8601:1988) GB/T 10113 分类编码通用术语 GB 11643--1999 公 民身份号码 GB/T 13745-1992 学科分类与代码 GB/T 14721.1-1993 林业资源分类与代码 森林 类型 GB/T 14805-1993 用 于行政 、商 业 和运输业 电子数据 交换 的应用 级语 法规则 (idt ISO 9735: 1988) GB/T 17710- 1999 数据处理 校验码 系统 (idtISO 7064:1983) 3 术 语 和 定 义 GB/T 10113中确立 的术 语适 用于本标准 。 4 信 息的分类与编码 4门 信息分 类 信息分类是根据信 息内容的属性或特征 ,将信息按一定的原则和方法进行 区分和 归类 ,并建立起一 定的分类体 系和排列顺 序。 信息分类有两个要 素:一是分类对象 ,二是分类 的依据 。分类对象由若 干个被分类的实体组成 。分 类依 据取决于分类对象 的属性 或特征 。 信息内容属性的相 同或相 异,形成 了各种 不同的类。在信息分类体系中 ,类可称为类 目。 4.2 信 息 编 码 信息编码是将事物或概念 (编码对象 )赋予具有一定规律 、易于计算机和人识别处 理的符号,形成代 码元 素集合 。代码元素集合 中的代码 元素就是赋予编码对象 的符 号,即编码对象 的代 码值 。 所 有类型的信息都能够进行编码 :如关 于产品、人 、国家、货 币、程序 、文件、部件等各种各样 的信息。 信息 编码包含的内容有 :数据表达成代码 的方法 、数据的代码表示形式 、代码元素集合 的赋值 。 信 息编码的主要作用有 :标识 、分类、参照 。
GB/'r 7027-2002 标识的 目的是要把编码对象彼 此区分开 ,在编码 对象的集合范围 内,编码 对象的代码值是其唯一性 标志 ;信息编码 的分类作用实质上是对类进 行标识 ;信息编码 的参 照作 用体现在编码对象的代码值可作 为不同应用系统或应用领 域之 间发生关联的关键字 。 5 信 息分 类 的 基 本 原 则 5门 科学性 宜选择事物或概 念(即分类对象 )最稳定的本质属性或特征作 为分类 的基 础和依 据。 5,2 系 统 性 将选定 的事物 、概念 的属性 或特 征按 一定排列顺序予以系统化 ,并形成一个科学合理的分类体 系。 5.3 可 扩 延 性 通常要设置收容类 目,以保证增加新 的事物或概念时 ,不 打乱已建立的分类体系 ,同时,还应为下级 信息管理系统在本分类 体系的基础上进行延拓细化创造条件 。 5.q 兼容性 应与相关标准 (包括 国际标 准)协调一致 。 5.5 综合 实用性 分类要从系统工程 角度出发 ,把局 部问题放在系统整体中处理 ,达 到系统最优。即在满足系统总任 务 、总要求的前提下 ,尽量满足系统 内各相关单位 的实际需 要 6 信 息 分 类 的 基 本 方 法 6.1 概 述 信息分类 的基 本方法有三种 :线 分类法、面分类法 、混合分类法 。其 中线分类 法又称层 级分类法、体 系分类法 ;面分类法又称组 配分类法 。 6.2 线 分 类 法 6.2.1 方 法 线 分类法是将分类对象 (即被划分的事物或概念)按所选 定的若干个属性或特征逐次地分成相应 的 若干个层 级的类 目,并排 成一个有层次的 ,逐渐展开 的分类体 系。在这个 分类体 系中 ,被划分 的类 目称 为 上位类 ,划分出 的类 目称 为下位类,由一个类 目直接划分 出来 的下一级各类 目,彼此称为同位类 同位类 类 目之间存 在着并 列关系 ,下位类与上位类类 目之间存在着隶属关系 。 6-2-2 示 例 GB/T 14721.1- 1993《林业 资源分类与代码 森林类 型》是采用线 分类法 ,并用 五位数字代码进行 表示的 。该标 准将森林类型分成 三个层 级 ,第一层级用第一 、二位数字码 表示森林植 被型,第二层级用第 三位数字表示森林 类型组 ,第 三层级用第四 、五位数 字表示森林 类型。部分代码表见表 to 表 1 代 码 类 型 名 称 30000 31600 31611 31612 31613 31800 31811 31812 31813 经 济 林 饮 料 林 茶 叶 林 咖 啡 林 可 可林 鲜 果 林 苹 果 林 梨 树 林 桃 树 林 在表 1中,经 济林 相对 于饮料林 、鲜果林 为上位类 类 目,饮料林 、鲜果林 相对 于经济林 为下位类类
Gs/T 7027- 2002 目,饮料林 、鲜果林是同位类类 目;同理 ,饮料林 相对 于茶叶林、咖啡林、可可林是上位类类 目,茶叶林 、咖 啡 林 、可 可 林 是 饮 料 林 的 下 位类 类 目 ,茶 叶林 、咖 啡 林 、可 可 林 是 同 位 类 类 目 。 6.2.3 要 求 a) 由某 一 上 位 类 划 分 出 的 下 位 类 类 目 的 总范 围应 与 该 上 位 类 类 目范 围 相 等 ; b) 当 某 一 个 上 位 类 类 目划 分成 若 干 个 下 位 类 类 目时 ,应 选 择 同 一 种 划 分 基 准 ; c) 同 位 类 类 目之 间 不 交 叉 、不 重 复 ,并 只 对 应 于 一 个 上 位类 ; d) 分 类 要 依 次 进 行 ,不 应 有 空 层 或 加 层 。 6.3 面 分 类 法 6. 3门 方 法 面 分 类 法 是 将 所 选 定 的分 类 对 象 的 若 干 属 性 或 特 征 视 为 若 干 个 “面 ”,每 个 “面 ”中 又 可 分 成 彼 此 独 立 的若 干个 类 目 。使 用 时 ,可 根 据 需 要 将 这 些 “面 ”中 的类 目组 合 在 一起 ,形 成 一 个 复 合 类 目 。 6. 3.2 示 例 服装的分类可采用面分类法 ,选服装所用材料 、男女式样、服装款式作为三个“面”,每个“面”又可分 成若 干 个 类 目 ,见 表 2 材 料 } 男 式 女 式 纯 棉 纯 毛 中 长 纤 维 表 2 男女式样 月;装款式 一 一 中 山 装 西 服 猎 装 连 衣 裙 使 用时 ,将有 关类 目组配起来 。如纯 毛男式 中山装 ,中长纤维女式西服… …等。 6.1 3 要 求 a) 根据需 要选择分类对象本质 的属性或 特征作为分类对象的各个“面”; b) 不同“面”内的类 目不 应相互交叉 ,也不 能重复出现 ; c) 每个“面”有严格 的固定位置 ; d) “面”的选择 以及位置 的确定 ,根据实 际需要 而定 6.4 混 合 分 类法 混合分类法是将线分类法和 面分类法 组合使用 ,以其 中一 种分类法为主 ,另一种做 补充 的信 息分类 方 法 了 信 息 编 码 的基 本 原 则 了.1 唯一性 在一个 分类编码标准 中,每一个编码对象仅应有一个代 码 ,一个代码 只唯一 表示一个编码对象 了.2 合理性 代 码结 构应 与分类体系相适应 。 了.3 可 扩 充 性 代码应 留有适当的后备容量 ,以便适应不断扩充 的需要 。 7.4 简 明 性 代码结 构应 尽量简单 ,长度 尽量短 ,以便 节省机器存储空间和减少代码 的差错率 7.5 适 用 性 代码应尽 可能反映编码对象 的特点 ,适用于不 同的相关应 用领域,支持系统集成 了.6 规 范 性
GB/'r 7027- 2002 在 一 个 信 息 分 类 编 码 标 准 中 ,代 码 的类 型 ,代 码 的结 构 以及 代 码 的 编 写 格 式 应 当 统 一 。 8 信 息 编 码 的 基 本 方 法 8门 通 则 编码方法应 以预定 的应用需求和编码对象 的性质 为基 础,选择适 当的代码 结构 。在决定代码结构的 过程 中,既要考虑各 种代码的编码规 则,又 要考 虑各种代码 的优 缺点(参见 附录 A),还 要分 析代码的一 般性特征 ,选取合适的代码表现形式 ,研究代码设计所 涉及 的各 种因素 ,避免潜 在的不 良后果。 O U … 门 乙 代 码 类 型 图 1根据代码 的含义 性(参见 8. 3. 2条)给出了各种 常用代码 的类型。 C O Q U n / 艺 顺 序 码 规 则 图 1 从一个有序 的字符集合 中顺序地取 出字符分配 给各个编码对象 。这些 字符通常是 自然数的整数 , 如 以“1”打头 ;也 可以是字母字符 ,如 :AAA,AAB,AAC....... o 8.2.1.2 应 用 顺 序码 一般作为 以标识 或参照为 目的的独立代码来使用 ,或者作为复合代码的一部分来使用 ,后一 种情况 经常附加着分类代码 。 在码位 固定的数字字段 中 ,应使用零填满字段 的位数 直到满足码位的要求 示 例:在 3位数字 字段中 ,数字 1编码为 。01,而数字 15编码为 。150 8.2.1.3 类 型 顺序码 有三种类型 :递增顺序码 、分组顺序码、约定顺序码 。 8.2.1.3门 递增顺序 码 编码对象被 赋予的代码值 ,可由预定数字递增决定 。例 如,预定数字可 以是 1(纯递增型),或者是 10 (只有 10的倍数 可以赋值),或者是其他数 字(如 :偶 数情况下的 2),等等 。 用这种方法 ,代码值不 带有 任何含义。相类似 的编码对象 的代 码值 不作分组。 为 了以后原 始代码集 的修改 ,可能需 要使用 中间的代 码值 ,这些 中间代码 值的赋 值根据 不必按 1 递 增 。 示例 GB/T 2659-2000((世界各 国和地区名称代码 》中,部分 国家和地 区的数 字代码(见表 3),
分享到:
收藏