ICS 01120
A 00
噶日
中 华 人 民 共 和 国 国 家 标 准
GB/T 7027-2002
代替 GB/T 7027-1986
信 息分 类和 编码 的基 本原 则 与方 法
Basic principles and methods for information
classifying and coding
2002一07门 8发 布
2002一12一01实 施
中 华 人 民 共 和 国
国 家 质 量 监 督 检 验 检 疫 总 局
发 布
GB/T 7027- 2002
目
次
前 言 ····························································。·····················································…… 1
引 言 ·······························。··················································································…… N
1 范 围 ·..············································································································… … 1
2 规范性 引用文件 ···················································································.············…… 1
3 术语和定义 ··············································。·······················································…… 1
4 信息的分类与编码 ·····························································································…… 1
4. 1 信息分类 ······································································。·······························…… 1
4. 2 信息编码 ······································································································…… 1
5 信息分类的基本原则 ·············。·······································。····································…… 2
5.1 科 学 性 ····························,····················。·······················································… … 2
5.2 系 统 性 ·········································································································… … 2
5. 3 可扩延性 ······························,·······································,························。······…… 2
5.4 兼容性 ·····························································。···········································…… 2
5. 5 综合实用性 ······················。············································································…… 2
6 信息分类的基本方法 ·············。············································································…… 2
6. 1 概 述 ············································································································… … 2
6.2 线 分类法 ,··,·、 ····、、· 、···· ···、····‘、··‘ ··· ······································一 2
6 3 面 分 类 法 ······································································································… … 3
6.4 混合分类法 ··················································································。···············.…… 3
7 信息编码的基本原则 ···········。·····································。········································…… 3
7. 1 唯 一 性 ················。························································································… … 3
7.2 合理性 ·······················。·。···············································································…… 3
7. 3 可扩充性 ······································································································…… 3
7.4 简 明 性 ·········································································································… … 3
7. 5 适 用 性 ·········································································································… … 3
7. 6 规 范 性 ·······。·································································································… … 3
8 信息编码的基本方法 ··························································································…… 4
8. 1 通 则 ············································································································… … 4
8.2 代 码类型 ····。·································································································…… 4
8. 3 代 码 特 征 ·····································································································… … 7
8.4 代码 表现形 式 ································································································… … 8
8. 5 代 码设计······································································································…… 10
8. 6 代码 赋值约定································································································…… n
附录 A(资料性附录) 各 种信息分类编码方法的优缺点 ················································…… 12
A.1 信息分类方法优缺点 ···················································································.…… 12
A.2 各种类型代码编码方法优缺点 ···················································....·.......·.......…… 12
GB/'r 7027- 2002
前
言
本标准是对 GB/T 7027- 1986《标准化工作 导则 信 息分类编码的基本原则和方法 》的修订 。在信
息编 码部分 内容上 ,本标 准参考 了国际技术报 告 ISO/IEC TR 9789:1994(E)《信息技术— 数据交换
用数据元素组织与表示指 南— 编码方法与原理 》,采纳 了其 中比较 成熟 的相关技术 内容 。
本标 准 代 替 GB/T 7027- 1986《标 准 化 工作 导 则 信 息分 类 编码 的基 本 原 则 和方 法 》 同
GB/T 7027- 1986相比,本次修 订所 作的主要修改是 :
修改 了标准 的名称 。标准名称改为《信息分类和编码的基本原则与方法 》。
标准的总体 编排 和结构按 GB/T 1. 1-200。进行了修改 ,增 加了 目次、前言 、引言和附录 Ao
一 对原标准 的内容进行 r相应的增删 增补 的内容包 括 :第 2章“规 范性引用文件 ”、第 3章“术语
和定 义”和第 4章“信息 的分 类与编码 ”概述 删除的 内容是 原标准 的第 2. 4条“代码 的校验 ”的有关
算 法 。
一一对原标准 的结构 进行了调整 :原标准的第 1. 1条“信息分类的基本原则”调整为第 5章 ,原标 准
的第 1.2条“信息分类的基本方法 ”调整为第 6章 ,原标准的第 2. 2条“编码的基本原则”调 整为第 7章 ,
原标 准的第 2. 3条“代码 的种类 ”和第 2. 5条“代 码的类型 ”与 ISO/IEC TR 9789的相关技术 内容经过
整理共 同构成第 8章“信息编码 的基本方法”,原标 准中分散叙述的各个 信息分类和编码力法 的优缺点
集 中汇总调 整为“附录 A 各种 信息分类编码方法 的优缺点 ”。
一 对 原标准 中的代码名 称进行 了若干项调 整:原标 准中 的“特征 组合码”对应于本标准 的“并置
码”,原标准 中的“复合码 ”对应于木标准 的“组合码”,原标准 中的“数值化字母顺序码”被本标准的“约定
顺序码 ”所涵盖
在信息分类 编码标准化领域 ,本标准应 与GB/丁 20001.3-2001《标准编写规则 第 3部分 :信息分
类编码 》和 GB/T 10113《分类 编码 通用术语 》两项 标准配套应用 。
本标准 的附录 A 是资料性附录 。
本标准 由中国标准研究 中心提出并 归口
本标准 主要 起草单位 :中国标 准研究中心 。
本标准 主要起 草人 李 小林 、冯卫 、胡嘉璋 。
GB/T 7027于 1986年 11月首次发 布,本次修订为第一 次修订。
Gs/T 7027- 2002
引
言
在通常情况下 ,人们对信 息的理解是 :一切有含义 的具 体或抽象事物或 概念的真相 及相 关陈述 ,通
过数据 、消息及其进 一步细节表达出来 。
在信息 分类编码领域 ,信息的表现形式是数据 。
客观 、明确的信息是计 算机建立信息系统 以及数据在其 中进行 交换的先决条件 。
在信息系统 中,数据是用 字符(通 常为数字或字母 )、算 术符号以及描 述来表示 ,这些表示形式 应该
对其所 涉及的每一个数据都有一个 明确 稳定 的含义 ,从 而达到处理 与交流的 目的 。
信息 要被不同用户组 或应用系统所共享 ,就必 须有一致认可 的定 义 ,举 例来说 ,要有概念 的语 义含
义 (内涵)、概念的全部实例 (外延 )以及一致认可的表示法 。
对各 类信息概念 的正 确理 解需要依赖 于信息分类 ;对各类信息作 出一致认可 的表示需要依赖 于信
息 编 码 。
GB/'r 7027-2002
信息分类和编码的基本原则与方法
范 围
本标 准规定了信息分类编码 的基本原则 和方法,适用 于各类信 息分类编码标准的编制
2 规 范 性 引用 文 件
下列 文件中的条款通过本标准 的引用 而成为本标准的条款 。凡是注 日期 的引用文件 ,其 随后所有 的
修改单 (不包括勘误 的内容 )或修订版均不适 用于本标准 ,然 而,鼓励根据本标准达成协议 的各方研究是
否可使用这些文 件的最新版本 。凡是不注 日期的引用文件 ,其最新 版本适用 于本标准。
GB/T 1988-1998 信息技 术 信息交换用七位编码字符 集(eqv ISO/IEC 646:1991)
GB 2312- 198。 信息交换用汉字编码字符集 基本集
GB/T 2260-2002 中华人 民共和国行政区划代码
GB/T 2659- 2000 世界各 国和地区名称代码 (eqv ISO 3166-1:1997)
GB/T 4657-2002 中央党政机关、人民团体及其他机构代码
GB/T 7408-1994 数据 元和交换格式 信息交换 日期 和时间表示 法(eqv ISO 8601:1988)
GB/T 10113 分类编码通用术语
GB 11643--1999 公 民身份号码
GB/T 13745-1992 学科分类与代码
GB/T 14721.1-1993 林业资源分类与代码 森林 类型
GB/T 14805-1993 用 于行政 、商 业 和运输业 电子数据 交换 的应用 级语 法规则 (idt ISO 9735:
1988)
GB/T 17710- 1999 数据处理 校验码 系统 (idtISO 7064:1983)
3 术 语 和 定 义
GB/T 10113中确立 的术 语适 用于本标准 。
4 信 息的分类与编码
4门 信息分 类
信息分类是根据信 息内容的属性或特征 ,将信息按一定的原则和方法进行 区分和 归类 ,并建立起一
定的分类体 系和排列顺 序。
信息分类有两个要 素:一是分类对象 ,二是分类 的依据 。分类对象由若 干个被分类的实体组成 。分
类依 据取决于分类对象 的属性 或特征 。
信息内容属性的相 同或相 异,形成 了各种 不同的类。在信息分类体系中 ,类可称为类 目。
4.2 信 息 编 码
信息编码是将事物或概念 (编码对象 )赋予具有一定规律 、易于计算机和人识别处 理的符号,形成代
码元 素集合 。代码元素集合 中的代码 元素就是赋予编码对象 的符 号,即编码对象 的代 码值 。
所 有类型的信息都能够进行编码 :如关 于产品、人 、国家、货 币、程序 、文件、部件等各种各样 的信息。
信息 编码包含的内容有 :数据表达成代码 的方法 、数据的代码表示形式 、代码元素集合 的赋值 。
信 息编码的主要作用有 :标识 、分类、参照 。
GB/'r 7027-2002
标识的 目的是要把编码对象彼 此区分开 ,在编码 对象的集合范围 内,编码 对象的代码值是其唯一性
标志 ;信息编码 的分类作用实质上是对类进 行标识 ;信息编码 的参 照作 用体现在编码对象的代码值可作
为不同应用系统或应用领 域之 间发生关联的关键字 。
5 信 息分 类 的 基 本 原 则
5门 科学性
宜选择事物或概 念(即分类对象 )最稳定的本质属性或特征作 为分类 的基 础和依 据。
5,2 系 统 性
将选定 的事物 、概念 的属性 或特 征按 一定排列顺序予以系统化 ,并形成一个科学合理的分类体 系。
5.3 可 扩 延 性
通常要设置收容类 目,以保证增加新 的事物或概念时 ,不 打乱已建立的分类体系 ,同时,还应为下级
信息管理系统在本分类 体系的基础上进行延拓细化创造条件 。
5.q 兼容性
应与相关标准 (包括 国际标 准)协调一致 。
5.5 综合 实用性
分类要从系统工程 角度出发 ,把局 部问题放在系统整体中处理 ,达 到系统最优。即在满足系统总任
务 、总要求的前提下 ,尽量满足系统 内各相关单位 的实际需 要
6 信 息 分 类 的 基 本 方 法
6.1 概 述
信息分类 的基 本方法有三种 :线 分类法、面分类法 、混合分类法 。其 中线分类 法又称层 级分类法、体
系分类法 ;面分类法又称组 配分类法 。
6.2 线 分 类 法
6.2.1 方 法
线 分类法是将分类对象 (即被划分的事物或概念)按所选 定的若干个属性或特征逐次地分成相应 的
若干个层 级的类 目,并排 成一个有层次的 ,逐渐展开 的分类体 系。在这个 分类体 系中 ,被划分 的类 目称 为
上位类 ,划分出 的类 目称 为下位类,由一个类 目直接划分 出来 的下一级各类 目,彼此称为同位类 同位类
类 目之间存 在着并 列关系 ,下位类与上位类类 目之间存在着隶属关系 。
6-2-2 示 例
GB/T 14721.1- 1993《林业 资源分类与代码 森林类 型》是采用线 分类法 ,并用 五位数字代码进行
表示的 。该标 准将森林类型分成 三个层 级 ,第一层级用第一 、二位数字码 表示森林植 被型,第二层级用第
三位数字表示森林 类型组 ,第 三层级用第四 、五位数 字表示森林 类型。部分代码表见表 to
表 1
代
码
类 型 名 称
30000
31600
31611
31612
31613
31800
31811
31812
31813
经 济 林
饮 料 林
茶 叶 林
咖 啡 林
可 可林
鲜 果 林
苹 果 林
梨 树 林
桃 树 林
在表 1中,经 济林 相对 于饮料林 、鲜果林 为上位类 类 目,饮料林 、鲜果林 相对 于经济林 为下位类类
Gs/T 7027- 2002
目,饮料林 、鲜果林是同位类类 目;同理 ,饮料林 相对 于茶叶林、咖啡林、可可林是上位类类 目,茶叶林 、咖
啡 林 、可 可 林 是 饮 料 林 的 下 位类 类 目 ,茶 叶林 、咖 啡 林 、可 可 林 是 同 位 类 类 目 。
6.2.3 要 求
a) 由某 一 上 位 类 划 分 出 的 下 位 类 类 目 的 总范 围应 与 该 上 位 类 类 目范 围 相 等 ;
b) 当 某 一 个 上 位 类 类 目划 分成 若 干 个 下 位 类 类 目时 ,应 选 择 同 一 种 划 分 基 准 ;
c) 同 位 类 类 目之 间 不 交 叉 、不 重 复 ,并 只 对 应 于 一 个 上 位类 ;
d) 分 类 要 依 次 进 行 ,不 应 有 空 层 或 加 层 。
6.3 面 分 类 法
6. 3门 方 法
面 分 类 法 是 将 所 选 定 的分 类 对 象 的 若 干 属 性 或 特 征 视 为 若 干 个 “面 ”,每 个 “面 ”中 又 可 分 成 彼 此 独
立 的若 干个 类 目 。使 用 时 ,可 根 据 需 要 将 这 些 “面 ”中 的类 目组 合 在 一起 ,形 成 一 个 复 合 类 目 。
6. 3.2 示 例
服装的分类可采用面分类法 ,选服装所用材料 、男女式样、服装款式作为三个“面”,每个“面”又可分
成若 干 个 类 目 ,见 表 2
材 料
}
男 式
女 式
纯 棉
纯 毛
中 长 纤 维
表 2
男女式样
月;装款式
一
一
中 山 装
西 服
猎 装
连 衣 裙
使 用时 ,将有 关类 目组配起来 。如纯 毛男式 中山装 ,中长纤维女式西服… …等。
6.1 3 要 求
a) 根据需 要选择分类对象本质 的属性或 特征作为分类对象的各个“面”;
b) 不同“面”内的类 目不 应相互交叉 ,也不 能重复出现 ;
c) 每个“面”有严格 的固定位置 ;
d) “面”的选择 以及位置 的确定 ,根据实 际需要 而定
6.4 混 合 分 类法
混合分类法是将线分类法和 面分类法 组合使用 ,以其 中一 种分类法为主 ,另一种做 补充 的信 息分类
方 法
了 信 息 编 码 的基 本 原 则
了.1 唯一性
在一个 分类编码标准 中,每一个编码对象仅应有一个代 码 ,一个代码 只唯一 表示一个编码对象
了.2 合理性
代 码结 构应 与分类体系相适应 。
了.3 可 扩 充 性
代码应 留有适当的后备容量 ,以便适应不断扩充 的需要 。
7.4 简 明 性
代码结 构应 尽量简单 ,长度 尽量短 ,以便 节省机器存储空间和减少代码 的差错率
7.5 适 用 性
代码应尽 可能反映编码对象 的特点 ,适用于不 同的相关应 用领域,支持系统集成
了.6 规 范 性
GB/'r 7027- 2002
在 一 个 信 息 分 类 编 码 标 准 中 ,代 码 的类 型 ,代 码 的结 构 以及 代 码 的 编 写 格 式 应 当 统 一 。
8 信 息 编 码 的 基 本 方 法
8门 通 则
编码方法应 以预定 的应用需求和编码对象 的性质 为基 础,选择适 当的代码 结构 。在决定代码结构的
过程 中,既要考虑各 种代码的编码规 则,又 要考 虑各种代码 的优 缺点(参见 附录 A),还 要分 析代码的一
般性特征 ,选取合适的代码表现形式 ,研究代码设计所 涉及 的各 种因素 ,避免潜 在的不 良后果。
O
U
…
门
乙
代 码 类 型
图 1根据代码 的含义 性(参见 8. 3. 2条)给出了各种 常用代码 的类型。
C
O
Q
U
n
/
艺
顺 序 码
规 则
图 1
从一个有序 的字符集合 中顺序地取 出字符分配 给各个编码对象 。这些 字符通常是 自然数的整数 ,
如 以“1”打头 ;也 可以是字母字符 ,如 :AAA,AAB,AAC....... o
8.2.1.2 应 用
顺 序码 一般作为 以标识 或参照为 目的的独立代码来使用 ,或者作为复合代码的一部分来使用 ,后一
种情况 经常附加着分类代码 。
在码位 固定的数字字段 中 ,应使用零填满字段 的位数 直到满足码位的要求
示 例:在 3位数字 字段中 ,数字 1编码为 。01,而数字 15编码为 。150
8.2.1.3 类 型
顺序码 有三种类型 :递增顺序码 、分组顺序码、约定顺序码 。
8.2.1.3门 递增顺序 码
编码对象被 赋予的代码值 ,可由预定数字递增决定 。例 如,预定数字可 以是 1(纯递增型),或者是 10
(只有 10的倍数 可以赋值),或者是其他数 字(如 :偶 数情况下的 2),等等 。
用这种方法 ,代码值不 带有 任何含义。相类似 的编码对象 的代 码值 不作分组。
为 了以后原 始代码集 的修改 ,可能需 要使用 中间的代 码值 ,这些 中间代码 值的赋 值根据 不必按 1
递 增 。
示例 GB/T 2659-2000((世界各 国和地区名称代码 》中,部分 国家和地 区的数 字代码(见表 3),