一、信用数据标准

由于信用信息的价值就在于促进交易过程当中的信息对称性,因此应该实现最大程度的信用信息的传播。由于信用信息包含的内容极其广泛,从政府信息、行业信息、企业信息、消费者个人信息等等,因此必须建立一套信用数据标准来整合上述信息,实现信息共享。在美国,上述工作主要是由一些信用行业中居于领导地位的大公司所完成的。而在欧洲国家,则是由政府组织,中央银行建设完成的。

在进行数据标准建设的过程当中,发展中国家既要考虑与国际接轨,也要考虑本国的基本情况。因为贸易的日益全球化,与国际标准接轨是必要的也是必须的。但是,由于经济发展水平、文化传统、历史、民族习惯的差异,各个国家的信用状况千差万别。因此反映到数据上也会各有各的特点。为了建立适合本国的信用数据标准,这些特点无疑应该体现出来。

信用数据标准体系的建设应该从三个层面上展开。

第一个层面是信息分类的建设。首先,信用信息按照企业信用信息和消费者信用信息分成两大类。然后,在企业信用信息方面,应该把企业按照行业的不同进行分类。在美国的标准工业编码中,对工业作了如下的分类——农、林、渔和狩猎业;采矿业;公用事业;建筑业;制造业;批发商业;零售商业;交通运输和仓储业;信息产业;金融与保险业;房地产开发和租赁业;科学技术服务业;企业管理业;废弃物品处理业;教育业;医疗卫生业;艺术、娱乐业;餐饮旅馆业;公共服务业等等。在每一个大类下面,有分成若干子类,比如餐饮旅馆业下面有分为两个子行业,旅馆业和餐馆与酒馆业。对于消费者个人的信用信息,则是按照反映一个消费者信用状况的社会经济领域进行分类,比如个人基本信息、职业信息、家庭信息、财产信息、房产信息、法律诉讼信息、信用消费信息、电信消费信息、社会公用事业信息、保险信息、工商信息、税务信息。分类过程当中,要充分考虑银行、统计局、税务机关等重要部门已有的分类系统的结构,尽可能实现与它们的兼容。

完成了第一步的分类建设,下一步是对元数据(metadata)体系的建设。元数据就是描述数据的数据。它的诞生是因为第一数字资源逐渐成为了信息资源的主流,而这些资源的产生、存档、管理和使用都需要新的手段和方法。第二是因为现代化的信息技术带来了海量数据的处理这样一个具有挑战性的需求,元数据为此提供了方便、快捷、有效的数据发现和获取方法。

元数据的功能主要体现在以下几个方面:

1、描述:对特定信息对象,元数据具有描述其内容、属性、特征的作用。从描述这一点看,首先要考察元数据能否准确的区分不同的信息对象;其次,该描述在满足第一条的前提之下足够简单,以尽量小的信息量达到目的。

2、检索:由于元数据时结构化的数据,可以体现信息之间的层次和关系,这就可以帮助用户从不同角度检索所需要的信息。

3、选择:由于元数据具有的属性,可以帮助客户在不浏览信息本身的情况下,按照一定的标准选择过滤所需要的信息。

4、定位:由于元数据是结构化数据,可以通过锁定位置,精确的获得所需的数据。

元数据的设计原则主要有以下几点:

1、简单性与准确性相结合

考虑到使用的方便,元数据体系的设计应该是直观简便的。当然,要把握的重要一点不能牺牲检索的准确程度。因此简单性和准确性的平衡是一定要做到的。

2、符合国际通用的设计标准

元数据体系的设计在国际上已经有了一些比较成功的成果。比如CDWA(Categories for the Description of Works of Art)标准,专门用于描述艺术品。

Dublin Core标准用于描述网络资源等等。我们在设计新的元数据标准时可以参考这些成功案例的优点,使自己站在一个比较高的起点。

3、可扩展性

任何系统的设计都应该为未来的发展预留空间,保持相当的灵活性和可扩展性,以适应不断修改和扩充的需要。

4、符合用户使用需求

在元数据的设计时,用户的使用需求也是一个重要的参考因素。这样才能够更好的发挥其在整合信息方面的作用。

元数据的设计流程主要有以下内容:

1、数据资源分析,对所要研究的数据资源进行认真分析、分类基础上,完成数据资源分析报告,详细阐述数据结构、属性、关系。

2、数据框架的制定,在数据资源分析的基础上,完成数据框架的设计和制定。使得数据框架可以涵盖所研究的数据资源,同时为将来的发展预留相应的扩展空间。

3、细化数据框架当中的每一个集合和元素的属性、标准。

4、提交用户测试经过细化的数据框架,并提交测试报告。

5、将上述成果和测试报告的内容反映到元数据体系当中,对原有体系进行优化。

第三步是编码的设计。信用信息的一个基本作用是针对一个企业或者一个消费者进行征信。因此在信用数据标准当中必须要使所有关于一个个人的信息或者一个企业的信息具有唯一性。那么拿什么来对一个单个信用主体所属的全部信用信息进行标识呢?就产生了编码的设计这个过程。首先编码要满足唯一性,如果一个人有多个身份标识,或者多个人共享一个身份标识,就会从根本上丧失信息的整合性。在满足唯一性的前提之下,为了节省存储的空间和检索的难度,编码应该尽量简短。由于社会的不断信息化,信息的增长会不断加速,编码长度越长,存储和维护的成本就越高。第三,编码不仅仅是一个信用主体的身份标识,还应该存储一些重要的信息。比如从一个人的编码应该可以一眼看出他的性别、出生日期、户籍所在地等重要信息,从一个企业的编码可以一眼看出这个企业所属的行业等等。这样对这些基本信息的存储就不必使用额外的存储空间,直接从编码中获得。第四,编码的兼容性。由于社会信息化的飞速发展,工商管理部门、海关、公安等政府管理部门以及银行、保险公司等金融机构已经为个人和企业建立了一系列身份标识编码。在设计新的编码时,应该充分考虑已有的编码系统,尽量与其实现兼容和可互换,为将来的信息交流铺平道路。第五,编码的可扩展性。由于社会的发展,信息的内容会发生不断的调整,在设计编码时应该考虑为将来的可能的变化预留空间。

发达国家在设计编码体系方面已经有了比较成熟的技术和产品,比如世界著名的邓白氏(D&B)企业数据编码体系。我们在设计的时候可以参考这些成功的经验。

在完成了分类、元数据体系和编码的设计和开发以后,一个整合的信用数据标准体系就基本建设完成了。当然,对于这个体系的维护、改进和扩展是一个循环进行、不断优化的过程。作为标准,一定要维持其稳定性,因此标准的修正必须在稳定运行一个比较长的周期之后进行,因为标准的不稳定必然带来整个信息传播系统的不稳定。同时,标准也必须反映社会的发展,所以应该是稳定性和渐进性相结合。

信用数据标准的建立是信用数据中心和信用数据库建设的前提和基础。有了元数据结构,信用数据库的逻辑结构就已经基本成形了。在综合考虑数据库设计原则、数据库设计标准、系统软硬件资源的基础上,就可以进入信用数据库的设计和建设了。在信用数据标准体系的规范下,海量的信用数据是整合的、结构化的和可管理的。

二、信用数据中心

现代化的信用服务,无论是企业信用服务还是个人信用服务都是建立在对大量信用数据的收集、整理、分析和归纳的基础上的。因此任何现代化的信用公司都必须具备数据收集、保存、传输、整理、分析的技术能力。信用数据中心就是信用公司当中从事以上工作所必备的基础性的专业技术部门。

1、信用数据中心的服务对象和内容

信用数据中心所具有的先进设备、高素质人员、数据量巨大的信用数据库和科学的信用管理数据模型,使得它有能力向企业和个人用户提供包括信用信息服务在内的多项数据增值服务。

(1)金融信息平台的建设方案

包括:在设计和建立商业信用数据中心的过程中所形成的成熟的大型数据库平台的设计和建设方案、信用风险管理系统的设计和实施方案、电信级机房的设计和建设方案、网络系统的设计和建设方案、专业性网络施工和维护队伍的组建方案。

(2)重要数据的托管服务

由于商业信用数据库拥有一个电信级机房所具有的所有核心设备,以及与之相配套的防病毒、防火、防止非法入侵和系统故障的专业工程师队伍和管理系统,它有能力向社会提供高质量、高安全性、高稳定性的数据托管服务。可以为银行、非银行金融机构、大型连锁商业企业、大型制造业企业提供重要商业数据的储存、保管、维护服务,大大节省它们建设自身数据平台所需人力资源、时间和巨额投资。

(3)信用信息的查询服务

储存在商业信用数据库中的丰富的企业数据和个人数据,可以为社会提供详实、快速、高效的信用信息查询服务。无论是想查证一个企业的信用记录,还是一个个人的消费信贷历史,通过申请就可以获得相关资料,在法律允许的范围内真正实现信息的透明化。同时,由于信用数据中心也是一个整合社会各方有关信用信息资源的交换中心,通过它,用户可以获得非常广泛的公开信息资源。