录音档案的数字化存储
录音档案是一种重要的档案资源。目前,在我国,录音档案主要是录音磁带档案,使用模拟记录方式记录音频信号,声音的频率是从20HZ到20KHZ左右。录音磁带属于磁性载体。磁性载体档案的耐久性除与磁性载体的理化性质有关外,还强烈地依赖记录和重现设备,属于机读档案,即读取其内容必须依赖相应的设备。1996年1月1日,国家档案局颁布了《磁性载体档案的管理与保护规范》,详细地规定了磁性载体档案的保存环境、管理制度以及磁性载体档案的修复等。整体而言,录音磁带档案的保存成本是比较高的。使用录音磁带保存声音档案,即使严格遵守磁性载体档案的保存环境、管理制度,因为使用的是模拟记录方式,为保证其信息长远流传下去,每隔10年需要进行一次复制,这会使声音档案的信息损失10%左右。同时,传统的录音档案存储方式也不利于档案的检索和查阅。
数字音频的发展,使我们可以用数字而不再用模拟的方式表示音频信息。因为对于模拟音频信号,每一次的转录和播放都会对信号产生失真和噪音,这就不可避免地降低了模拟音频信号的质量。与模拟音频相比,数字音频信号先将原始的模拟音频信号转换为二进制数据,再进行处理、存储和发送,在处理时很少会引入噪声,因此减少了音频信号质量降低的几率,可使音质达到CD音质的水平。 数字音频将声音信号用一系列离散数字来描述,它通过对模拟音频信号进行取样和量化取得,对采样后的音频信号进行编码和压缩后可以得到各种格式的数字音频信号。
目前,数字音频的格式很多,其中最流行的标准数字音频格式有mp3、wav、wma、real audio等,这些标准的格式能够以高音质、低采样率对数字音频文件进行压缩。换句话说,采用这些格式处理录音档案并经过应用数字水印技术防篡改后存储在光盘上,相对于传统的方式而言,因为数字音频的复制在理论上不会产生任何衰减,不会产生失真和噪声,能够在音质丢失很小的情况下(人耳根本无法察觉这种音质损失)把文件压缩到更小的程度,因而具有很大的优越性。 另外,数字音频录放设备采用数字电路,其在设计和制造上成本低,且不受温度等因素的影响,极大地增强了可靠性。而且,数字音频的检索和查询方式相对于模拟系统有强大的优势,可以实现声音档案信息管理的自动化和网络化。
总之,在理论和实践上,对档案工作而言,数字音频存储系统有巨大的优势,在成本上和保真性能上都超过模拟系统。以数字记录方式记录声音档案将是今后的发展方向,就是因为数字音频具有模拟音频不可比拟的优势,不易产生信号的损失。今后,随着声音录放设备的数字化,将出现越来越多的数字音频档案。对原有的声音档案进行数字化加工就会成为档案馆工作内容之一。 要注意的是,我们在将原有声音档案转化为数字音频档案的工作中,除了采用一定的安全手段及一定标准的数据格式外,还必须使用数据库技术,建立音频档案数据库,以便于实现音频档案数据查阅和检索。
目前投入使用的数字音频档案数据库,主要是基于文件的多媒体数据库。这种基于文件的多媒体数据库主要形式是超文本(hyper-text)或超媒体(hyper-media),用于多媒体数据库以外部文件的形式存储于硬盘、光盘或网络上的环境。这一方法并不是把实际的多媒体信息存在数据库中,而是将包含多媒体信息文件的名字与位置存入数据库中。因而,在对原有声音档案重新进行整理时,如何对数字音频档案建立满足档案要求的标准数据库,是档案部门今后要探索研究的课题。
如果简单归纳一下对录音档案进行数字化的过程,即1、用嵌入式系统设计一个档案专用设备对现有声音档案进行数字化处理,它采用mp3标准对数字音频进行压缩;2、采用数字水印技术对数字音频档案提供安全手段、防止篡改,保持档案信息的原始性、可靠性和长期可读性;3、采用光盘存储技术将其刻录在光盘上;4、在此基础上按照档案的编目规定建立适当的标准数据库,实现声音档案的数字化管理。
作者:山东省档案局、山东大学信息学院 孙洪鲁 王洪君 石钧
摘自:《中国档案》