什么是原始数据介绍
原始数据是用户数据库中的数据,或者是终端用户所存储使用的各种数据,是未经过处理或简化的数据,这些数据可能是也可能不是机器可读形式。它构成了物理存在的数据。原始数据有多种存在形式,如文本数据,图像数据,音频数据或者几种数据混合存在。
原始数据定义
在数据库中:原始数据又称用户数据,是未经过处理或简化的数据,这些数据可能是也可能不是机器可读形式。它构成了物理存在的数据。在数据库中一般是一几种基本的数据类型存在。
原始数据元数据
元数据是系统数据库中的数据,其主体是数据字典。数据字典是数据库系统中各种描述信息和控制信息的集合。元数据用来是描述其它数据的特性,并提供背景信息和含义的数据。通常,元数据也用于描述数据结构,数据要素,数据的内在关系和其它特征。它还允许数据可被追踪至产生数据的个体。其使用目的在于:识别资源;评价资源;追踪资源在使用过程中的变化;实现简单高效地管理大量网络化数据;实现信息资源的有效发现、查找、一体化组织和对使用资源的有效管理。
原始数据基本类型
字符类型
char 定长字符 最长2000字节
varchar2 可变长度的字符数据类型,最长4000字节
NCHAR 固定长度的字符数据类型,由国际字符语言(national language Support,NLS)字符集字符组成,最长2000字节
LONG 可变长度的字符数据类型 最长2GB
RAW 原始的二进制数据类型,最长2000字节
long raw 原始的二进制数据类型,最长2GB
rawid 数据库中一窜12字节地址,用于定位磁盘上某一行及其所指向的对象
urawid 通用的rawid,用于表,是一种行主键的表示
大对象
blob 大原始二进制对象,最大长度4GB
clob 大字符对象,最大长度4GB
nclob 由NLS字符集字符组成的大字符数据,最长长度4GB
bfile 提供对存储在oracle数据库之外的操作系统文件中的二进制文件访问,最大4GB
日期类型
date 定宽的7字节的日期/时间数据类型,包含7个属性:世纪、年、月、天、小时、分、秒
timestamp 7字节或12字节的定宽日期/时间数据类型,与DATE不同时可以包含小数秒,小数点最多可保留9位
timestamp with time zorn 提供对时区的支持
timestamp with local time zorn 对时区敏感的时间类型
interal year to month 存储年月段,可对date和timestamp类型进行加减运算
interval day to second 存储天/小时/分/秒时间段,支持9位小数秒
数据类型
number)] 范围1~38
精度(precision) 数字中的数字位数
尾数(scale) 小数点右边的数字位
oralce只提供一种数字类型:NUMBER 类型,oracle中存储的所有数字数据多可当作number类型(10g后 支持binary_float,binary_double)。下面数据类型可与ANSI SQL兼容:
float
numberic
decimal
number
integer
int
smallint
double precision
real
原始数据研究方向
原始数据的质量的好坏,对于后期的数据的读取和处理处理有很大的关系,现在对原始数据的研究主要在数据的采取及数据的压缩方面,这方面有很多方法被提出来。例如基 于 提 升 小 波 的SA R原始 数 据 压 缩 算 法属于变换编码,与 直 接编 码 方 法不 同,变换编 码 首 先对 原始 数 据 进行 变 换然 后 量 化编 码 变换系数。变换的 目 的 是 将 空 间 域 像 素阵映射成 不 相关 的、能 量 分 布 紧 凑 的 变 换 系 数 阵。这 时 占少数 的 大的变 换系 数代表 了图 像巾 最主要的能量成 分,占多数 的 小 的变换 系 数 表 示 了 一 些不重要 的细 节分量,通 过量 化 去 除 小 系数所代 表 的细 节分 量,用 少 量的 码 字 来描 述大系 数 所代 表的主要能量从 而 达 到高的 压 缩 比。