博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
结构化数据、半结构化数据和非结构化数据
阅读量:6187 次
发布时间:2019-06-21

本文共 908 字,大约阅读时间需要 3 分钟。

结构化数据、半结构化数据和非结构化数据

结构化数据

结构化的数据是指可以使用关系型数据库表示和存储,表现为二维形式的数据。一般特点是:数据以行为单位,一行数据表示一个实体的信息,每一行数据的属性是相同的。举一个例子:

id      name    age     gender1       lyh     12      male2       liangyh 13      female3       liang   18      male

所以,结构化的数据的存储和排列是很有规律的,这对查询和修改等操作很有帮助。但是,显然,它的扩展性不好(比如,我希望增加一个字段,怎么办?)。

半结构化数据

半结构化数据是结构化数据的一种形式,它并不符合关系型数据库或其他数据表的形式关联起来的数据模型结构,但包含相关标记,用来分隔语义元素以及对记录和字段进行分层。因此,它也被称为自描述的结构。

半结构化数据,属于同一类实体可以有不同的属性,即使他们被组合在一起,这些属性的顺序并不重要。

常见的半结构数据有XML和JSON,对于对于两个XML文件,第一个可能有

A
13
female

第二个可能为:

B
male

从上面的例子中,属性的顺序是不重要的,不同的半结构化数据的属性的个数是不一定一样的。有些人说半结构化数据是以树或者图的数据结构存储的数据,怎么理解呢?上面的例子中,<person>标签是树的根节点,<name><gender>标签是子节点。通过这样的数据格式,可以自由地表达很多有用的信息,包括自我描述信息(元数据)。所以,半结构化数据的扩展性是很好的。

非结构化数据

顾名思义,就是没有固定结构的数据。各种文档、图片、视频/音频等都属于非结构化数据。对于这类数据,我们一般直接整体进行存储,而且一般存储为二进制的数据格式。

转载地址:http://rboda.baihongyu.com/

你可能感兴趣的文章
数据结构无向图的深度优先遍历
查看>>
web字体格式及几种在线格式转换工具介绍
查看>>
.Net 如何实现 LINQ~
查看>>
彻底解决:请求被中止: 未能创建 SSL/TLS 安全通道
查看>>
[翻译] ASCScreenBrightnessDetector
查看>>
用GCD线程组与GCD信号量将异步线程转换为同步线程
查看>>
<交流贴>android语音识别之科大讯飞语音API的使用
查看>>
dfs小练 【dfs】
查看>>
Java内存分配全面浅析
查看>>
hdu 4442 Physical Examination 贪心排序
查看>>
5、main方法详解
查看>>
[Javascript] The Array map method
查看>>
重构Web Api程序(Api Controller和Entity) 续篇(2)
查看>>
显著性图谱的评价
查看>>
记一道有意思的算法题Rotate Image(旋转图像)
查看>>
GIT和SVN之间的五个基本区别
查看>>
Objective-C代码学习大纲(6)
查看>>
JS待定···
查看>>
Microsoft Build 2015 汇总
查看>>
ios7 UITableView 分割线在 使用selectedBackgroundView 选中时有些不显示
查看>>