百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术分析 > 正文

PostgreSQL中json数据类型详解 post json数据

liebian365 2024-11-05 11:46 17 浏览 0 评论

前言

JSON(JavaScript Object Notation)是一种轻量级的数据交换格式。它基于 ECMAScript(European Computer Manufacturers Association, 欧洲计算机协会制定的js规范)的一个子集,采用完全独立于编程语言的文本格式来存储和表示数据。简洁和清晰的层次结构使得 JSON 成为理想的数据交换语言。 易于人阅读和编写,同时也易于机器解析和生成,并有效地提升网络传输效率。其实JSON作为一种数据规范和标准,在用于接口交换,系统配置,数据存储方面拥有得天独厚的一席之地。

在存储技术已经高速发达的今天,对于json数据的存储和使用,有多种方式。比如在缓存界的一哥Redis,文档数据库的佼佼者MongoDB等等。上述两者的基础数据结构也是JSON,基于json丰富的开发接口和支持。

随着技术和业务的发展,除了上述两者之外,许多传统的关系型数据库,如mysql、PostgreSQL(以下简称PG)等等都开始支持json数据的存储和高效查询。在不增加额外的技术栈学习成本之下,基于统一的数据库库知识来满足日常的业务需求,也是一种合理的技术选型(满足了日常业务即可)。本文重点讲述在PG中关于json类型的介绍,json和jsonb的区别,json和jsonb的基本操作、输出区别、包含测试等内容,让各位对json类型有一个基本直观的认识。理解最基础的数据库操作。

一、PG数据库中JSON的类型

json数据也可以被存储为text,但是 与text数据类型相比,JSON 数据类型的优势在于能强制要求每个被存储的值符合 JSON 规则。也有很多 JSON 相关的函 数和操作符可以用于存储在这些数据类型中的数据。基于text类型的数据,无法直接利用数据库的查询技术来提高查询效率。而且需要在应用程序中进行相关的转换。众所周知,PostgreSQL 提供存储JSON数据的两种类型:json 和 jsonb。

1、json和jsonb的区别

json 和 jsonb数据类型接受几乎完全相同的值集合作为输入。 主要的实际区别之一是效率。json数据类型存储输入文本的精准拷贝,处理函数必须在每 次执行时必须重新解析该数据。而jsonb数据被存储在一种分解好的 二进制格式中,它在输入时要稍慢一些,因为需要做附加的转换。但是 jsonb在处理时要快很多,因为不需要解析。jsonb也支 持索引,这也是一个令人瞩目的优势(言外之意,json类型对索引程度不是特别友好)。

由于json类型存储的是输入文本的准确拷贝,其中可能会保留在语法 上不明显的、存在于记号之间的空格,还有 JSON 对象内部的键的顺序。还有, 如果一个值中的 JSON 对象包含同一个键超过一次,所有的键/值对都会被保留( 处理函数会把最后的值当作有效值)。相反,jsonb不保留空格、不 保留对象键的顺序并且不保留重复的对象键。如果在输入中指定了重复的键,只有 最后一个值会被保留。

2、项目开发中的选择

从数据插入更新处理速度上,json>jsonb。在数据查询性能上jsonb>json。在数据的整体空间占用上,json>jsonb。

因此,通常在一般的技术开发过程中,除非有特别特殊的需要(历史遗留问题等),大多数应用应该 更愿意把 JSON 数据存储为jsonb(通过json函数和函数索引的加持下,jsonb的查询能力得到了大大的增强)。

3、json数据类型

在pg中的json数据类型可以分为:String,Number,boolean,Null。下面给出一个表格,是关于json的基本数据类型和pg数据类型的一个对比和对照。

JSON类型

PG数据类型

说明

String

text

不允许\u0000,如果数据库编码不是 UTF8,非 ASCII Unicode 转义也是这样

Number

Number

不允许NaN 和 infinity值

Boolean

boolean

只接受小写true和false拼写

NULL

SQL NULL是一个不同的概念

这里关于编码有一个需要解释的地方,就是Unicode的转义问题。这里涉及到数据库在创建的时候是不是使用utf-8的编码存储。在json类型的输入函数中,不管数据库 编码如何都允许 Unicode 转义,并且只检查语法正确性(即,跟在\u 后面的四个十六进制位)。但是,jsonb的输入函数更加严格:它不允 许非 ASCII 字符的 Unicode 转义(高于U+007F的那些),除非数据 库编码是 UTF8。jsonb类型也拒绝\u0000(因为 PostgreSQL的text类型无法表示 它),并且它坚持使用 Unicode 代理对来标记位置 Unicode 基本多语言平面之外 的字符是正确的。合法的 Unicode 转义会被转换成等价的 ASCII 或 UTF8 字符进 行存储,这包括把代理对折叠成一个单一字符。

再把文本 JSON 输入转换成jsonb时,RFC 7159描述 的基本类型会被有效地映射到原生的 PostgreSQL类型(如 上表描述)。因此,在合法 jsonb数据的组成上有一些次要额外约束,它们不适合 json类型和抽象意义上的 JSON,这些约束对应于有关哪些东西不 能被底层数据类型表示的限制。尤其是,jsonb将拒绝位于 PostgreSQL numeric数据类型范 围之外的数字,而json则不会。不过,实际上这类问题更可能发生在其他实 现中,因为把 JSON 的number基本类型表示为 IEEE 754 双精度浮点 是很常见的(这也是RFC 7159 明确期待和允许的)。当在这类系 统间使用 JSON 作为一种交换格式时,应该考虑丢失数字精度的风险。

二、PG中json的简单操作

1、基础json数据操作

  1. -- 简单标量/基本值
  2. -- 基本值可以是数字、带引号的字符串、true、false或者null
  3. SELECT '5'::json;

  4. -- 有零个或者更多元素的数组(元素不需要为同一类型)
  5. SELECT '[1, 2, "foo", null]'::json;

  6. -- 包含键值对的对象
  7. -- 注意对象键必须总是带引号的字符串
  8. SELECT '{"name": "张三", "age": 39, "active": false,"sex":"男"}'::json;

  9. -- 数组和对象可以被任意嵌套
  10. SELECT '{"foo": [true, "bar"], "tags": {"a": 1, "b": null}}'::json;

2、json和jsonb输出对比

  1. SELECT '{"bar": "baz", "balance": 7.77, "active":false}'::json;
  2. json
  3. -------------------------------------------------
  4. {"bar": "baz", "balance": 7.77, "active":false}
  5. (1 row)

  6. SELECT '{"bar": "baz", "balance": 7.77, "active":false}'::jsonb;
  7. jsonb
  8. --------------------------------------------------
  9. {"bar": "baz", "active": false, "balance": 7.77}
  10. (1 row)

通过这里输出可以看到,将目标对象作为json输出时,输出结果和输入基本保持一致。 对于第二条语句而言,内容上似乎没有什么太大的变化,但是输出结果的顺序与第一条有明显的区别。

再来看一组有意思的输出,依然是关于jsonb和json的number结果的展示。

  1. SELECT '{"reading": 1.230e-5}'::json, '{"reading": 1.230e-5}'::jsonb;
  2. json | jsonb
  3. -----------------------+-------------------------
  4. {"reading": 1.230e-5} | {"reading": 0.00001230}
  5. (1 row)

很明显的区别是jsonb被数据库的执行引擎给优化了,展示结果与json也不同。

3、jsonb包含测试

在很多的场景中,我们会使用API对两个json进行是否包含的判断,因为在json类型中,使用包含判断也是比较耗费时间的,在pg数据库中,天然提供了数据库层的包含函数,以此来提高查询匹配能力。在jsonb的查询中,使用@>进行包含的查询操作。

  1. -- 右边具有一个单一键值对的对象被包含在左边的对象中:
  2. SELECT '{"product": "PostgreSQL", "version": 9.4, "jsonb": true}'::jsonb @> '{"version": 9.4}'::jsonb;

  3. -- 右边的数组不会被认为包含在左边的数组中,
  4. -- 即使其中嵌入了一个相似的数组:
  5. SELECT '[1, 2, [1, 3]]'::jsonb @> '[1, 3]'::jsonb; -- 得到假

  6. -- 但是如果同样也有嵌套,包含就成立:
  7. SELECT '[1, 2, [1, 3]]'::jsonb @> '[[1, 3]]'::jsonb;

  8. -- 类似的,这个例子也不会被认为是包含:
  9. SELECT '{"foo": {"bar": "baz"}}'::jsonb @> '{"bar": "baz"}'::jsonb; -- 得到假

  10. -- 包含一个顶层键和一个空对象:
  11. SELECT '{"foo": {"bar": "baz"}}'::jsonb @> '{"foo": {}}'::jsonb;

总结

以上就是本文的基本内容,本文首先介绍了通用的json相关知识,然后重点讲述在PG中关于json类型的介绍,json和jsonb的区别,最后以案例的形式详细说明json和jsonb的基本操作、输出区别、包含测试等内容,让各位对json类型有一个基本直观的认识,理解最基础的数据库操作。

相关推荐

4万多吨豪华游轮遇险 竟是因为这个原因……

(观察者网讯)4.7万吨豪华游轮搁浅,竟是因为油量太低?据观察者网此前报道,挪威游轮“维京天空”号上周六(23日)在挪威近海发生引擎故障搁浅。船上载有1300多人,其中28人受伤住院。经过数天的调...

“菜鸟黑客”必用兵器之“渗透测试篇二”

"菜鸟黑客"必用兵器之"渗透测试篇二"上篇文章主要针对伙伴们对"渗透测试"应该如何学习?"渗透测试"的基本流程?本篇文章继续上次的分享,接着介绍一下黑客们常用的渗透测试工具有哪些?以及用实验环境让大家...

科幻春晚丨《震动羽翼说“Hello”》两万年星间飞行,探测器对地球的最终告白

作者|藤井太洋译者|祝力新【编者按】2021年科幻春晚的最后一篇小说,来自大家喜爱的日本科幻作家藤井太洋。小说将视角放在一颗太空探测器上,延续了他一贯的浪漫风格。...

麦子陪你做作业(二):KEGG通路数据库的正确打开姿势

作者:麦子KEGG是通路数据库中最庞大的,涵盖基因组网络信息,主要注释基因的功能和调控关系。当我们选到了合适的候选分子,单变量研究也已做完,接着研究机制的时便可使用到它。你需要了解你的分子目前已有哪些...

知存科技王绍迪:突破存储墙瓶颈,详解存算一体架构优势

智东西(公众号:zhidxcom)编辑|韦世玮智东西6月5日消息,近日,在落幕不久的GTIC2021嵌入式AI创新峰会上,知存科技CEO王绍迪博士以《存算一体AI芯片:AIoT设备的算力新选择》...

每日新闻播报(September 14)_每日新闻播报英文

AnOscarstatuestandscoveredwithplasticduringpreparationsleadinguptothe87thAcademyAward...

香港新巴城巴开放实时到站数据 供科技界研发使用

中新网3月22日电据香港《明报》报道,香港特区政府致力推动智慧城市,鼓励公私营机构开放数据,以便科技界研发使用。香港运输署21日与新巴及城巴(两巴)公司签署谅解备忘录,两巴将于2019年第3季度,开...

5款不容错过的APP: Red Bull Alert,Flipagram,WifiMapper

本周有不少非常出色的app推出,鸵鸟电台做了一个小合集。亮相本周榜单的有WifiMapper's安卓版的app,其中包含了RedBull的一款新型闹钟,还有一款可爱的怪物主题益智游戏。一起来看看我...

Qt动画效果展示_qt显示图片

今天在这篇博文中,主要实践Qt动画,做一个实例来讲解Qt动画使用,其界面如下图所示(由于没有录制为gif动画图片,所以请各位下载查看效果):该程序使用应用程序单窗口,主窗口继承于QMainWindow...

如何从0到1设计实现一门自己的脚本语言

作者:dong...

三年级语文上册 仿写句子 需要的直接下载打印吧

描写秋天的好句好段1.秋天来了,山野变成了美丽的图画。苹果露出红红的脸庞,梨树挂起金黄的灯笼,高粱举起了燃烧的火把。大雁在天空一会儿写“人”字,一会儿写“一”字。2.花园里,菊花争奇斗艳,红的似火,粉...

C++|那些一看就很简洁、优雅、经典的小代码段

目录0等概率随机洗牌:1大小写转换2字符串复制...

二年级上册语文必考句子仿写,家长打印,孩子照着练

二年级上册语文必考句子仿写,家长打印,孩子照着练。具体如下:...

一年级语文上 句子专项练习(可打印)

...

亲自上阵!C++ 大佬深度“剧透”:C++26 将如何在代码生成上对抗 Rust?

...

取消回复欢迎 发表评论: