百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术分析 > 正文

PostgreSQL系列(三):字符串类型操作(一)

liebian365 2024-11-05 11:45 23 浏览 0 评论

上次关于数值类型的介绍太简短了点,介绍几个有意思的操作

  • 幂(^)

注意:计算出来的结果是一个float8的浮点数,也就是double

  • 平方根(|/)

设计者是一个有趣的灵魂,尽可能地在模拟数学当中的平方根符号

注意:这里得到的也是一个float8的浮点数,也就是double

  • 绝对值(@)

我以为会是|值|来表示,没想到直接一个@符号就解决了

注意:@和数值之间至少要留一个空格

还有几个常用的操作,位运算&、|,以及左移<<和右移>>

好了,就补充这么多吧,还有许多函数后面再研究介绍。

接下来看下字符串和日期

字符串

字符串分3种,前面大致介绍过

  • character

简称char,最大存储1个G的数据,定长

  • character varying

简称varchar,最大存储1个G的数据,长度可变

  • text

跟MYSQL中的text是一样的

举一个示例:

默认情况下,字符串会被存储为text类型,我们可以强制转换成其它字符串类型

这里我们可以看到text和varchar的最大存储长度,2147483647。这个值其实可以存储最大2G(准确地说,还有1个字节才到2G),而一般网上说的都是1G,我的PG版本是14,所以大家在学习和工作过程中要尽量自己亲自实践去了解下具体的情况。当然,正常情况下,我们设计系统,单个值存储不到这么大,如果有这么大,我们首先考虑的是能否从业务和系统设计2方面思考优化。

再看下转char

问题来了,1234567变成了1,再看数据类型变成了bpchar,长度为1。那思考一下,char不指定长度,默认长度就是1,那指定长度呢,再看2个测试:

取5个长度

取9个长度

当字符串长度超过char设定长度时,会自动从开头截取指定长度的字符串存储,当字符串长度小于char设定长度时,会在尾部自动补齐缺少的长度个空格

好,接下来再看下与字符串相关的函数,我们在官网上可以查到PG与字符串相关的操作函数和操作符:

首先放上链接,函数和操作符太多,先有个整体浏览:

https://www.postgresql.org/docs/current/functions-string.html

我们只取其中不太好理解的几个函数试下,未详细介绍的基本上跟Java或者C#这些开发语言中字符串提供的功能类似,类比理解一下即可。

  • text || text → text

输入:2个文本

输出:合并后的文本


  • text || anynonarray → text

输入:1个文本和一个非文本

输出:合并后的文本

和日期做拼接:

日期后面再详细介绍,这里了解一下其输出格式即可


  • btrim ( string text [, characters text ] ) → text

输入:第1个为要进行抽取的字符串,第2个为要从第1个字符串中移除的字符串。注意:字符串只去开头和结尾,如果开头和结尾找不到该字符串,则不会移除任何字符串

输出:移除开头和结尾匹配第2个参数后的字符串


  • text IS [NOT] [form] NORMALIZED → boolean

判断一个字符串是不是已经做了特定编码

输入:一个字符串,后面 is normalized是必须的,可以加上not和form表示的特定的编码格式

输出:如果与指定的编码匹配,则返回true,否则返回false

注意: 这个操作只有在服务器编码为UTF-8的情况下才有用,其它情况下返回值没有任何参考意义

说明:form表示的标准化形式有NFC、NFD、NFKC、NFKD,是Unicode 标准化形式的四种不同形式,便于在比较、搜索和其他文本处理任务中能够准确地识别等价字符串。NFC和NFD是一对,NFKC和NFKD是一对,C表示组合,D表示分解,带K表示兼容,这部分需要详细阐述,有机会可以再单独发一篇记录一下

举几个例子先有个印象:


  • bit_length ( text ) → integer

输入:1个文本

输出:文本中包含的位数,注意是位的个数

abc是3个字符,一个字符用8位表示,因此是24位

张三是中文字符,一个字符在PG里面用unicode表示要用3个字节,也就是3*8=24个字节表示,因此总共占用48个位


  • char_length ( text ) → integer

也叫character_length ( text ) → integer

输入:1个文本

输出:字符的个数,不区分中文和字母

包括特殊符号,如@等,也是当作一个字符处理


  • lpad ( string text, length integer [, fill text ] ) → text

输入:第1个为原始文本,第2个为填充后的文本长度,第3个为要填充的文本

输出:长度为第2个参数表示的长度的文本

情形一:如果长度和第1个原始文本的长度要相等,则不做填充操作

情形二:如果长度比原始文本长度小,则将原始文本从右边开始截取,保留长度为第2个参数的字符串

情形三:如果长度比原始文本长,则用第3个填充字符串填充

填充字符串按从左至右的顺序依次循环填充到原始字符串的开头,直到达到第2个参数指定的长度要求,如果要填充的个数不是填充字符串的整数倍,填充方式是从填充字符串的左边开始取满足长度要求的字符串即可

不太好理解,举个例子就明白了

原始长度为2,填充后长度为3,只需要填充一个字符,因此从填充字符串中从左至右取1个字符填充即可,即在开头加一个n


  • ltrim ( string text [, characters text ] ) → text

输入:第1个表示原始文本,第2个表示要从原始文本中抠除的字符集合

输出:抠除原始文本中出现的第2个文本后得到的文本。注意,这里只抠除原始字符串开头的文本,可以和btrim对比看下


  • normalize ( text [, form ] ) → text、

输入:第1个参数表示原始文本,第2个参数表示4个Unicode标准形式(NFC、NFD、NFKC、NFKD),先不详述,与上面的text IS [NOT] [form] NORMALIZED → boolean是一对

输出:转换后标准形式的字符串编码

同样要注意PG服务器的编码是Unicode这个前提


  • octet_length ( text ) → integer

输入:原始文本

输出:文本包含的字节数。与bit_length对比着看下。2个函数的关系就是octet_length * 8 = bit_length


  • octet_length ( character ) → integer

注意与octet_length ( text )在数据类型上的区别,因为character默认是1个字符,我们也只可以指定长度

输入:转换成char类型的原始文本

输出:转换后的文本长度

这里注意:默认时候转换只保留了1个字符,而转换成5个字符的时候,我们前面说过会在尾部填充直到有5个为止.octet_length会识别文本参数的类型是text还是char来决定调用哪个形参的方法


  • overlay ( string text PLACING newsubstring text FROM start integer [ FOR count integer ] ) → text

输入:第1个参数为原始文本,第2个表示原始文本中要进行替换的起始位置,从1开始计算而不是0,第2个表示从替换的起始位置开始要替换的字符个数,第4个表示进行替换的字符串

输出:从开始位置删除指定长度的字串,用填充串替换后得到的新字符串

看示例:

同样,如果填充的个数不是填充字符串的整数倍,会发生什么情况

所以这里不存在lpad的问题,这个函数意思就是,你告诉我原始文本从哪开始,截几个,我把这段文本删除了,换成填充字符串即可


  • position ( substring text IN string text ) → integer

输入:第1个表示要查找的子串,第2个表示原始文本

输出:子串第一次出现的位置,从1开始,如果找不到,返回值为0


  • rpad ( string text, length integer [, fill text ] ) → text

与lpad类似,这文档组织还可以优化,放到lpad下面,读者会更方便看一点。西方的思维方式确实和东方的不太一样。

输入:第1个参数是原始文本,第2个是填充后的文本长度,第3个是填充字符串,

输出:填充后达到指定长度的新字符串,原理参照lpad,这里只举例子:


  • rtrim ( string text [, characters text ] ) → text

与ltrim类似,只不过这里是从后面开始截取

输入:第1个参数表示原始文本,第2个表示要截取的字符串

输出:截取完后的字符串

直接用官方提供的示例,很直接

好了,今天先写这么多,还有不少函数,难倒不是多难,只不过细节多,这也是做软件工程里面特别要注意的一个方面,往往找不到问题的原因就是漏掉或者不清楚某个细节

相关推荐

go语言也可以做gui,go-fltk让你做出c++级别的桌面应用

大家都知道go语言生态并没有什么好的gui开发框架,“能用”的一个手就能数的清,好用的就更是少之又少。今天为大家推荐一个go的gui库go-fltk。它是通过cgo调用了c++的fltk库,性能非常高...

旧电脑的首选系统:TinyCore!体积小+精简+速度极快,你敢安装吗

这几天老毛桃整理了几个微型Linux发行版,准备分享给大家。要知道可供我们日常使用的Linux发行版有很多,但其中的一些发行版经常会被大家忽视。其实这些微型Linux发行版是一种非常强大的创新:在一台...

codeblocks和VS2019下的fltk使用中文

在fltk中用中文有点问题。英文是这样。中文就成这个样子了。我查了查资料,说用UTF-8编码就行了。edit->Fileencoding->UTF-8然后保存文件。看下下边的编码指示确...

FLTK(Fast Light Toolkit)一个轻量级的跨平台Python GUI库

FLTK(FastLightToolkit)是一个轻量级的跨平台GUI库,特别适用于开发需要快速、高效且简单界面的应用程序。本文将介绍Python中的FLTK库,包括其特性、应用场景以及如何通过代...

中科院开源 RISC-V 处理器“香山”流片,已成功运行 Linux

IT之家1月29日消息,去年6月份,中科院大学教授、中科院计算所研究员包云岗,发布了开源高性能RISC-V处理器核心——香山。近日,包云岗在社交平台晒出图片,香山芯片已流片,回片后...

Linux 5.13内核有望合并对苹果M1处理器支持的初步代码

预计Linux5.13将初步支持苹果SiliconM1处理器,不过完整的支持工作可能还需要几年时间才能完全完成。虽然Linux已经可以在苹果SiliconM1上运行,但这需要通过一系列的补丁才能...

Ubuntu系统下COM口测试教程(ubuntu port)

1、在待测试的板上下载minicom,下载minicom有两种方法:方法一:在Ubuntu软件中心里面搜索下载方法二:按“Ctrl+Alt+T”打开终端,打开终端后输入“sudosu”回车;在下...

湖北嵌入式软件工程师培训怎么选,让自己脱颖而出

很多年轻人毕业即失业、面试总是不如意、薪酬不满意、在家躺平。“就业难”该如何应对,参加培训是否能改变自己的职业走向,在湖北,有哪些嵌入式软件工程师培训怎么选值得推荐?粤嵌科技在嵌入式培训领域有十几年经...

新阁上位机开发---10年工程师的Modbus总结

前言我算了一下,今年是我跟Modbus相识的第10年,从最开始的简单应用到协议了解,从协议开发到协议讲解,这个陪伴了10年的协议,它一直没变,变的只是我对它的理解和认识。我一直认为Modbus协议的存...

创建你的第一个可运行的嵌入式Linux系统-5

@ZHangZMo在MicrochipBuildroot中配置QT5选择Graphic配置文件增加QT5的配置修改根文件系统支持QT5修改output/target/etc/profile配置文件...

如何在Linux下给zigbee CC2530实现上位机

0、前言网友提问如下:粉丝提问项目框架汇总下这个网友的问题,其实就是实现一个网关程序,内容分为几块:下位机,通过串口与上位机相连;下位机要能够接收上位机下发的命令,并解析这些命令;下位机能够根据这些命...

Python实现串口助手 - 03串口功能实现

 串口调试助手是最核心的当然是串口数据收发与显示的功能,pzh-py-com借助的是pySerial库实现串口收发功能,今天痞子衡为大家介绍pySerial是如何在pzh-py-com发挥功能的。一、...

为什么选择UART(串口)作为调试接口,而不是I2C、SPI等其他接口

UART(通用异步收发传输器)通常被选作调试接口有以下几个原因:简单性:协议简单:UART的协议非常简单,只需设置波特率、数据位、停止位和校验位就可以进行通信。相比之下,I2C和SPI需要处理更多的通...

同一个类,不同代码,Qt 串口类QSerialPort 与各种外设通讯处理

串口通讯在各种外设通讯中是常见接口,因为各种嵌入式CPU中串口标配,工业控制中如果不够还通过各种串口芯片进行扩展。比如spi接口的W25Q128FV.对于软件而言,因为驱动接口固定,软件也相对好写,因...

嵌入式linux为什么可以通过PC上的串口去执行命令?

1、uboot(负责初始化基本硬bai件,如串口,网卡,usb口等,然du后引导系统zhi运行)2、linux系统(真正的操作系统)3、你的应用程序(基于操作系统的软件应用)当你开发板上电时,u...

取消回复欢迎 发表评论: