百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术分析 > 正文

C语言,数组循环哪家好,指针or下标?

liebian365 2024-10-30 04:47 26 浏览 0 评论


日常工作中,我们经常会用到循环遍历数组元素。不考虑只能使用某一特定方式的情况下,有人喜欢用数组下标遍历,有人则喜欢用指针遍历。那么这两者是否有性能差异呢?

我们先来看两个例子:

代码一:

/* a.c */
#include <stdio.h>
#include <sys/time.h>

int main(void)
{
    char arr[1024000];
    int i = 0;
    struct timeval begin, end;
    gettimeofday(&begin, NULL);
    for (; i < sizeof(arr); ++i) {
        arr[i] = 'c';
    }
    gettimeofday(&end, NULL);
    printf("%lu(us)\n", (end.tv_sec*1000000+end.tv_usec)-(begin.tv_sec*1000000+begin.tv_usec));
    for (i = 0; i < sizeof(arr); ++i)
        fprintf(stderr, "%c\n", arr[i]);
    return 0;
}

代码很简单,我们定义了一个比较长的字符数组,然后遍历每个元素进行赋值,并统计时长。最后遍历数组输出赋值内容。

我们如下执行命令:

$ gcc -o a a.c
$ ./a 2>/dev/null

那么循环赋值的执行时间如何呢?我取个平均一点的结果:

3227(us)

代码二

/* b.c */
#include <stdio.h>
#include <sys/time.h>

int main(void)
{
    char arr[1024000], *p = arr, *last = arr + sizeof(arr);
    int i;
    struct timeval begin, end;
    gettimeofday(&begin, NULL);
    for (; p < last; ++p) {
        *p = 'c';
    }
    gettimeofday(&end, NULL);
    printf("%lu(us)\n", (end.tv_sec*1000000+end.tv_usec)-(begin.tv_sec*1000000+begin.tv_usec));
    for (p = arr, last = arr+sizeof(arr); p < last; ++p)
        fprintf(stderr, "%c\n", *p);
    return 0;
}

与代码一相似,只是遍历时使用字符指针。

执行如下命令:

$ gcc -o b b.c
$ ./b 2>/dev/null

那么执行时长如何呢?取个平均一点的结果:

2972(us)

两者对比

可以看到,指针遍历的速度似乎比下标要快。但由于时差有些接近,也无法非常肯定,因此我们来看看编译生成的汇编。

#a.c生成的a.s
...
	movl	-4(%rbp), %eax
	cltq
	movb	$99, -1024016(%rbp,%rax)
	addl	$1, -4(%rbp)
.L2:
	movl	-4(%rbp), %eax
	cmpl	$1023999, %eax
...
#b.c生成的b.s
...
	movq	-8(%rbp), %rax
	movb	$99, (%rax)
	addq	$1, -8(%rbp)
.L2:
	movq	-8(%rbp), %rax
	cmpq	-16(%rbp), %rax
...

碍于篇幅,仅列出赋值循环中的部分的汇编代码。

可以看到,a.c(数组下标版本)生成的汇编中在给每个数组元素赋值时需要用数组首地址配合下标计算出要被赋值的单元位置。而b.c(指针版本)则不需要这一步运算。当然还有一个cltq指令的差异,该指令作用是将32位eax有符号扩展到64位。

到此,似乎汇编差异带来的性能差异符合我们刚才看到的时间度量差异。



但是,文章到此并未结束,细心的读者或许会注意到,我们刚才的编译是并未被优化的。那么下面,我们来试试编译优化的结果。

代码一的优化结果

$ gcc -o a a.c -O3
$ ./a 2>/dev/null
549(us)

代码二的优化结果

$ gcc -o b b.c -O3
$ ./b 2>/dev/null
546(us)

对比结果

首先,可以看到优化后的代码执行效率远高于优化前的。

其次,优化后,两段代码的执行时间似乎很相近。我们依旧来看看汇编代码:

#a.c经过O3优化的a.s
...
	leaq	32(%rsp), %rdi
	movl	$1024000, %edx
	movl	$99, %esi
	call	memset
	leaq	16(%rsp), %rdi
	xorl	%esi, %esi
...
#b.c经过O3优化的b.s
...
	leaq	32(%rsp), %rdi
	movl	$1024000, %edx
	movl	$99, %esi
	call	memset
	leaq	16(%rsp), %rdi
	xorl	%esi, %esi
...

你没看错,我也没有写错,经过优化后的代码,循环赋值部分是完全一样的。这也与我们的时间度量结果吻合。



总结

在无编译优化的情况下,数组下标的遍历方式会略慢于指针遍历,是由于数组下标方式在每次循环中需要利用数组首地址和数组下标计算出被使用的数组元素。

在O3优化情况下,编译优化带来的性能提升也是非常可观的,同时,编译优化也一定程度上缩小了遍历方式差异带来的性能差异。虽然O3优化有极个别时候会有指令乱序导致程序执行结果与预期不符的情况,但也是有相应解决方案的。


喜欢的朋友欢迎关注码哥,也可以在下方留言评论。

新年伊始,给大家拜年啦。

感谢观看!

相关推荐

精品博文嵌入式6410中蓝牙的使用

BluetoothUSB适配器拥有一个BluetoothCSR芯片组,并使用USB传输器来传输HCI数据分组。因此,LinuxUSB层、BlueZUSB传输器驱动程序以及B...

win10跟这台计算机连接的前一个usb设备工作不正常怎么办?

前几天小编闲来无事就跑到网站底下查看粉丝朋友给小编我留言询问的问题,还真的就给小编看到一个问题,那就是win10跟这台计算机连接的一个usb设备运行不正常怎么办,其实这个问题的解决方法时十分简单的,接...

制作成本上千元的键盘,厉害在哪?

这是稚晖君亲自写的开源资料!下方超长超详细教程预警!!全文导航:项目简介、项目原理说明、硬件说明、软件说明项目简介瀚文智能键盘是一把我为自己设计的——多功能、模块化机械键盘。键盘使用模块化设计。左侧的...

E-Marker芯片,USB数据线的“性能中枢”?

根据线缆行业的研究数据,在2019年搭载Type-C接口的设备出货量已达到20亿台,其中80%的笔记本电脑和台式电脑采用Type-C接口,50%的智能手机和平板电脑也使用Type-C接口。我们都知道,...

ZQWL-USBCANFD二次开发通讯协议V1.04

修订历史:1.功能介绍1.1型号说明本文档适用以下型号:  ZQWL-CAN(FD)系列产品,USB通讯采用CDC类实现,可以在PC机上虚拟出一个串口,串口参数N,8,1格式,波特率可以根据需要设置(...

win10系统无法识别usb设备怎么办(win10不能识别usb)

从驱动入手,那么win10系统无法识别usb设备怎么办呢?今天就为大家分享win10系统无法识别usb设备的解决方法。1、右键选择设备管理器,如图:  2、点击更新驱动程序,如图:  3、选择浏览...

微软七月Win8.1可选补丁有内涵,含大量修复

IT之家(www.ithome.com):微软七月Win8.1可选补丁有内涵,含大量修复昨日,微软如期为Win7、Win8.1发布7月份安全更新,累计为6枚安全补丁,分别修复总计29枚安全漏洞,其中2...

如何从零开始做一个 USB 键盘?(怎么制作usb)

分两种情况:1、做一个真正的USB键盘,这种设计基本上不涉及大量的软件编码。2、做一个模拟的USB键盘,实际上可以没有按键功能,这种的需要考虑大量的软件编码,实际上是一个单片机。第一种设计:买现成的U...

电脑识别U盘失败?5个实用小技巧,让你轻松搞定USB识别难题

电脑识别U盘失败?5个实用小技巧,让你轻松搞定USB识别难题注意:有些方法会清除USB设备里的数据,请谨慎操作,如果不想丢失数据,可以先连接到其他电脑,看能否将数据复制出来,或者用一些数据恢复软件去扫...

未知usb设备设备描述符请求失败怎么解决

出现未知daousb设备设备描述符请求失du败解决办zhi法如下:1、按下Windows+R打开【运行】;2、在版本运行的权限输入框中输入:services.msc按下回车键打开【服务】;2、在服务...

读《飘》47章20(飘每章概括)

AndAhwouldn'tleaveMissEllen'sgrandchildrenfornotrashystep-patobringup,never.Here,Ah...

英翻中 消失的过去 37(消失的英文怎么说?)

翻译(三十七):消失的过去/茱迪o皮考特VanishingActs/JodiPicoult”我能做什么?“直到听到了狄利亚轻柔的声音,我才意识到她已经在厨房里站了好一会儿了。当她说话的时候,...

RabbitMQ 延迟消息实战(rabbitmq如何保证消息不被重复消费)

现实生活中有一些场景需要延迟或在特定时间发送消息,例如智能热水器需要30分钟后打开,未支付的订单或发送短信、电子邮件和推送通知下午2:00开始的促销活动。RabbitMQ本身没有直接支持延迟...

Java对象拷贝原理剖析及最佳实践(java对象拷贝方法)

作者:宁海翔1前言对象拷贝,是我们在开发过程中,绕不开的过程,既存在于Po、Dto、Do、Vo各个表现层数据的转换,也存在于系统交互如序列化、反序列化。Java对象拷贝分为深拷贝和浅拷贝,目前常用的...

如何将 Qt 3D 渲染与 Qt Quick 2D 元素结合创建太阳系行星元素?

Qt组件推荐:QtitanRibbon:遵循MicrosoftRibbonUIParadigmforQt技术的RibbonUI组件,致力于为Windows、Linux和MacOSX提...

取消回复欢迎 发表评论: