优化C语言代码(程序员必读)_编译器再什么时候会优化代码 c-程序员宅基地

技术标签: 语言  c  编译器  delay  优化  数据结构  

1、选择合适的算法和数据结构
      应该熟悉算法语言,知道各种算法的优缺点,具体资料请参见相应的参考资料,有很多计算机书籍上都有介绍。将比较慢的顺序查找法用较快的二分查找或乱序查找法代替,插入排序或冒泡排序法用快速排序、合并排序或根排序代替,都可以大大提高程序执行的效率。.选择一种合适的数据结构也很重要,比如你在一堆随机存放的数中使用了大量的插入和删除指令,那使用链表要快得多。数组与指针语句具有十分紧密的关系,一般来说,指针比较灵活简洁,而数组则比较直观,容易理解。对于大部分的编译器,使用指针比使用数组生成的代码更短,执行效率更高。但是在Keil中则相反,使用数组比使用的指针生成的代码更短。。


2、使用尽量小的数据类型
      能够使用字符型(char)定义的变量,就不要使用整型(int)变量来定义;能够使用整型变量定义的变量就不要用长整型(long int),能不使用浮点型(float)变量就不要使用浮点型变量。当然,在定义变量后不要超过变量的作用范围,如果超过变量的范围赋值,C编译器并不报错,但程序运行结果却错了,而且这样的错误很难发现。
      在ICCAVR中,可以在Options中设定使用printf参数,尽量使用基本型参数(%c、%d、%x、%X、%u和%s格式说明符),少用长整型参数(%ld、%lu、%lx和%lX格式说明符),至于浮点型的参数(%f)则尽量不要使用,其它C编译器也一样。在其它条件不变的情况下,使用%f参数,会使生成的代码的数量增加很多,执行速度降低。

3、使用自加、自减指令
      通常使用自加、自减指令和复合赋值表达式(如a-=1及a+=1等)都能够生成高质量的程序代码,编译器通常都能够生成inc和dec之类的指令,而使用 a=a+1或a=a-1之类的指令,有很多C编译器都会生成二到三个字节的指令。在AVR单片适用的ICCAVR、GCCAVR、IAR等C编译器以上几种书写方式生成的代码是一样的,也能够生成高质量的inc和dec之类的的代码。

4、减少运算的强度
      可以使用运算量小但功能相同的表达式替换原来复杂的的表达式。如下:
(1)、求余运算。
        a=a%8;
可以改为:
        a=a&7;

说明:位操作只需一个指令周期即可完成,而大部分的C编译器的“%”运算均是调用子程序来完成,代码长、执行速度慢。通常,只要求是求2n方的余数,均可使用位操作的方法来代替。

(2)、平方运算
        a=pow(a,2.0);
可以改为:
        a=a*a;

说明:在有内置硬件乘法器的单片机中(如51系列),乘法运算比求平方运算快得多,因为浮点数的求平方是通过调用子程序来实现的,在自带硬件乘法器的AVR 单片机中,如ATMega163中,乘法运算只需2个时钟周期就可以完成。既使是在没有内置硬件乘法器的AVR单片机中,乘法运算的子程序比平方运算的子程序代码短,执行速度快。

如果是求3次方,如:
        a=pow(a,3.0);
更改为:
        a=a*a*a;
则效率的改善更明显。

(3)、用移位实现乘除法运算
        a=a*4;
        b=b/4;
可以改为:
        a=a<<2;
        b=b>>2;

说明:通常如果需要乘以或除以2n,都可以用移位的方法代替。在ICCAVR中,如果乘以2n,都可以生成左移的代码,而乘以其它的整数或除以任何数,均调用乘除法子程序。用移位的方法得到代码比调用乘除法子程序生成的代码效率高。实际上,只要是乘以或除以一个整数,均可以用移位的方法得到结果,如:
        a=a*9
可以改为:
        a=(a<<3)+a

5、循环
(1)、循环语
      对于一些不需要循环变量参加运算的任务可以把它们放到循环外面,这里的任务包括表达式、函数的调用、指针运算、数组访问等,应该将没有必要执行多次的操作全部集合在一起,放到一个init的初始化程序中进行。

(2)、延时函数:
通常使用的延时函数均采用自加的形式:
        void delay (void)
        {
unsigned int i;
        for (i=0;i<1000;i++)
        ;
        }
将其改为自减延时函数:
        void delay (void)
        {
unsigned int i;
            for (i=1000;i>0;i--)
        ;
        }

      两个函数的延时效果相似,但几乎所有的C编译对后一种函数生成的代码均比前一种代码少1~3个字节,因为几乎所有的MCU均有为0转移的指令,采用后一种方式能够生成这类指令。在使用while循环时也一样,使用自减指令控制循环会比使用自加指令控制循环生成的代码更少1~3个字母。但是在循环中有通过循环变量“i”读写数组的指令时,使用预减循环时有可能使数组超界,要引起注意。

(3)while循环和do…while循环
用while循环时有以下两种循环形式:
unsigned int i;
        i=0;
        while (i<1000)
        {
            i++;
        //用户程序
        }
或:
unsigned int i;
        i=1000;
        do
        i--;
        //用户程序
        while (i>0);
      在这两种循环中,使用do…while循环编译后生成的代码的长度短于while循环。

6、查表
      在程序中一般不进行非常复杂的运算,如浮点数的乘除及开方等,以及一些复杂的数学模型的插补运算,对这些即消耗时间又消费资源的运算,应尽量使用查表的方式,并且将数据表置于程序存储区。如果直接生成所需的表比较困难,也尽量在启了,减少了程序执行过程中重复计算的工作量。

7、其它
比如使用在线汇编及将字符串和一些常量保存在程序存储器中,均有利于优化。 

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/her0z/article/details/5396248

智能推荐

Python根据系统信息生成机器码(Windows)_python win机器码-程序员宅基地

文章浏览阅读483次,点赞8次,收藏12次。【代码】Python根据系统信息生成机器码(Windows)_python win机器码

java与设计模式之亨元模式_享元模式是哪一年构思的 site:blog.csdn.net-程序员宅基地

文章浏览阅读1.1k次。原文出处:http://www.cnblogs.com/java-my-life/archive/2012/04/26/2468499.htmlFlyweight在拳击比赛中指最轻量级,即“蝇量级”或“雨量级”,这里选择使用“享元模式”的意译,是因为这样更能反映模式的用意。享元模式是对象的结构模式。享元模式以共享的方式高效地支持大量的细粒度对象。Java中的String类型_享元模式是哪一年构思的 site:blog.csdn.net

在终端开头显示bash:/home/this/catikin_ws/setup.bash:没有那个文件或者目录_bash: /home/hsl/catkin_ws/devel/setup.bash: 没有那个文件-程序员宅基地

文章浏览阅读1.7w次,点赞16次,收藏47次。这是环境配置中的问题。我遇到这个问题是在删除掉几个包以后出现的,只要打开新的终端就会有这样的一些语句。解决方法:$gedit ~/.bashrc #在终端中输入该命令,会进入一个文件文件打开后直接翻到最后面可以找到source ~/catkin_ws/devel/setup.bash将一些重复多余的配置删除就可以了。..._bash: /home/hsl/catkin_ws/devel/setup.bash: 没有那个文件或目录

DVWA文件上传_dvwa靶场文件上传图片-程序员宅基地

文章浏览阅读420次。DVWA文件上传文件上传漏洞,通常是由于对上传文件的mame类型、没有进行严格的过滤、检查,使得攻击者可以通过上传木马,获取服务器的webshell权限,件上传漏洞带来的危害常常是毁灭性的文件上传漏洞的利用是有限制条件的,首先当然是要能够成功上传木马文件,其次上传文件必须能够被执行,最后就是上传文件的路径必须可知的。我们测试的靶场是dvwa,至于怎么搭建可以自行百度。工具:burp,一句话,靶场环境,蚁剑LOW级别漏洞利用1.创建一个txt文件将<?php @eval($_REQUEST_dvwa靶场文件上传图片

vscode插件开发——不同类型文件不同代码提示 & 更多应用场景_vscode如何应用代码提示文件-程序员宅基地

文章浏览阅读1k次。vscode插件开发,针对不同类型文件提供不同的代码提示,代码补全自动导入关联的包/模块,vscode插件开发控制台调试_vscode如何应用代码提示文件

"巴卡斯杯" 中国大学生程序设计竞赛 - 女生专场(重现) HDU 5702_solving order welcome to hdu to take part in the f-程序员宅基地

文章浏览阅读897次。Solving OrderTime Limit: 2000/1000 MS (Java/Others) Memory Limit: 32768/32768 K (Java/Others)Total Submission(s): 9 Accepted Submission(s): 9Problem DescriptionWelcome to HDU to take_solving order welcome to hdu to take part in the first ccpc girls' competiti

随便推点

ABAP OB08维护汇率数据到TCURR的BAPI_bapi_exchangerate_create-程序员宅基地

文章浏览阅读2.1k次。**&&OB08BAPI参数DATA:exch_rateLIKEbapi1093_0OCCURS1WITHHEADERLINE,rettabLIKEbapiret2OCCURS1WITHHEADERLINE.exch_rate-rate_type=ls_item_input-extype...._bapi_exchangerate_create

GSL中的多维最小值_gsl_multimin_fminimizer-程序员宅基地

文章浏览阅读382次。多维最小值本章描述了寻找任意多维函数最小值的函数。本库为各种迭代求最小值器和收敛测试提供了低级组件。用户可以将这些组合起来以实现所需的解决方案,同时提供对算法中间步骤的完全访问。每一类方法都使用相同的框架,因此可以在运行时在最小化器之间切换,而不需要重新编译程序。求最小值器的每个实例都跟踪自己的状态,允许在多线程程序中使用求最小值器。最小值算法可以通过反转函数的符号来实现函数的最大化。头文件gsl_multimin.h包含求最小值函数和相关声明的原型。39.1 概述多维最小值问题要求找到一个_gsl_multimin_fminimizer

shardingjdbc使用中遇到的坑_引入sharding jdbc依赖之后,项目就崩了-程序员宅基地

文章浏览阅读1k次。参考博客: SpringBoot2 整合sharding-jdbc 启动报错,坑多多 - java小奔奔 - 博客园_引入sharding jdbc依赖之后,项目就崩了

KafkaConsumer is not safe for multi-threaded access-程序员宅基地

文章浏览阅读5.2k次。1、关于structed streaming 读取kafka的问题:数据流从kafka过来,根据条件的不同,会被拆分成好几个流式dataFrame,这些流式的DF会进行各种join操作,在这个过程中会随机的触发KafkaConsumer is not safe for multi-threaded access,kafka多线程消费的问题,本程序就只有一个线程,怎么会有多线程消费的问题。在网上..._kafkaconsumer is not safe for multi-threaded access

Latex关键词(key words)的基本格式代码(加粗、斜体、空白行+首段空两格)_latex keyword-程序员宅基地

文章浏览阅读3.1w次,点赞11次,收藏30次。Latex关键词key words的指令(以及空一整行的暴力指令)在用英文写report或reference时keywords是必不可少的。Abstract和keywords这种简单的指令直接套用固定的格式模板就行,根据英文摘要的要求整理一下,以后直接套用就行了。英文摘要首段顶格加粗,然后空一个空白行,空两格,keywords-,斜体加粗比如:首先是加粗{\bf ·····\rm}新的改变我们对Markdown编辑器进行了一些功能拓展与语法支持,除了标准的Markdown编辑器功能,我们增加了_latex keyword

基于python实现resnet_使用dlib中的深度残差网络(ResNet)实现实时人脸识别-程序员宅基地

文章浏览阅读830次。opencv中提供的基于haar特征级联进行人脸检测的方法效果非常不好,本文使用dlib中提供的人脸检测方法(使用HOG特征或卷积神经网方法),并使用提供的深度残差网络(ResNet)实现实时人脸识别,不过本文的目的不是构建深度残差网络,而是利用已经训练好的模型进行实时人脸识别,实时性要求一秒钟达到10帧以上的速率,并且保证不错的精度。opencv和dlib都是非常好用的计算机视觉库,特别是dli..._resnet等 ai视觉算法来完成引导线识别

推荐文章

热门文章

相关标签