“ 饭店老板算了算饭钱笑着说:小姑凉,一共201块,算你200
小花想了想问道:那我问一下,如果是204块的话,老师你会怎么算?
老板楞了一下:也算你200
小花点点头,那麻烦你再给我一听可乐
老板:???
”
虽然是个笑话,但是现在国人聪明的人太多,像笨叔这么笨的人已经很少见了。
昨天不少小伙伴问笨叔,为啥没有笨9,直接笨10了?
哈哈,这是小秘密
本次点滴,我们继续GNU GCC扩展吧!
01 GCC扩展吧
—
5) 可变参数宏
在GNU C 语言中,宏可以接受可变数目的参数,这个主要运用在输出函数里。
#define pr_debug(fmt, ...)\
dynamic_pr_debug(fmt, ##__VA_ARGS__)
“... ”代表一个可以变化的参数表,__VA_ARGS__ 是编译器保留字段,预处理时把参数传递给宏。当宏的调用展开时,实际参数就传递给dynamic_pr_debug 函数了。
6) 函数属性
GNU C 语言允许声明函数属性(Function Attribute )、变量属性(Variable Attribute )和类型属性(Type Attribute ),以便编译器进行特定方面的优化和更仔细的代码检查。特殊属性语法格式为:
__attribute__((attribute-list))
GNU C 语言里定义的函数属性有很多,如noreturn 、format 以及const 等。另外还可以定义一些和处理器体系结构相关的函数属性,如ARM 体系结构中可以定义interrupt 、isr 等属性,有兴趣的读者可以参阅GCC 的相关文档。
下面是Linux 内核中使用format 属性的一个例子。
int libcfs_debug_msg(structlibcfs_debug_msg_data *msgdata,
const char*format1, ...)
__attribute__ ((format (printf, 2, 3)));
libcfs_debug_msg() 函数里声明了一个format 函数属性,它会告诉编译器按照printf 的参数表的格式规则对该函数参数进行检查。数字2 表示第2 个参数为格式化字符串,数字3 表示参数“... ”里的第一个参数在函数参数总数中排在第几个。
noreturn 属性通知编译器,该函数从不返回值。这让编译器消除不必要的警告信息。比如die 函数,这函数不会返回。
void__attribute__((noreturn)) die(void);
const 属性会让编译器只调用该函数一次,以后再调用时只需要返回第一次结果就可以了,从而提高效率。
static inline u32__attribute_const__ read_cpuid_cachetype(void)
{
return read_cpuid(CTR_EL0);
}
Linux 还有其他一些函数属性,定义在compiler-gcc.h 文件中。
#define __pure __attribute__((pure))
#define __aligned(x) __attribute__((aligned(x)))
#define __printf(a, b) __attribute__((format(printf, a, b)))
#define __scanf(a, b) __attribute__((format(scanf, a, b)))
#define noinline __attribute__((noinline))
#define __attribute_const__ __attribute__((__const__))
#define __maybe_unused __attribute__((unused))
#define __always_unused __attribute__((unused))
7) 变量属性和类型属性
变量属性可以对变量或结构体成员进行属性设置,类型属性常见的属性有alignment 、packed 和sections 等。
alignment 属性规定变量或者结构体成员的最小对齐格式,以字节为单位。
struct qib_user_info {
__u32 spu_userversion;
__u64 spu_base_info;
} __aligned(8);
这个例子中,编译器以8 字节对齐的方式来分配qib_user_info 这个数据结构。
packed 属性可以使变量或者结构体成员使用最小的对齐方式,对变量是以字节对齐,对域(field )是以位对齐的。
struct test
{
char a;
int x[2] __attribute__ ((packed));
};
x 成员使用了packed 属性,它会存储在变量a 后面,所以这个结构体一共占用9 个字节。
8) 内建函数
GNU C 语言提供一系列内建函数进行优化,这些内建函数以“_builtin_ ”作为函数名前缀。下面介绍一些Linux 内核常用的内建函数。
__builtin_constant_p(x) :判断x 是否在编译时就可以确定为常量。如果x 为常量,该函数返回1 ,否则返回0 。
#define __swab16(x) \
(__builtin_constant_p((__u16)(x)) ? \
___constant_swab16(x) : \
__fswab16(x))
__builtin_expect(exp, c) :这里意思是exp==c 的概率很大,用来引导GCC 编译器进行条件分支预测。开发人员知道最可能执行哪个分支,将最有可能执行的分支告诉编译器,让编译器优化指令序列,使指令尽可能地顺序执行,从而提高CPU 预取指令的正确率。
#define LIKELY(x)__builtin_expect(!!(x), 1) //x 很可能为真
#define UNLIKELY(x)__builtin_expect(!!(x), 0) //x 很可能为假
__builtin_prefetch(const void *addr, int rw, int locality) :主动进行数据预取,在使用地址addr 的值之前就把其值加载到cache 中了,减少读取的延迟,从而提高性能。该函数可以接受三个参数,第一个参数addr 表示要预取数据的地址;第二个参数rw 表示读写属性,1 表示可写,0 表示只读;第三个参数locality 表示数据在cache 中的时间局部性,其中0 表示读取完addr 的之后不用保留在cache 中,而1~3 表示时间局部性逐渐增强。如下面的prefetch() 和prefetchw() 函数的实现。
#define prefetch(x)__builtin_prefetch(x)
#define prefetchw(x)__builtin_prefetch(x,1)
下面是使用prefetch() 函数来优化的一个例子。
void __init__free_pages_bootmem(struct page *page, unsigned int order)
{
unsigned int nr_pages = 1 << order;
struct page *p = page;
unsigned int loop;
prefetchw(p);
for (loop = 0; loop < (nr_pages - 1); loop++, p++) {
prefetchw(p + 1);
__ClearPageReserved(p);
set_page_count(p, 0);
}
…
}
在处理struct page 数据之前通过prefetchw() 来先预取到cache 中,从而提升性能。
9) asmlinkage
在标准C 语言中,函数的形参在实际传入参数时会涉及到参数存放问题。对于x86 ,函数参数和局部变量一起分配到函数的局部堆栈里。
#define asmlinkageCPP_ASMLINKAGE __attribute__((regparm(0)))
__attribute__((regparm(0))) :告诉编译器该函数不需要通过任何寄存器来传递参数,只通过堆栈来传递。
对于ARM 来说,函数参数的传递有一套ATPCS 标准,即通过寄存器来传递的。ARM 中的R0~R4 寄存器存放传入参数,当参数超过5 个时多余的参数存放在局部堆栈中。所以,ARM 平台没有定义asmlinkage 。
#define asmlinkageCPP_ASMLINKAGE
#define asmlinkageCPP_ASMLINKAGE
10) UL
在Linux 内核代码中经常会看到一些数字的定义使用了UL 后缀修饰。数字常量会隐形定义为int 类型,两个int 类型相加的结果可能会发生溢出,因此使用UL 强制把int 类型数据转换为unsigned long 类型,这是为了保证运算过程不会因为int 的位数不同而导致溢出。
1 : 表示有符号整型数字1
1UL : 表示无符号长整型数字1