我们都认为C语言是一种非常静态
的语言,几乎没有什么动态特性,同时往往在编译器就决定了整个运行方式,运行期是很难改变其运行状态的。其实C语言也是可以比较动态的,只是由于C语言是一个跨平台兼容语言,每个平台都有不同的实现,其动态化很难统一。这里我们看看在AArch64平台上的动态化实现。
其他语言的动态化
脚本语言是非常具有动态特性的,其中典型的js就可以如下方式动态调用方法。
1 | function hello() { |
平时开发常用的Objc也有一定的动态特性,比如NSInvocation
和
1 | - (id)performSelector:(SEL)aSelector; |
都可以通过方法名称来调用。
那么我们来看看C语言的表现。
C语言的动态化
根据上两篇内容,我们了解了iOS/Mac系统的执行文件格式MachO,而linux常用的ELF也是类似,执行代码都在TEXT
段,如果我们要执行对应的方法,我们只需要拿到对应的地址(也就是函数指针)就行了。
那么如何从字符串找到对应的地址呢?这就涉及到函数符号表了,根据上篇的内容,不难找到其对应的函数指针,这里系统也给我们提供了一个封装好的方法。
1 | NAME |
有了函数指针之后,只需要将我们的参数填入对应位置,我们就可以实现方法调用了。如何填入参数呢?根据之前的讨论和aapcs64ARM官方文档的说明,我们可以按照这种思路去填入参数。
这里我们简单的把所有参数都认为是int64(或者说void *)类型,这样我们可以把以上逻辑简化为:
- 按x0-x7顺序填入寄存器
- 剩下的都放入栈中
这里设计个简单的动态调用接口:
1 | extern void dynamic_call_func_name(const char *func, int64_t argc, int64_t *args) { |
以及测试函数:
1 | void one_arg(int64_t a1); |
那么动态调用可以写作:
1 | int64_t args[] = { |
这样我们就实现了C语言的动态调用了。比如可以从其他端获得方法名和参数列表,就可以直接调用C方法了。这也是一些高级语言调用C语言的实现方式(cpython),以及一些rpc的实现方案。
接下来我们来看看如何填入参数,dynamic_call_func
的实现方式。
动态设置参数
这里我们只能通过汇编来设置参数了。
1 | .align 4 |
经过测试,可以看到所有参数都被正确的传递过去了,说明这种思路是正确的。
总结
那么C语言动态调用能给我们一些什么好处呢。这是一种rpc的思想,而且这不需要额外的rpc支持,就可以直接调用几乎所有C方法,但是这样也给我们的程序带来了一定的风险,包括权限,参数类型等问题。
同时也是快速实现,或者说兼容C实现高级语言的一种方式,比如cpython就是利用了这种思想。
由于不同平台的差异性,可能会导致兼容工作非常庞大,那么我们可以设计几种类型的参数,或者固定几个参数,来简化我们的兼容工作,比如将所有的对象都放到堆上,使用指针来传递。
开源项目libffi实现了多平台的动态调用,有兴趣的人可以自己去了解其实现。