先来了解一个编译器:clang
-
clang是一个由Apple主导编写,基于LLVM的C/C++/OC的编译器 -
主要是用于
底层编译,将一些文件输出成c++文件,例如main.m输出成main.cpp,其目的是为了更好的查看底层的一些结构及实现的逻辑,方便理解底层原理
对象的本质是什么
- 在
main中自定义一个类LCPerson,有一个属性name
@interface LCPerson : NSObject
@property (nonatomic, copy) NSString *name;
@end
@implementation LCPerson
@end
- 通过终端,利用
clang将main.m编译成main.cpp,有以下几种编译命令,这里使用的是第一种
//1、将 main.m 编译成 main.cpp
clang -rewrite-objc main.m -o main.cpp
//2、将 ViewController.m 编译成 ViewController.cpp
clang -rewrite-objc -fobjc-arc -fobjc-runtime=ios-13.0.0 -isysroot / /Applications/Xcode.app/Contents/Developer/Platforms/iPhoneSimulator.platform/Developer/SDKs/iPhoneSimulator13.7.sdk ViewController.m
//以下两种方式是通过指定架构模式的命令行,使用xcode工具 xcrun
//3、模拟器文件编译
- xcrun -sdk iphonesimulator clang -arch arm64 -rewrite-objc main.m -o main-arm64.cpp
//4、真机文件编译
- xcrun -sdk iphoneos clang -arch arm64 -rewrite-objc main.m -o main- arm64.cpp
- 可能会报如下图所示错误:
- 终端执行如下命令,完美解决:
clang -x objective-c -rewrite-objc -isysroot /Applications/Xcode.app/Contents/Developer/Platforms/iPhoneSimulator.platform/Developer/SDKs/iPhoneSimulator.sdk main.m
- 打开编译好的
main.cpp,找到LCPerson的定义,发现LCPerson在底层会被编译成struct 结构体
#ifndef _REWRITER_typedef_LCPerson
#define _REWRITER_typedef_LCPerson
typedef struct objc_object LCPerson;
typedef struct {} _objc_exc_LCPerson;
#endif
extern "C" unsigned long OBJC_IVAR_$_LCPerson$_name;
// 定义的类在底层编译成了结构体
struct LCPerson_IMPL {
struct NSObject_IMPL NSObject_IVARS;
NSString *_name;
};
// @property (nonatomic, copy) NSString *name;
/* @end */
// @implementation LCPerson
// name的get方法
static NSString * _I_LCPerson_name(LCPerson * self, SEL _cmd) { return (*(NSString **)((char *)self + OBJC_IVAR_$_LCPerson$_name)); }
extern "C" __declspec(dllimport) void objc_setProperty (id, SEL, long, id, bool, bool);
// name的set方法
static void _I_LCPerson_setName_(LCPerson * self, SEL _cmd, NSString *name) { objc_setProperty (self, _cmd, __OFFSETOFIVAR__(struct LCPerson, _name), (id)name, 0, 1); }
// @end
结论:OC对象的本质 其实就是 结构体
objc_setProperty 源码探索
除了LCPerson的底层定义,我们发现还有属性 name对应的set和 get 方法,如下图所示,其中set方法的实现依赖于runtime中的objc_setProperty
- 在
objc4-781中全局搜索 objc_setProperty,找到objc_setProperty的源码进行查看
- 进入
reallySetProperty的源码,其原理就是retain新值,release旧值
通过对objc_setProperty的底层源码探索,有以下几点说明:
-
objc_setProperty方法的目的适用于关联上层的set方法以及底层的set方法,其本质就是一个接口 -
这么设计的原因是,上层的
set方法有很多,如果直接调用底层set方法中,会产生很多的临时变量,当你想查找一个sel时,会非常麻烦 -
基于上述原因,苹果采用了
适配器设计模式(即将底层接口适配为客户端需要的接口),对外提供一个接口,供上层的set方法使用,对内调用底层的set方法,使其相互不受影响,即无论上层怎么变,下层都是不变的,或者下层的变化也无法影响上层,主要是达到上下层接口隔离的目的
下图是上层、隔离层、底层之间的关系
cls 与 类 的关联原理
在此之前,先了解什么是联合体,为什么isa的类型isa_t是使用联合体定义
联合体(union)
构造数据类型的方式有以下两种:
-
结构体(struct) -
联合体(union,也称为共用体)
结构体
结构体是指把不同的数据组合成一个整体,其变量是共存的,变量不管是否使用,都会分配内存。
-
优点:存储容量较大,包容性强,且成员之间不会相互影响 -
缺点:所有属性都分配内存,比较浪费内存,假设有4个int成员,一共分配了16字节的内存,但是在使用时,你只使用了4字节,剩余的12字节就是属于内存的浪费
联合体
联合体也是由不同的数据类型组成,但其变量是互斥的,所有的成员共占一段内存。而且共用体采用了内存覆盖技术,同一时刻只能保存一个成员的值,如果对新的成员赋值,就会将原来成员的值覆盖掉
优点:所有成员共用一段内存,使内存的使用更为精细灵活,同时也节省了内存空间
缺点:包容性弱
两者的区别
-
内存占用情况
- 结构体的各个成员会
占用不同的内存,互相之间没有影响 - 共用体的所有成员
占用同一段内存,修改一个成员会影响其余所有成员
- 结构体的各个成员会
-
内存分配大小
- 结构体 内存
>= 所有成员占用的内存总和(成员之间可能会有缝隙) - 共用体 占用的内存
等于最大的成员占用的内存
- 结构体 内存
isa的类型 isa_t
以下是isa指针的类型isa_t的定义,从定义中可以看出是通过联合体(union)定义的。
union isa_t {
isa_t() { }
isa_t(uintptr_t value) : bits(value) { }
Class cls;
uintptr_t bits;
#if defined(ISA_BITFIELD)
struct {
ISA_BITFIELD; // defined in isa.h
};
#endif
};
isa_t类型使用联合体的原因也是基于内存优化的考虑,这里的内存优化是指在isa指针中通过char + 位域(即二进制中每一位均可表示不同的信息)的原理实现。通常来说,isa指针占用的内存大小是8字节,即64位,已经足够存储很多的信息了,这样可以极大的节省内存,以提高性能
从isa_t的定义中可以看出:
-
提供了两个成员,
cls和bits,由联合体的定义所知,这两个成员是互斥的,也就意味着,当初始化isa指针时,有两种初始化方式-
通过
cls初始化,bits 无默认值 -
通过
bits初始化,cls 无默认值
-
-
还提供了一个结构体定义的
位域,用于存储类信息及其他信息,结构体的成员ISA_BITFIELD,这是一个宏定义,有两个版本__arm64__(对应ios 移动端) 和__x86_64__(对应macOS),以下是它们的一些宏定义,如下图所示
-
nonpointer有两个值,表示自定义的类等,占1位-
0:纯isa指针 -
1:不只是类对象地址,isa中包含了类信息、对象的引用计数等
-
-
has_assoc表示关联对象标志位,占1位-
0:没有关联对象 -
1:存在关联对象
-
-
has_cxx_dtor表示该对象是否有C++/OC的析构器(类似于dealloc),占1位- 如果
有析构函数,则需要做析构逻辑 - 如果
没有,则可以更快的释放对象
- 如果
-
shiftclx表示存储类的指针的值(类的地址), 即类信息-
arm64中占33位,开启指针优化的情况下,在arm64架构中有33位用来存储类指针 -
x86_64中占44位
-
-
magic用于调试器判断当前对象是真的对象还是没有初始化的空间,占6位 -
weakly_refrenced是 指对象是否被指向或者曾经指向一个ARC的弱变量- 没有弱引用的对象可以更快释放
-
deallocating标志对象是是否正在释放内存 -
extra_rc表示该对象的引用计数值,实际上是引用计数值减 1- 如果对象的
引用计数为10,那么extra_rc 为 9 - 如果引用计数大于
10, 则需要使用到下面的has_sidetable_rc
- 如果对象的
-
has_sidetable_rc表示 当对象引用计数大于10时,则需要借用该变量存储进位
针对两种不同平台,其isa的存储情况如图所示















网友评论