问题
OC对象的本质到底是什么?里面到底是什么结构呢?
探索
在探索oc对象本质前,先了解一个编译器:clang
clang
-
clang是一个由Apple主导编写,基于LLVM的C/C++/OC的编译器 - 主要是用于
底层编译,将一些文件输出成c++文件,例如main.m输出成main.cpp,其目的是为了更好的观察底层的一些结构 及 实现的逻辑,方便理解底层原理。
操作指令
//1、将 main.m 编译成 main.cpp
clang -rewrite-objc main.m -o main.cpp
//2、将 ViewController.m 编译成 ViewController.cpp
clang -rewrite-objc -fobjc-arc -fobjc-runtime=ios-13.0.0 -isysroot /Applications/Xcode.app/Contents/Developer/Platforms/iPhoneSimulator.platform/Developer/SDKs/iPhoneSimulator13.7.sdk ViewController.m
//以下两种方式是通过指定架构模式的命令行,使用xcode工具 xcrun
//3、模拟器文件编译
- xcrun -sdk iphonesimulator clang -arch arm64 -rewrite-objc main.m -o main-arm64.cpp
//4、真机文件编译
- xcrun -sdk iphoneos clang -arch arm64 -rewrite-objc main.m -o main-arm64.cpp
代码分析
Step1: 在main中自定义一个类LBHPerson,有一个属性name
@interface LBHPerson : NSObject
@property (nonatomic, copy) NSString *name;
@end
@implementation LBHPerson
@end
step2:打开终端,cd到main.m的文件夹,输入clang指令: clang -rewrite-objc main.m -o main.cpp 将main.m编译成 main.cpp
step3:找到main.cpp中LBHPerson定义相关的代码
//LGPerson的底层编译
struct LBHPerson_IMPL {
struct NSObject_IMPL NSObject_IVARS;
NSString *_name;
};
//NSObject 的底层编译
struct NSObject_IMPL {
Class isa;
};
- 可以直接搜索定义的类名,如:
LBHPerson - 为了保证在
.cpp中找到的代码是对的,可以在LBHPerson类中添加属性重新转成cpp代码,然后比较两份cpp代码,找到类定义的正确的c++代码
总结:
OC对象的本质是结构体,每一个结构体都有一个
Class isa
探究属性get、set方法
isa
从C++源码中得知类中存在一个isa,那么isa又是什么?有什么作用呢?
objc4源码分析
通过alloc --> _objc_rootAlloc --> callAlloc --> _objc_rootAllocWithZone --> _class_createInstanceFromZone方法路径,查找到initInstanceIsa
step1:在objc4源码中找到initInstanceIsa函数
inline void
objc_object::initInstanceIsa(Class cls, bool hasCxxDtor)
{
ASSERT(!cls->instancesRequireRawIsa());
ASSERT(hasCxxDtor == cls->hasCxxDtor());
//调用initIsa函数
initIsa(cls, true, hasCxxDtor);
}
step2:进入initIsa函数
inline void
objc_object::initIsa(Class cls, bool nonpointer, bool hasCxxDtor)
{
ASSERT(!isTaggedPointer());
if (!nonpointer) {
isa = isa_t((uintptr_t)cls);
} else {
ASSERT(!DisableNonpointerIsa);
ASSERT(!cls->instancesRequireRawIsa());
isa_t newisa(0);
#if SUPPORT_INDEXED_ISA
ASSERT(cls->classArrayIndex() > 0);
newisa.bits = ISA_INDEX_MAGIC_VALUE;
// isa.magic is part of ISA_MAGIC_VALUE
// isa.nonpointer is part of ISA_MAGIC_VALUE
newisa.has_cxx_dtor = hasCxxDtor;
newisa.indexcls = (uintptr_t)cls->classArrayIndex();
#else
newisa.bits = ISA_MAGIC_VALUE;
// isa.magic is part of ISA_MAGIC_VALUE
// isa.nonpointer is part of ISA_MAGIC_VALUE
newisa.has_cxx_dtor = hasCxxDtor;
newisa.shiftcls = (uintptr_t)cls >> 3;
#endif
// This write must be performed in a single store in some cases
// (for example when realizing a class because other threads
// may simultaneously try to use the class).
// fixme use atomics here to guarantee single-store and to
// guarantee memory order w.r.t. the class index table
// ...but not too atomic because we don't want to hurt instantiation
isa = newisa;
}
}
- 方法不要找错,找到对应方法名和参数的函数
在initIsa()函数里面,如果是!nonpointer, 通过初始化函数isa_t((uintptr_t)cls)并赋值给isa,否则新建isa_t,并对isa_t的位域里面的变量进行赋初始值
step3:进入isa_t,如果无法跳转进入,则直接全局搜索
union isa_t {
isa_t() { }
isa_t(uintptr_t value) : bits(value) { }
Class cls;
uintptr_t bits;
#if defined(ISA_BITFIELD)
struct {
ISA_BITFIELD; // defined in isa.h
};
#endif
};
这个出现一个新的类型union,联合体。
联合体(union)
构造数据类型的方式有以下两种:
- 结构体(struct)
- 联合体(union,也称为共用体)
结构体
结构体是指把不同的数据组合成一个整体,其变量是共存的,变量不管是否使用,都会分配内存。
-
缺点:所有属性都分配内存,比较浪费内存,假设有4个int成员,一共分配了16字节的内存,但是在使用时,你只使用了4字节,剩余的12字节就是属于内存的浪费 -
优点:存储容量较大,包容性强,且成员之间不会相互影响
联合体
联合体也是由不同的数据类型组成,但其变量是互斥的,所有的成员共占一段内存。而且共用体采用了内存覆盖技术,同一时刻只能保存一个成员的值,如果对新的成员赋值,就会将原来成员的值覆盖掉
-
缺点:包容性弱 -
优点:所有成员共用一段内存,使内存的使用更为精细灵活,同时也节省了内存空间
两者的区别:
-
内存占用情况
结构体的各个成员会占用不同的内存,互相之间没有影响
共用体的所有成员占用同一段内存,修改一个成员会影响其余所有成员 -
内存分配大小
结构体内存 >= 所有成员占用的内存总和(成员之间可能会有缝隙)
共用体占用的内存等于最大的成员占用的内存
isa_t
isa_t类型使用联合体的原因也是基于内存优化的考虑,这里的内存优化是指在isa指针中通过char + 位域(即二进制中每一位均可表示不同的信息)的原理实现。
从isa_t的定义中可以看出:
提供了两个成员,cls 和 bits,由联合体的定义所知,这两个成员是互斥的,也就意味着,当初始化isa指针时,有两种初始化方式
- 通过
cls初始化,bits无默认值 - 通过
bits初始化,cls有默认值
还提供了一个结构体定义的位域,用于存储类信息及其他信息,结构体的成员ISA_BITFIELD,这是一个宏定义,有两个版本 arm64(对应ios 移动端) 和 x86_64(对应macOS),以下是它们的一些宏定义,如下图所示
| 名称 | 内容 | 长度 | 说明 |
|---|---|---|---|
nonpointer |
表示自定义的类等 |
1 |
0:纯isa指针 1:不只是类对象地址,isa中包含了类信息、对象的引用计数等(自定义的类nonpointer为1) |
has_assoc |
关联对象标志 |
1 |
0:没有关联对象 1:存在关联对象 |
has_cxx_dtor |
该对象是否有C++/OC的析构器(类似于dealloc) |
1 | 如果有析构函数,则需要做析构逻辑, 如果没有,则可以更快的释放对象 |
shiftcls |
存储类的指针的值(类的地址) |
arm64中占33位 x86_64中占44位 |
|
magic |
判断当前对象是真的对象还是没有初始化的空间
|
6 | |
weakly_refrenced |
指对象是否被指向 或者 曾经指向一个ARC的弱变量
|
1 | 没有弱引用的对象可以更快释放 |
deallocating |
对象是否正在释放内存
|
1 | |
has_sidetable_rc |
当对象引用计数大于10时,则需要借用该变量存储进位 | 1 | |
extra_rc |
表示该对象的引用计数值
|
arm64中占19位 x86_64中占8位 |
实际上是引用计数值减 1, 例如,如果对象的引用计数为 10,那么 extra_rc 为 9。如果引用计数大于 10, 则需要使用到 has_sidetable_rc
|
针对两种不同平台,其isa的存储情况如图所示
isa存储情况
isa指针 位域分析(0-64)
step1:找到initIsa函数源码(上面已经讲过步骤),打上断点,并将程序执行到isa_t初始化之后
initIsa源码
step2:执行lldb命令,p newisa,得到newisa的信息
通过lldb命令查看newisa
step3:继续执行,走到newisa.bits = ISA_MAGIC_VALUE;下一行
step4:重新执行lldb命令p newisa
重新执行llvm命令
对比step2和step4中llvm命令输出结果,发现isa指针中有一些变化,如下图所示
magic为什么是59?
magic是59是由于将isa指针地址转换为二进制,从47(在x86_64上,因为前面有4个位域,共占用47位,地址是从0开始)位开始读取6位,再转换为十进制,如下图所示
将宏ISA_MAGIC_VALUE对应的16进制数据复制到计算器,转换成二进制数据为:110111
10进制的59转换成二进制为:110111
step5:执行到最后一步,重新执行lldb命令
根据打印结果,cls和shiftcls有了新值, isa指针与cls类成功关联
isa成员值变化
问题:为什么要强制转换成uintptr_t类型?
因为内存的存储不能存储字符串,机器码只能识别 0 、1这两种数字,所以需要将其转换为uintptr_t数据类型,这样shiftcls中存储的类信息才能被机器码理解, 其中uintptr_t是long
问题:为什么需要右移三位,直接赋值不行吗?
因为bits的成员shiftcls不是在起始位置而是在中间位置,低位有三位存储其他信息,所以需要右移3位后开始存储,存到44位满了就停止存储。这样才能准确的存储到类的信息。
isa 与 类 的关联
cls 与 isa 关联原理:isa指针中的shiftcls位域中存储了类信息,其中initInstanceIsa的过程是将 isa 指针 和当前的 类cls 关联起来,有以下几种验证方式:
way1: 通过initIsa方法中的newisa.shiftcls = (uintptr_t)cls >> 3;验证
way2: 通过isa指针地址与ISA_MSAK 的值 & 来验证
way3: 通过runtime的方法object_getClass验证
way4: 通过位运算验证
way1: 通过initIsa方法验证
step1: 在initIsa函数中运行至newisa.shiftcls = (uintptr_t)cls >> 3;
当前的cls为LBHPerson,强制转换成uintptr_t类型后得到 (uintptr_t)cls = 4295000296,然后右移三位得到的数据赋值给shiftcls
cls右移三位
step2: 继续执行,在控制台执行lldb 命令p newisa
会发现cls变成了LBHPerson,shiftcls变成一串数字
截屏2020-11-16 上午11.44.28.png
way2: 通过isa指针地址与ISA_MSAK 的值 & 来验证
step1:在_class_createInstanceFromZone函数的如下位置打上断点
step2:在控制台执行x/4gx obj,得到isa指针的地址0x001d8001000080e9,然后& 上 0x00007ffffffffff8
| 架构 | ISA_MASK的值 |
|---|---|
| arm64 | 0x0000000ffffffff8ULL |
| x86_64 | 0x00007ffffffffff8ULL |
way3: 通过runtime的方法object_getClass验证
step1: main中导入#import <objc/runtime.h>
step2: 通过runtime的api,即object_getClass函数
step3:进入object_getClass函数
step4: 进入getIsa()函数
step5: 进入ISA()函数
截屏2020-11-16 下午12.22.03.png
step6: 在ISA()函数中打上断点,等程序执行到此处,在控制台调用lldb命令
way4: 通过位运算
step1: 在_class_createInstanceFromZone函数的如下位置打上断点
step2:找到isa指针地址
step3: 我们要先了解isa指针的位域,其中shiftcls存储的是类信息,位置为(3,44)
- 将
isa地址右移3位,p 0x001d8001000080e9 >> 3,得到1037939513495581 - 将
1037939513495581左移20位,p 1037939513495581 << 20,得到562954278797312 - 将
562954278797312右移17位,p 562954278797312 >> 17,得到4295000296 -
po 4295000296得到LBHPerson














网友评论