iOS 编译过程的原理和应用

前言

一般可以将编程语言分为两种,编译语言直译式语言

像C++,Objective C都是编译语言。编译语言在执行的时候,必须先通过编译器生成机器码,机器码可以直接在CPU上执行,所以执行效率较高。

像JavaScript,Python都是直译式语言。直译式语言不需要经过编译的过程,而是在执行的时候通过一个中间的解释器将代码解释为CPU可以执行的代码。所以,较编译语言来说,直译式语言效率低一些,但是编写的更灵活,也就是为啥JS大法好。

iOS开发目前的常用语言是:Objective和Swift。二者都是编译语言,换句话说都是需要编译才能执行的。二者的编译都是依赖于Clang + LLVM. 篇幅限制,本文只关注Objective C,因为原理上大同小异。

可能会有同学想问,我不懂编译的过程,写代码也没问题啊?这点我是不否定的。但是,充分理解了编译的过程,会对你的开发大有帮助。本文的最后,会以以下几个例子,来讲解如何合理利用XCode和编译

  • __attribute__
  • Clang警告处理
  • 预处理
  • 插入编译期脚本
  • 提高项目编译速度

对于不想看我啰里八嗦讲一大堆原理的同学,可以直接跳到本文的最后一个章节。


iOS编译

不管是OC还是Swift,都是采用Clang作为编译器前端,LLVM(Low level vritual machine)作为编译器后端。所以简单的编译过程如图

编译器前端

编译器前端的任务是进行:语法分析,语义分析,生成中间代码(intermediate representation )。在这个过程中,会进行类型检查,如果发现错误或者警告会标注出来在哪一行。

编译器后端

编译器后端会进行机器无关的代码优化,生成机器语言,并且进行机器相关的代码优化。iOS的编译过程,后端的处理如下

  • LVVM优化器会进行BitCode的生成,链接期优化等等

  • LLVM机器码生成器会针对不同的架构,比如arm64等生成不同的机器码


执行一次XCode build的流程

当你在XCode中,选择build的时候(快捷键command+B),会执行如下过程

  • 编译信息写入辅助文件,创建编译后的文件架构(name.app)
  • 处理文件打包信息,例如在debug环境下

  • 执行CocoaPod编译前脚本
    • 例如对于使用CocoaPod的工程会执行CheckPods Manifest.lock
  • 编译各个.m文件,使用CompileCclang命令。

通过这个编译的命令,我们可以看到

  • 链接需要的Framework,例如Foundation.framework,AFNetworking.framework,ALiPay.fframework
  • 编译xib文件
  • 拷贝xib,图片等资源文件到结果目录
  • 编译ImageAssets
  • 处理info.plist
  • 执行CocoaPod脚本
  • 拷贝Swift标准库
  • 创建.app文件和对其签名

IPA包的内容

例如,我们通过iTunes Store下载微信,然后获得ipa安装包,然后实际看看其安装包的内容。

  • 右键ipa,重命名为.zip
  • 双击zip文件,解压缩后会得到一个文件夹。所以,ipa包就是一个普通的压缩包。

  • 右键图中的WeChat,选择显示包内容,然后就能够看到实际的ipa包内容了。

二进制文件的内容

通过XCode的Link Map File,我们可以窥探二进制文件中布局。
在XCode -> Build Settings -> 搜索map -> 开启Write Link Map File

开启后,在编译,我们可以在对应的Debug/Release目录下看到对应的link map的text文件。
默认的目录在

例如,我的TargetName是EPlusPan4Phone,目录如下

这个映射文件的主要包含以下部分:

Object files

这个部分包括的内容
– .o 文文件,也就是上文提到的.m文件编译后的结果。
– .a文件
– 需要link的framework

#! Arch: x86_64
#Object files:
[0] linker synthesized
[1] /EPlusPan4Phone.build/EPlusPan4Phone.app.xcent
[2]/EPlusPan4Phone.build/Objects-normal/x86_64/ULWBigResponseButton.o

[1175]/UMSocial_Sdk_4.4/libUMSocial_Sdk_4.4.a(UMSocialJob.o)
[1188]/iPhoneSimulator10.1.sdk/System/Library/Frameworks//Foundation.framework/Foundation

这个区域的存储内容比较简单:前面是文件的编号,后面是文件的路径。文件的编号在后续会用到

Sections

这个区域提供了各个段(Segment)和节(Section)在可执行文件中的位置和大小。这个区域完整的描述克可执行文件中的全部内容。

其中,段分为两种

  • __TEXT 代码段
  • __DATA 数据段

例如,之前写的一个App,Sections区域如下,可以看到,代码段的

__text节的地址是0x1000021B0,大小是0x0077EBC3,而二者相加的下一个位置正好是__stubs的位置0x100780D74。