o0xmuhe's blog

Chromium based browser/Webview启用--js-flags

2023-09-08T09:44:55.000Z

背景

因为工作需求要去验证一些PoC，而很多PoC需要开natives-syntax才能跑，如果转成纯JS实现又需要花更多时间，所以需要在Android的app/webview里也实现添加 js-flags，方便后面搞分析 :)

PC

PC上比较简单没啥好说的，直接命令行传递参数就行

1	./chrome --js-flags="--allow-natives-syntax"

Android

相关的代码，可以知道参数配置的文件相关情况

具体的操作步骤:

chrome://flags里开启Enable command line on non-rooted devices
把启动参数写到 /data/local/tmp 下，文件名固定

1	echo "chrome --js-flags=\"--expose-gc --allow-natives-syntax\"" > /data/local/tmp/chrome-command-line

然后就可以验证PoC了

Webview

系统webview

https://developer.android.com/develop/ui/views/layout/webapps/debugging#java

主要是依赖这个 DevTools来做的，参考:https://chromium.googlesource.com/chromium/src/+/HEAD/android_webview/docs/developer-ui.md

1	am start -a "com.android.webview.SHOW_DEV_UI"

这样看到的flags配置，并没有开启命令行选项的配置，这个和浏览器不太一样，参考：

https://chromium.googlesource.cm/chromium/src/+/HEAD/android_webview/docs/commandline-flags.md

文件路径是 /data/local/tmp/webview-command-line

FLAG_FILE=/data/local/tmp/webview-command-line
# Overwrite flags (supports multiple). The first token is ignored. We use '_'
# as a convenient placeholder, but any token is acceptable.
adb shell "echo '_ --highlight-all-webviews --force-enable-metrics-reporting' > ${FLAG_FILE}"
# Clear flags
adb shell "rm ${FLAG_FILE}"
# Print flags
adb shell "cat ${FLAG_FILE}"

这样不太行，所以考虑直接frida hook，要注意因为加载目标类在webview的dex中，所以需要遍历classloader找到对应的classloader去钩目标类

Java.perform(function () {
    Java.enumerateClassLoaders({
        onMatch: function (loader) {
            try {
                if(loader.findClass("org.chromium.base.CommandLine")){
                    console.log("[+]Successfully found loader")
                    console.log(loader);
                    Java.classFactory.loader = loader;
                    let CommandLine = Java.use("org.chromium.base.CommandLine");
                    CommandLine.nativeInit.implementation = function(...args){
                                this.nativeInit(...args);
                                this.nativeAppendSwitchWithValue("--js-flags", "--allow-natives-syntax");
                    }
                }
            }
            catch(error){
                console.log("[!]Find error:" + error)
            }
        },
        onComplete: function () {
            console.log("[+]onComplete");
        }
    });
});

完整脚本: https://gist.github.com/o0xmuhe/98299328206820d2c55a7f44d300cdc0

APP自己实现的webview

和系统的webview做法一样, 找到合适的位置直接hook CommandLine 就行, 不同厂商做法不太一样,这个需要自己逆向一下

参考

https://juejin.cn/post/6847902219757420552
https://developer.android.com/develop/ui/views/layout/webapps/debugging#java

批量运营CodeQL Cli扫描结果(简易版)

2023-05-11T13:14:08.000Z

背景&目标

CodeQL Cli适合批量做扫描，但是扫描结果并不适合直接做批量的运营，仅适合一些实锤的问题，对于一些还需要人工处理判断的结果就不太适合了(要看源码、调用上下文)；如果使用VSCode插件来做，也只是单条规则扫单个/多个数据库，结果倒是很友好，点点点就能读代码来分析了，所以这种用法不适合批量的query扫描。

如果付费的话自然是可以解决了，可以在CI/CD中集成，就方便多了 -。- 但是对于个人使用者来说不太现实，所以我就想用一个简单的办法来实现这个目的

CodeQL cli批量扫描结束后，导入数据库+历史query结果，直接在vscode里运营结果，流程为：

1	CI/CD 扫描 ---> 结果(数据库+扫描结果) ---> 导入VSCode运营

目标拆解

批量导入数据库，而不是通过GUI点点点导入
导入扫描结果，历史query不要清理，为的是把cli的扫描结果导入对应目录之后可以直接在CodeQL的query history中看到

工作流程

批量导入数据库

查看日志，猜测是类似的做法，解析某个配置文件，然后导入，所以要么修改文件，要么直接把数据库目录copy过去就行

Initializing database manager.
Found 1 persisted databases: file:///home/muhe/Work/codeql_multi_work/XNU-revision-2018-October-28--14-31-48
Initializing database panel.
Initializing evaluator log viewer.
Initializing query history manager.
Initializing results panel interface

存储位置

/**
 * databases.ts
 * ------------
 * Managing state of what the current database is, and what other
 * databases have been recently selected.
 *
 * The source of truth of the current state resides inside the
 * `DatabaseManager` class below.
 */

/**
 * The name of the key in the workspaceState dictionary in which we
 * persist the current database across sessions.
 */
const CURRENT_DB = "currentDatabase";

/**
 * The name of the key in the workspaceState dictionary in which we
 * persist the list of databases across sessions.
 */
const DB_LIST = "databaseList";

导出信息就能看到了，所以直接改数据库就能添加多个数据库了

/home/muhe/.config/Code/User/workspaceStorage/693bdf324f8bd69cec87e06d65e8d000/state.vscdb

{
    "databaseList": [
        {
            "uri": "file:///home/muhe/Work/codeql_multi_work/XNU-revision-2018-October-28--14-31-48",
            "options": {
                "ignoreSourceArchive": false,
                "dateAdded": 1684233047172,
                "language": "cpp"
            }
        }
    ],
    "currentDatabase": "file:///home/muhe/Work/codeql_multi_work/XNU-revision-2018-October-28--14-31-48"
}

尝试直接修改这个数据库就可以批量导入了，不需要挨个点点点了 :)

导入扫描结果

`query-history`

扫描结果的导入是有个json文件描述的

Reading query history
Reading cached query history from '/home/muhe/.config/Code/User/workspaceStorage/693bdf324f8bd69cec87e06d65e8d000/GitHub.vscode-codeql/workspace-query-history.json'.
Successfully finished extension initialization.
CodeQL extension version: 1.8.4 
CodeQL CLI version: 2.13.1 
Platform: linux x64

我这里随意跑了两个Query，查看这个文件可以看到这两次记录:

{
  "version": 2,
  "queries": [
    {
      "initialInfo": {
        "queryText": "/**\n * @name Empty block\n * @kind problem\n * @problem.severity warning\n * @id cpp/example/empty-block\n */\n\nimport cpp\n \nfrom BlockStmt b\nwhere b.getNumStmt() = 0\nselect b, \"This is an empty block.\"\n",
        "isQuickQuery": false,
        "isQuickEval": false,
        "queryPath": "/home/muhe/Tools/vscode-codeql-starter/codeql-custom-queries-cpp/example.ql",
        "databaseInfo": {
          "databaseUri": "file:///home/muhe/Work/codeql_multi_work/XNU-revision-2018-October-28--14-31-48",
          "name": "XNU-revision-2018-October-28--14-31-48"
        },
        "start": "2023-05-16T10:44:25.321Z",
        "id": "example.ql-g8Dji9oz8xqxh-XoF96jF"
      },
      "t": "local",
      "evalLogLocation": "/home/muhe/.config/Code/User/globalStorage/github.vscode-codeql/queries/example.ql-DQ3x1MPMGzVEtt7SAYjJ9/evaluator-log.jsonl",
      "evalLogSummaryLocation": "/home/muhe/.config/Code/User/globalStorage/github.vscode-codeql/queries/example.ql-DQ3x1MPMGzVEtt7SAYjJ9/evaluator-log.summary",
      "completedQuery": {
        "query": {
          "querySaveDir": "/home/muhe/.config/Code/User/globalStorage/github.vscode-codeql/queries/example.ql-DQ3x1MPMGzVEtt7SAYjJ9",
          "dbItemPath": "/home/muhe/Work/codeql_multi_work/XNU-revision-2018-October-28--14-31-48",
          "databaseHasMetadataFile": true,
          "metadata": {
            "name": "Empty block",
            "kind": "problem",
            "problem.severity": "warning",
            "id": "cpp/example/empty-block"
          },
          "resultsPaths": {
            "resultsPath": "/home/muhe/.config/Code/User/globalStorage/github.vscode-codeql/queries/example.ql-DQ3x1MPMGzVEtt7SAYjJ9/results.bqrs",
            "interpretedResultsPath": "/home/muhe/.config/Code/User/globalStorage/github.vscode-codeql/queries/example.ql-DQ3x1MPMGzVEtt7SAYjJ9/interpretedResults.sarif"
          }
        },
        "result": {
          "runId": 0,
          "queryId": 0,
          "resultType": 0,
          "evaluationTime": 11424,
          "message": "finished in 11 seconds"
        },
        "successful": true,
        "message": "finished in 11 seconds",
        "resultCount": 1461,
        "sortedResultsInfo": {}
      }
    },
    {
      "initialInfo": {
        "queryText": "/**\n * @name Empty block\n * @kind problem\n * @problem.severity warning\n * @id cpp/example/empty-block\n */\n\nimport cpp\n \nfrom BlockStmt b\nwhere b.getNumStmt() = 0\nselect b, \"This is an empty block.\"\n",
        "isQuickQuery": false,
        "isQuickEval": false,
        "queryPath": "/home/muhe/Tools/vscode-codeql-starter/codeql-custom-queries-cpp/example.ql",
        "databaseInfo": {
          "databaseUri": "file:///home/muhe/Work/codeql_multi_work/XNU-revision-2018-October-28--14-31-48",
          "name": "XNU-revision-2018-October-28--14-31-48"
        },
        "start": "2023-05-16T10:45:23.082Z",
        "id": "example.ql-2I3wLwL9OlUi_h2VbLFuj"
      },
      "t": "local",
      "evalLogLocation": "/home/muhe/.config/Code/User/globalStorage/github.vscode-codeql/queries/example.ql-tPeM-xPnZG3MkZC0duLSE/evaluator-log.jsonl",
      "evalLogSummaryLocation": "/home/muhe/.config/Code/User/globalStorage/github.vscode-codeql/queries/example.ql-tPeM-xPnZG3MkZC0duLSE/evaluator-log.summary",
      "completedQuery": {
        "query": {
          "querySaveDir": "/home/muhe/.config/Code/User/globalStorage/github.vscode-codeql/queries/example.ql-tPeM-xPnZG3MkZC0duLSE",
          "dbItemPath": "/home/muhe/Work/codeql_multi_work/XNU-revision-2018-October-28--14-31-48",
          "databaseHasMetadataFile": true,
          "metadata": {
            "name": "Empty block",
            "kind": "problem",
            "problem.severity": "warning",
            "id": "cpp/example/empty-block"
          },
          "resultsPaths": {
            "resultsPath": "/home/muhe/.config/Code/User/globalStorage/github.vscode-codeql/queries/example.ql-tPeM-xPnZG3MkZC0duLSE/results.bqrs",
            "interpretedResultsPath": "/home/muhe/.config/Code/User/globalStorage/github.vscode-codeql/queries/example.ql-tPeM-xPnZG3MkZC0duLSE/interpretedResults.sarif"
          }
        },
        "result": {
          "runId": 0,
          "queryId": 0,
          "resultType": 0,
          "evaluationTime": 31,
          "message": "finished in 0 seconds"
        },
        "successful": true,
        "message": "finished in 0 seconds",
        "resultCount": 1461,
        "sortedResultsInfo": {}
      }
    }
  ]
}

所以把query结果按照这个格式填进去就行了。

配置文件中需要的CodeQL cli信息获取

❯ tree -L 1 .
.
├── evaluator-log-end.summary
├── evaluator-log.jsonl
├── evaluator-log.summary
├── evaluator-log.summary.map
├── interpretedResults.sarif
├── query.log
├── results.bqrs
├── results.dil
└── timestamp

经过测试，运营只需要扫描结果就行，其他的可以忽略

Evaluator Log 相关可以不要
DIL 也可以不要，可以用于query调优啥的，我们只运营结果就不考虑了

FYI: 其他的文件(log、dil等)是为了下面菜单中展示的功能做的：

批量query & 导入结果分析

一般来说，我们会使用到开源的规则以及自己写的规则，如果有一定的积累的话，自己的规则可以搞成一个qlpack，方便后面对新目标的快速分析或者批量查找问题。

通用规则/开源规则

第一种情况，可以利用下面的命令，批量跑特定的规则集

# muhe @ muhe-NUC11PAHi5 in ~/Tools/vscode-codeql-starter/ql/cpp/ql/src/codeql-suites on git:codeql-cli/latest o [18:53:36]
$ tree -L 1 .
.
|-- cpp-code-scanning.qls
|-- cpp-lgtm-full.qls
|-- cpp-lgtm.qls
|-- cpp-security-and-quality.qls
|-- cpp-security-experimental.qls
|-- cpp-security-extended.qls
`-- exclude-slow-queries.yml

0 directories, 7 files

比如我们尝试使用cpp-security-and-quality.qls这个规则集跑老版本的XNU作为演示

codeql database run-queries --ram=16384 --threads=12 XNU-revision-2018-October-28--14-31-48  --min-disk-free=1024 -v ~/Tools/vscode-codeql-starter/ql/cpp/ql/src/codeql-suites/cpp-security-and-quality.qls

FYI: 可以使用 codeql resolve queries ~/Tools/vscode-codeql-starter/ql/cpp/ql/src/codeql-suites/cpp-security-and-quality.qls --format=text 获取这个规则集包含了哪些query

特有规则

第二种就使用规则仓库中PICO的pack就行，或者直接指定一个qls扫，就是类似的做法了，比如可以自己搞一个qlpack：

1	codeql database run-queries --ram=16384 --threads=8 --min-disk-free=1024 -- [database] [qlpack]

结果处理

对于这种跑query的方式，如果不指定输出，默认结果会放在数据库的 results目录下，比如:

所以可以写个脚本

修改state.vscdb，批量把codeql db导入
修改query-history文件，把扫描结果导入

最终效果

最终实现的效果如下 :)

FYI: 两个关键文件的路径不同平台下大同小异:

if 'macOS' in current_platform:
    globalStorage = f'{os.getenv("HOME")}/Library/Application Support/Code/User/globalStorage'
    workspaceStorage = f'{os.getenv("HOME")}/Library/Application Support/Code/User/workspaceStorage'
elif 'Linux' in current_platform:
    globalStorage = f'{os.getenv("HOME")}/.config/Code/User/globalStorage'
    workspaceStorage = f'{os.getenv("HOME")}/.config/Code/User/workspaceStorage'
elif 'Windows' in current_platform:
    globalStorage = f'{os.getenv("APPDATA")}\\Code\\User\\globalStorage'
    workspaceStorage = f'{os.getenv("APPDATA")}\\Code\\User\\workspaceStorage'
else:
    # error

参考

最近看过的议题&文章(Bootloader/TZ)

2022-12-31T08:27:16.000Z

背景

最近看了一些Bootloader&TZ以及相关的议题，主要是ARM架构下的内容；正好这几个月我的Leader领着我们组一起学习ARMv8&v9架构相关的知识，在阅读这些材料的时候给我提供了不少的帮助，让我理解起来更加容易，也算是变相检验学习成果咯。

于是我便有了这样的感慨 :)

Security Boot & Bootloader相关

没看完的材料就是TBD的状态 :(

没钥匙也要拧开BOOTLOADER的锁 - Guanxing Wen, ISC, 2017
厂商在ABL里增加unlock bl验证逻辑，针对这部分的安全性研究
启动链脆弱性分析 - Guanxing Wen, ISC, 2018
三星的安全启动分析，攻击TZ实现绕过锁屏码; reference里 @NWMonster 三星的分析和利⽤ 我也没找到:( 可惜
EL3 Tour: Get The Ultimate Privilege of Android Phone - Guanxing Wen, Infiltrate, 2019
华为的安全启动探究，利用bootrom漏洞实现打破信任链，从而实现拿到EL1、EL3的权限，然后攻击TEE，非常精彩的议题；需要ARMv8架构相关的知识，理解起来会更轻松 :)
Checkmate Mate30 - Slipper & Guanxing Wen, MOSEC, 2021
华为Mate30的BootROM漏洞挖掘&利用，和之前EL3 Tour那个类似；但是华为通过OTA修了这个洞也是很神奇，~~不知道是不是用的ARM FPB特性做的~~
MediAttack - break the boot chain of MediaTek SoC - neoni, MOSEC, 2022
MTK安全启动分析以及BootROM漏洞挖掘&利用，打破信任链后可以实现对任意分区读写、解密数据等，配合mtk-bypass阅读体验更好
How To Tame Your Unicorn - Daniel Komaromy & Lorant Szabo, Black Hat USA, 2021
打华为的基带，顺带BootROM的漏洞，配合白皮书阅读体验更佳
Test Point Break: Analysis of Huawei’s OTA Fix For BootROM Vulnerabilities - Taszk Lab, 2021
How to Tame Your UnicornBH议题中BootROM漏洞 OTA fix后的分析，探究华为的修复手法。
- CVE-2021-22434: Huawei Arbitrary Write in BootROM USB Stack
- CVE-2021-22429: Huawei Buffer Overflow in BootROM USB Stack
Your Peripheral Has Planted Malware — An Exploit of NXP SOCs Vulnerability - Yuwei ZHENG, Shaokun CAO, Yunding JIAN, Mingchuang QIN, Defcon26
NXP SOC安全启动的错误实现导致可以打破信任链植入恶意程序
Top 10 Secure Boot mistakes - Jasper van Woudenberg, hardware.io, 2019
这个算是一个总结性质的分享，总结了常见的安全启动的错误实现，已经相关的例子，对于BSP来说是个不错的参考材料？
Attack Secure Boot of SEP - Xu Hao of Team Pangu, MOSEC, 2020
TBD
Breaking Secure Bootloaders Iskuri1, BH USA, 2021
TBD
eshared的pixel6_bootloader安全研究系列
Pixel6修复了一系列bootloader的漏洞，作者通过bindiff找到，并深入研究了这些漏洞

TZ相关

没看完的材料就是TBD的状态 :(

Attacking your “Trusted Core” Exploiting TrustZone on Android - Di Shen (@returnsme), BH USA, 2015
华为Mate7的安全研究，从REE打到TEE
Blue Pill for Your Phone - Oleksandr Bazhaniuk & Yuriy Bulygin, BH USA, 2017
Nexus&Pixel EL2的研究
BREAKING SAMSUNG’S ARM TRUSTZONE - Maxime Peterlin & Alexandre Adamski & Joffrey Guilbon, BH USA, 2019
TBD
暗涌2020-小米5c中国产自研手机芯片澎湃S1 - Slipper, MOSEC, 2020
没找到Slide :( 只能结合evilpan的博客来理解了:) 一套fullchain exploit，从EL0一路打到S-EL1

其他

涉及底层的内容，也是上面学习上面内容的时候找到的，归类到这里 :)

2212_huawei-security-hypervisor
详细地分析了华为的EL2实现，这篇详细到什么程度呢？我认为这是一篇生动形象的计算机体系结构课程 :) 非常值得阅读，全搞明白对ARM体系的理解要求很高。
Attacking Samsung RKP
TBD
A Samsung RKP Compendium
TBD
2212_advisory_huawei-secure-monitor
华为EL3 漏洞挖掘&利用，可以配合闻观行的 EL3 Tour 议题阅读
fred’s notes
bootloader、security boot相关的博客都值得阅读
Exploiting Qualcomm EDL Programmers系列
- 一共五篇，从网上泄漏的firehose开始研究，探究高通的安全启动、firehose功能，后面利用某些设备实现上的缺陷(开了secureboot的设备的firehose依然实现了peek、poke)实现内存读写，进而在不同设备上实现代码执行等操作。
attacking-titan-m-with-only-one-byte
TBD

感想

这些内容基本上都是围绕ARM架构做的安全研究，在学习的过程中会不自觉的拿optee来做对比，好让自己更容易理解这些内容
看了这些材料以及大佬分享的时间，这些研究真的太有意思了，我怎么没有早点看到
行业原因自然形成的壁垒，在做底层的研究的时候真的很明显，比如BootROM，如果有个手册的话…MTK那个BootROM我看过，这要没手册也太难分析了😭
持续学习非常重要，正反馈让人觉得很爽 😄

恰好今天正好是2022年最后一天，转到IoT组也一年多了，能感受到自己在一点一点进步:

技术
软技能(沟通协作、写文档)

非常感谢玉伟对我的帮助和指导，在对本篇文章中资料的学习过程中，总能和之前我学习or工作中遇到的东西呼应起来，我也想起了和玉伟one on one的时候他给我讲学习方法、以及他个人是怎么做阅读的，醍醐灌顶来形容我现在的感受可能会比较恰当 :)

希望23年可以进步更多一些，日拱一卒，功不唐捐。

议题学习:MOSEC2022 MediAttack - break the boot chain of MediaTek SoC

2022-11-23T06:02:40.000Z

背景

前段时间MOSEC上盘古关于MTK BootROM Exploit的议题非常精彩，所以我画了一些时间对议题内容进行分析，并结合手边能找到的一些材料做了逆向分析，也感谢同事@C0ss4ck在会场拍下了完整的Slide :)

配合MOSEC官方的微博食用更佳 :)

议题学习

MTK Based Boot flow

在进行研究之前需要搞明白MTK方案的设备的冷启动流程，议题中提供的图简洁明了：

按照ARM的标准流程preloader应该是bl2

因为后面使用了preloader的洞把BROM dump出来了，所以我判断MTK的preloader应该是和BROM跑在同一个Exception Level的，即EL3，后来也找了一些资料确认了这个说法，但是不确定现在最新的SoC还是不是这样的。

Preloader部分

出漏洞的模块在preloader的USB Download模式，MTK自定义了一些命令，在这个模式下USB handshake之后可以发送DA，然后加载DA，随后就可以和DA通信读写分区什么的，类似高通的9008(进edl模式后加载FH)，当然如果开启了SecurityBoot，公版的DA无法使用，需要对应签名的DA才可以。

根据大佬的议题内容可知，漏洞是一个整数溢出，是在判断读/写命令地址范围的时候出现的:

因为MTK的方案有很多开发板，所以基线代码基本上都很容易找到，比如使用了MT6737的香橙派-4G-IOT这个开发板(好像停产了，现存的巨贵)，有个大哥把代码放github了

https://github.com/SoCXin/MT6737/tree/master/linux

根据这份代码，分析这个漏洞其实很简单了

/home/muhe/Code/MT6737/linux/bootloader/preloader/platform/mt6735/src/core/download.c

int usbdl_handler(struct bldr_comport *comport, u32 hshk_tmo_ms)
{
    u8 cmd;
    u32 cnt = 0;

    if (usbdl_check_start_command(comport, hshk_tmo_ms) == FALSE) {
        printf("%s start cmd handshake timeout (%dms)\n", MOD, hshk_tmo_ms);
        return -1;
    }

    printf("%s PASS Tool Sync Seq.\n", MOD);

    /* if log is disabled, re-init log port and enable it */
    if (comport->type == COM_USB && log_status() == 0) {
        mtk_uart_init(UART_SRC_CLK_FRQ, CFG_LOG_BAUDRATE);
        log_ctrl(1);
    }

    dlcomport = comport;

    while (1) {
        platform_wdt_kick();

        usbdl_get_byte(&cmd);
        if (cmd != CMD_GET_BL_VER)
            usbdl_put_byte(cmd);    /* echo cmd */

        switch (cmd) {
        case CMD_GET_BL_VER:
        ....
        
        }
        
     ...
     
 }

支持的命令也很多:

直接定位到 static u32 usbdl_read16(bool legacy)

static u32 usbdl_read16(bool legacy)
{
    u32 index;
    u32 base_addr=0;
    u32 len16=0;
    u32 len8=0;
    u16 data=0;
    u32 status=0;

    usbdl_get_dword(&base_addr); // [1]获取地址
    usbdl_put_dword(base_addr);

    usbdl_get_dword(&len16);     // [2] 获取长度
    usbdl_put_dword(len16);

    /* check addr alignment */
    if (0 != (base_addr & (2-1))) {
        status = -1;
        goto end;
    }

    /* check len */
    if (0 == len16) {
        status = -2;
        goto end;
    }

    /* convert half-word(2B) length to byte length */
    len8 = (len16 << 1);

    /* overflow attack check */
    if (len16 >= len8) {
        status = -3;
        goto end;
    }

    /* check if addr range is valid */
    sec_region_check(base_addr,len8);    // [3] 安全检查

    if (!legacy) {
        /* return status */
        usbdl_put_word(status);
    }

    for (index = 0; index < len16; index++) {  // [4] 执行读操作并返回数据
        data = *(u16*)(base_addr + (index << 1));
        usbdl_put_word(data);
    }

end:
    if(!legacy) {
        /* return status */
        usbdl_put_word(status);
    }

    return status;
}

核心逻辑还是 sec_region_check(base_addr,len8);

void sec_region_check (U32 addr, U32 len)
{
    U32 ret = SEC_OK;
    U32 tmp = addr + len;

    /* check if it does access AHB/APB register */
    if ((IO_PHYS != (addr & REGION_MASK)) || (IO_PHYS != (tmp & REGION_MASK))) {
        SMSG("[%s] 0x%x Not AHB/APB Address\n", MOD, addr);
        ASSERT(0);
    }

    if (len >= REGION_BANK) {
        SMSG("[%s] Overflow\n",MOD);
        ASSERT(0);
    }

    if (blacklist_check(addr, len)) {
        SMSG("[%s] Not Allowed\n", MOD);
        ASSERT(0);
    }

#ifdef MTK_SECURITY_SW_SUPPORT
    /* check platform security region */
    if (SEC_OK != (ret = seclib_region_check(addr,len))) {
        SMSG("[%s] ERR '0x%x' ADDR: 0x%x, LEN: %d\n", MOD, ret, addr, len);
        ASSERT(0);
    }
#endif
}

这里执行了两个检查：

判断你要操作的是不是物理外设所在的内存
判断你要操作的外设是不是在黑名单里，有部分外设不能操作
这里可能是因为方案不同，大佬PPT里的那个方案是白名单的操作，只允许操作xxx，不过不影响理解。

REGION g_blacklist[] = {
    {MSDC0_BASE, 0x10000},
    {MSDC1_BASE, 0x10000},
    {MSDC2_BASE, 0x10000},
    {MSDC3_BASE, 0x10000},
    {NFI_BASE, 0x1000},
    {NFIECC_BASE, 0x1000},
};

int blacklist_check(U32 addr, U32 len)
{
    int ret = 0;
    unsigned int i = 0;
    unsigned int blacklist_size = sizeof(g_blacklist) / sizeof(REGION);
    REGION region;
    region.start = (unsigned int)addr;
    region.size = (unsigned int)len;

    for (i = 0; i < blacklist_size; i++) {
        if (is_region_overlap(®ion, &(g_blacklist[i]))) {
            ret = -1;
            break;
        }
    }

    return ret;
}
unsigned int is_region_overlap(REGION *region1, REGION *region2)
{
    unsigned int overlap = 0;

    if (region1->start + region1->size <= region2->start)
        overlap = 0;
    else if (region2->start + region2->size <= region1->start)
        overlap = 0;
    else
        overlap = 1;

    return overlap;
}

这里就要祭出datasheet里的memory map

根据memory map，利用这漏洞就可以把BROM dump出来了

BROM部分

基本分析

MTK的话BROM Exp满天飞，多搜一搜可以找到，或者按照dissecting-a-mediatek-bootrom-exploit中的办法，应该也可以，或者对于没开SecurityBoot的设备搞个mini DA进去也可以(参考这里 https://github.com/MTK-bypass/bypass_utility/blob/master/main.py#L111 )。

这里以某个SoC的BROM为例作分析，推荐使用Ghirda来做，选ARMv7就行。

DECIMAL       HEXADECIMAL     DESCRIPTION
--------------------------------------------------------------------------------
67676         0x1085C         Mediatek bootloader
72020         0x11954         SHA256 hash constants, little endian

前面还是喜闻乐见的中断向量表，根据reset handler，能定位到类似main的位置，但是我们的目的是分析usb dl的逻辑，这里我看了下已知的文章，可以通过handshake来确定，直接暴搜一波 A0 0A 50 05，但是这里需要注意，有两个handshake，uart和usb的，需要做好区分，然后就可以定位到 process_cmd() 里了。

然后可以还原出来相关标志位，如 security boot & SLA & DAA。

不过这显然不是这次的目的，这次是想找到盘古议题中提到的两个BROM的漏洞 :)

议题中的漏洞

vuln1

根据MTK的公告可知和议题内容，这个应该是那个Issue1，即 Endpoint processing vulnerability 的这枚漏洞 :)

我这里根据几个地方来确认函数位置的

少的可怜的两个字符串 [USBDL] 开头的，和timeout相关
根据https://github.com/chaosmaster/bypass_payloads 中，我目前这个方案的一些寄存器、函数地址来确定的，比如可以确定

void (*send_usb_response)(int, int, int) = (void*)******;
int (*(*usbdl_ptr))() = (void*)******;
*(volatile uint32_t *)(usbdl_ptr[0] + 8) = (uint32_t)usbdl_ptr[2];
void (*usbdl_get_data)() = usbdl_ptr[1];
void (*usbdl_put_data)() = usbdl_ptr[2];
void (*usbdl_flush_data)() = usbdl_ptr[3];

议题中漏洞特征

最终让我找到了这个漏洞，和我最开始预想的差不多，处理USB协议相关的逻辑，不过是在标准的流程后面

[TBD]vuln2

说来也比较巧合，rrr拍的图里似乎没有标题为MTK BootROM Vul #2 的slide，所以我目前还没有分析出来，只找到了一些相关的资料辅助分析:

https://www.usbzh.com/article/detail-842.html
https://yhsnlkm.github.io/2019/08/14/USB相关/应用层遍历所有接入的USB设备-1/
https://github.com/mtek-hack-hack/mtktest/blob/master/%20mtktest%20--username%20qq413187589/N65/N65_V1/usb/src/usbacm_drv.c
https://shequ.stmicroelectronics.cn/thread-612750-1-1.html

比较有意思的是链接3里面的这份代码，看着很像古早时期的BROM源码 -.-

在usb相关的目录也找到了一些议题中提到的信息，比如CDC、data_ep_in_info，以及议题截图中一些变量命名，基本上都对的上，我猜测这应该是因为这是一种标准实现，所以延用这些命名方便分析，那么找洞的方向就有了:

继续了解USB CDC
找一些标准实现看看，找一些特征+已知的USB相关的一些符号判断出来相关的处理逻辑大概在哪里
结合MTK的公告描述来尝试找这个漏洞(Character-formatting command vulnerability)

看了几个地方还不是很确定- -. 失败

攻击思路

基本概念

SLA (Serial Link Authorization): 未授权是没办法加载DA的
DAA (Download agent authentication): 对加载的DA做验证

当然，如果能绕过SLA，加载自定义的DA，那DAA也是可以绕过的

通过SP Flash Tool可以对设备进行读写

Download-Agent: 一小段程序，加载到SRAM中和Host交互，类比高通的FH
Scatter: 可以理解成flash的内存布局，描述每个分区的情况，如起始地址、大小、属性等
Authentication File & Cert File: 开启了SecurityBoot的设备需要提供，用于验证DownloadAgent是否合法

所以，对于开了SecurityBoot的设备，就不能用公版DA了，大佬的议题中也是以开了SecurityBoot的设备为例讲的，通过前面的漏洞disable sla & daa，从而实现加载自定义的DA，然后通过这个DA来读写任意分区，从而实现加载任意代码的目的 :)

Attacking DA

大佬在议题中对MTK的DA做了详细的介绍，这里主要涉及了

DA如何被加载
DA的执行阶段
- stage1
- stage2
如何攻击DA实现任意分区读写

MTK的SP Flash Tool里带的这个公版DA其实是个DA的合集，SP FlashTool根据读到的chip id选对应的DA用来交互

DA stage1

这里提到了一个EMI file，stage1会根据这个EMI file来初始化DRAM，既然可以从preloader里后去，那么前面的基线代码里妥妥也会有了

当然也可以借助工具来解析出来，比如这个 https://github.com/mr-m96/MTKPreloaderParser，相关内容就不展开了，为了理解议题内容的话，只需要了解这个东西的作用以及在哪里就行了:)

DA stage2

stage2是比较关键的内容了，它被stage1加载到了dram里执行(前面初始化dram这里要用)

这里列举了secure enable的情况，DA的能力将受到限制，即一部分功能无法使用，作者通过之前的BROM exploit disable了daa，然后加载自己patch过的da，从而使用这个patch过的da来实现全分区的读写，以及使用da中全部的功能。

policy_part_map？

这部分感觉PPT顺序有点问题，不过也不是特别影响理解吧，主要是启动过程中对加载的镜像完整性校验相关的介绍，这块和后面大佬讲攻击流程能对上。

github随便搜了下，就能看明白这个东西了 :)

主要是有这么个结构体来描述对应的镜像的安全配置，是否受到保护、能不能刷这个分区等等啥的。

相关的部分代码，这是在加载镜像之前，加载这个policy，然后根据结果去对镜像做对应的操作，比如是否应该做校验

static char get_sec_policy(unsigned int policy_entry_idx)
{
4unsigned int sboot_state = 0;
4unsigned int lock_state = 0;

4unsigned char sec_policy = 0;
4unsigned int ret = 0;

4ret = get_sec_state(&sboot_state, &lock_state);
4/* this API won't return error, so we don't process it here */

4if (sboot_state == 0 && lock_state == LKS_UNLOCK)
44sec_policy = g_policy_map[policy_entry_idx].sec_sbcdis_unlock_policy;
4else if (sboot_state == 0 && lock_state != LKS_UNLOCK)
44sec_policy = g_policy_map[policy_entry_idx].sec_sbcdis_lock_policy;
4else if (sboot_state == 1 && lock_state == LKS_UNLOCK)
44sec_policy = g_policy_map[policy_entry_idx].sec_sbcen_unlock_policy;
4else if (sboot_state == 1 && lock_state != LKS_UNLOCK)
44sec_policy = g_policy_map[policy_entry_idx].sec_sbcen_lock_policy;

4return sec_policy;
}

BROM EXPLOIT

这里的话，参考dissecting-a-mediatek-bootrom-exploit 的介绍会了解的更清楚，简化一下描述就是:

需要找到需要的函数、全局变量的地址
- send_usb_response
- usbdl_put_dword
- usbdl_put_data
- usbdl_get_data
- uart_reg0
- uart_reg1
- sla_passed
- skip_auth_1
- skip_auth_2
exp工作流程参考 common exp，类似议题中的Vuln1

当然，所需要覆盖的变量也比较好找，把cmd是 0xd8的 CMD_GET_TARGET_CONFIG为入口就可以找到需要的东西了

common exp

直接参考 common exp，就行，利用漏洞获得的任意地址读写能力去覆盖

sla_passed
skip_auth_1
skip_auth_2

这三个变量，然后就可以加载任意da，并且禁用了daa

start.S 直接跳main函数，里面逻辑也很简单，覆盖变量，然后接收下个阶段的交互(usb handshake)，方便后续加载DA啥的，交互完毕，就正常进入usbdl模式去了

int main() {
    send_usb_response(1,0,1);

    print("Sending pattern\n");
    usbdl_put_dword(0xA1A2A3A4);

    *sla_passed = 1;
    *skip_auth_1 = 1;
    *skip_auth_2 = -1;

    print("Waiting for handshake\n");

    const char sequence[] = {0xA0, 0x0A, 0x50, 0x05};
    unsigned char hs = 0;

    for (uint32_t i = 0; i < 4; i++, hs = 0) {
        usbdl_get_data(&hs, 1);

        if (sequence[i] == hs) {
            hs = ~hs;
            usbdl_put_data(&hs, 1);
        } else {
          i = 0;
          print("Handshake failed\n");
        }
        
        print("Handshake..\n");
    }

    print("Handshake completed\n");
}

MTE mode

这个模式看描述是MTK的一个特殊的测试模式，也算是一个之前没见过的攻击面

在这个模式下，可以做很多事情:

Obtain/Modify EFUSE/RPMB Info
Load Customized OS
USERDATA Decrypt
Obtain/Modify Hardware Key
Unlock Bootloader
…

巧了，咱手里正好有个某个MTK方案的设备的完整镜像 :-) 根据PPT中的信息，可以check下相关的逻辑

我这个设备没有找到相关的逻辑，应该是删除了这个模式，不过幸运的是 meta_tst 没有删除:)，而且根据PPT里的内容，这个服务应该是比较核心的，MTK设计了私有协议做一些交互

分析的难度也不大，而且有趣的是如果你在github上搜一些特定的字符串，会发现很多有意思的repo :) 这对理解一些逻辑很有帮助

more exploit

这没什么可说的，既然从源头破坏掉了信任链，那么自然可以做任何事 😎

基本上一些很成熟的“取证”工具都能干- 。- 比如这一篇

support-for-mediatek-devices-in-oxygen-forensic-detective

感兴趣的话可以阅读一下

后记

这次虽然过程艰辛又带着一些遗憾，不过个人起码了解了MTK方案BROM Exploit的思路，vuln#2还没找到，后面等不忙了时间多了再尝试看看好了 :)

参考

https://github.com/SoCXin/MT6737/tree/master/linux

https://github.com/chaosmaster/bypass_payloads

https://tinyhack.com/2021/01/31/dissecting-a-mediatek-bootrom-exploit/

https://www.cnblogs.com/wen123456/p/14034493.html

https://blog.csdn.net/u011784994/article/details/104898430

https://github.com/rn2/ven/blob/db95d7f096/hardware/meta/common/README

https://blog.oxygen-forensic.com/support-for-mediatek-devices-in-oxygen-forensic-detective/

Qual+Android方案Unlock学习以Oneplus7Pro为例

2022-11-01T14:56:50.000Z

背景

严格意义上来说本文应该叫做: <<我本来只是想救个砖，但是却逆向了刷机工具尝试搞清楚android unlock的原理>> :D

前段时间因为一些工作需求想给手里的测试机(一加7Pro)刷个ColorOS，因为之前想体验Android12，机器是刷了个userdebug的lineageos，遂尝试了卡刷、sideload等之后机器被我搞坏了，开机直接recovery，报错信息是什么 mount fs的时候失败了 :( 没办法只能救转了，逛了一圈论坛发现有人提供9008刷机工具，通过万能的9008救回来之后，我就想做点别的: 把他的firehose“偷”出来玩玩。

Unpack guacamole_21_H.04_190416.ops

刷机工具解压之后就几个文件，一个刷机工具 msmdownloadtoolv4.0.88，还有个guacamole_21_H.04_190416.ops，一看就是固件包，然后就是一些完整性校验用的文件。

根据经验，这类刷机包里应该是内置了firehouse的，可以考虑两条路：

解包，直接把firehose提出来
内存dump，在刷机工具尝试给手机传输firehose的时候的时候内存dump，从内存里根据ELF文件头给截出来

方法2是我最开始尝试的办法，但是dump了几次，发现了好几个ELF，但是都不对，所以尝试方法1 :D 很显然这个包是厂商自己搞得加密，不过网上已经有大佬分析了(早用方法1就少走弯路了)，所以根据 How to Extract/Decrypt OnePlus OPS Firmware 提供的工具，可以成功吧固件包解开，获取到firehose

# muhe @ muheMacBookAir in ~/Work/play_with_oneplus7pro on git:main x [22:01:37]
$ ls -al prog_firehose_*
-rw-r--r--@ 1 muhe  staff  726400 Oct 28 22:46 prog_firehose_ddr.elf
-rw-r--r--@ 1 muhe  staff  726272 Oct 28 22:46 prog_firehose_lite.elf

随便试了一把读分区，是可以的，说明firehose是没问题的 :)

然后就想着顺手看点别的，研究研究Qual+Android平台的解锁BL是怎么实现的，遂有了后续的过程。

Unlock探究

开发者选项–允许解锁

参考android-9-r1，因为现在用的一加的系统的是Android9的

没在开发这里允许解锁BL的话，直接fastboot oem unlock是不行的

onOemUnlockConfirmed

https://cs.android.com/android/platform/superproject/+/android-9.0.0_r1:packages/apps/Settings/src/com/android/settings/development/OemUnlockPreferenceController.java;l=132

1
2
3

public void onOemUnlockConfirmed() {
    mOemLockManager.setOemUnlockAllowedByUser(true);
}

setOemUnlockAllowedByUser

https://cs.android.com/android/platform/superproject/+/android-9.0.0_r1:frameworks/base/core/java/android/service/oemlock/OemLockManager.java;drc=b45a2ea782074944f79fc388df20b06e01f265f7;l=114

@RequiresPermission(android.Manifest.permission.MANAGE_USER_OEM_UNLOCK_STATE)
    public void setOemUnlockAllowedByUser(boolean allowed) {
        try {
            mService.setOemUnlockAllowedByUser(allowed);
        } catch (RemoteException e) {
            throw e.rethrowFromSystemServer();
        }
    }

setOemUnlockAllowedByUser

https://cs.android.com/android/platform/superproject/+/android-9.0.0_r1:frameworks/base/services/core/java/com/android/server/oemlock/OemLockService.java;l=156;drc=b45a2ea782074944f79fc388df20b06e01f265f7;bpv=0;bpt=1

// The user has the final say so if they allow unlock, then the device allows the bootloader
// to OEM unlock it.
@Override
public void setOemUnlockAllowedByUser(boolean allowedByUser) {
    if (ActivityManager.isUserAMonkey()) {
        // Prevent a monkey from changing this
        return;
    }

    enforceManageUserOemUnlockPermission();
    enforceUserIsAdmin();

    final long token = Binder.clearCallingIdentity();
    try {
        if (!isOemUnlockAllowedByAdmin()) {
            throw new SecurityException("Admin does not allow OEM unlock");
        }

        if (!mOemLock.isOemUnlockAllowedByCarrier()) {
            throw new SecurityException("Carrier does not allow OEM unlock");
        }

        mOemLock.setOemUnlockAllowedByDevice(allowedByUser);
        setPersistentDataBlockOemUnlockAllowedBit(allowedByUser);
    } finally {
        Binder.restoreCallingIdentity(token);
    }
}

setPersistentDataBlockOemUnlockAllowedBit

https://cs.android.com/android/platform/superproject/+/android-9.0.0_r1:frameworks/base/services/core/java/com/android/server/oemlock/OemLockService.java;drc=b45a2ea782074944f79fc388df20b06e01f265f7;bpv=0;bpt=1;l=232

/**
 * Always synchronize the OemUnlockAllowed bit to the FRP partition, which
 * is used to erase FRP information on a unlockable device.
 */
private void setPersistentDataBlockOemUnlockAllowedBit(boolean allowed) {
    final PersistentDataBlockManagerInternal pdbmi
            = LocalServices.getService(PersistentDataBlockManagerInternal.class);
    // if mOemLock is PersistentDataBlockLock, then the bit should have already been set
    if (pdbmi != null && !(mOemLock instanceof PersistentDataBlockLock)) {
        Slog.i(TAG, "Update OEM Unlock bit in pst partition to " + allowed);
        pdbmi.forceOemUnlockEnabled(allowed);
    }
}

pdbmi.forceOemUnlockEnabled(allowed);

https://cs.android.com/android/platform/superproject/+/android-9.0.0_r1:frameworks/base/services/core/java/com/android/server/PersistentDataBlockService.java;l=677;bpv=0;bpt=1

@Override
public void forceOemUnlockEnabled(boolean enabled) {
    synchronized (mLock) {
        doSetOemUnlockEnabledLocked(enabled);
        computeAndWriteDigestLocked();
    }
}

doSetOemUnlockEnabledLocked

https://cs.android.com/android/platform/superproject/+/android-9.0.0_r1:frameworks/base/services/core/java/com/android/server/PersistentDataBlockService.java;drc=b45a2ea782074944f79fc388df20b06e01f265f7;bpv=0;bpt=1;l=421

private void doSetOemUnlockEnabledLocked(boolean enabled) {
    try {
        FileChannel channel = getBlockOutputChannel();
    
        channel.position(getBlockDeviceSize() - 1);
    
        ByteBuffer data = ByteBuffer.allocate(1);
        data.put(enabled ? (byte) 1 : (byte) 0);
        data.flip();
        channel.write(data);
        channel.force(true);
    } catch (IOException e) {
        Slog.e(TAG, "unable to access persistent partition", e);
        return;
    } finally {
        SystemProperties.set(OEM_UNLOCK_PROP, enabled ? "1" : "0");
    }
}

设备文件的某个位置写1，看起来是修改配置了

1	private static final String PERSISTENT_DATA_BLOCK_PROP = "ro.frp.pst";

在一加上看是 :

1 2	130\|OnePlus7Pro:/ $ getprop ro.frp.pst /dev/block/bootdevice/by-name/config

那么操作就是写这个分区了，把enbale标志位写进去，尝试进edl把config读出来看看

1 2	PS C:\Users\Admin> adb reboot edl PS C:\Users\Admin>

设置了这个标志位之后：

发现设备已经是允许unlock操作了(这里的允许是允许你去 fastboot oem unlock)

fastboot oem unlock

extract LinuxLoader from abl

把UEFI PI Firmware Volume从abl.elf里切出来
uefi-firmware-parser 解析

$ uefi-firmware-parser -e test
/usr/local/bin/uefi-firmware-parser:38: SyntaxWarning: "is not" with a literal. Did you mean "!="?
  if parser.type() is not 'unknown':
/usr/local/bin/uefi-firmware-parser:141: SyntaxWarning: "is" with a literal. Did you mean "=="?
  if parser.type() is 'unknown':
Firmware Volume: 8c8ce578-8a3d-4f1c-9935-896185c32dd3 attr 0x0003feff, rev 2, cksum 0xd3be, size 0x22000 (139264 bytes)
  Firmware Volume Blocks: (272, 0x200)
  File 0: 9e21fd93-9c72-4c15-8c4b-e77f1db2d792 type 0x0b, attr 0x00, state 0x07, size 0x204c2 (132290 bytes), (firmware volume image)
    Section 0: type 0x02, size 0x204aa (132266 bytes) (Guid Defined section)
      Guid-Defined: ee4e5898-3914-4259-9d6e-dc7bd79403cf offset= 0x18 attrs= 0x1 (PROCESSING_REQUIRED)
        Section 0: type 0x19, size 0x4 (4 bytes) (Raw section)
        Section 1: type 0x17, size 0x6d0c4 (446660 bytes) (Firmware volume image section)
          Firmware Volume: 8c8ce578-8a3d-4f1c-9935-896185c32dd3 attr 0x0003feff, rev 2, cksum 0xa27, size 0x6d0c0 (446656 bytes)
            Firmware Volume Blocks: (6979, 0x40)
            File 0: ffffffff-ffff-ffff-ffff-ffffffffffff type 0xf0, attr 0x00, state 0x07, size 0x2c (44 bytes), (ffs padding)
            File 1: f536d559-459f-48fa-8bbc-43b554ecae8d type 0x09, attr 0x00, state 0x07, size 0x6d038 (446520 bytes), (application)
              Section 0: type 0x15, size 0x1c (28 bytes) (User interface name section)
              Name: LinuxLoader
              Section 1: type 0x10, size 0x6d004 (446468 bytes) (PE32 image section)
Dumping...
Wrote: ./volume-0.fv
Wrote: ./volume-0/filesystem.ffs
Wrote: ./volume-0/file-9e21fd93-9c72-4c15-8c4b-e77f1db2d792/file.obj
Wrote: ./volume-0/file-9e21fd93-9c72-4c15-8c4b-e77f1db2d792/section0.guid
Wrote: ./volume-0/file-9e21fd93-9c72-4c15-8c4b-e77f1db2d792/section0/section0.raw
Wrote: ./volume-0/file-9e21fd93-9c72-4c15-8c4b-e77f1db2d792/section0/section1.fv
Wrote: ./volume-0/file-9e21fd93-9c72-4c15-8c4b-e77f1db2d792/section0/section1/volume-ee4e5898-3914-4259-9d6e-dc7bd79403cf.fv
Wrote: ./volume-0/file-9e21fd93-9c72-4c15-8c4b-e77f1db2d792/section0/section1/volume-ee4e5898-3914-4259-9d6e-dc7bd79403cf/filesystem.ffs
Wrote: ./volume-0/file-9e21fd93-9c72-4c15-8c4b-e77f1db2d792/section0/section1/volume-ee4e5898-3914-4259-9d6e-dc7bd79403cf/file-ffffffff-ffff-ffff-ffff-ffffffffffff/file.obj
Wrote: ./volume-0/file-9e21fd93-9c72-4c15-8c4b-e77f1db2d792/section0/section1/volume-ee4e5898-3914-4259-9d6e-dc7bd79403cf/file-f536d559-459f-48fa-8bbc-43b554ecae8d/file.obj
Wrote: ./volume-0/file-9e21fd93-9c72-4c15-8c4b-e77f1db2d792/section0/section1/volume-ee4e5898-3914-4259-9d6e-dc7bd79403cf/file-f536d559-459f-48fa-8bbc-43b554ecae8d/section0.ui
Wrote: ./volume-0/file-9e21fd93-9c72-4c15-8c4b-e77f1db2d792/section0/section1/volume-ee4e5898-3914-4259-9d6e-dc7bd79403cf/file-f536d559-459f-48fa-8bbc-43b554ecae8d/section1.pe
Wrote: ./volume-0/file-9e21fd93-9c72-4c15-8c4b-e77f1db2d792/section0/guided.preamble
Wrote: ./volume-0/file-9e21fd93-9c72-4c15-8c4b-e77f1db2d792/section0/guided.certs

./volume-0/file-9e21fd93-9c72-4c15-8c4b-e77f1db2d792/section0/section1/volume-ee4e5898-3914-4259-9d6e-dc7bd79403cf/file-f536d559-459f-48fa-8bbc-43b554ecae8d/section1.pe 就是我们需要的LinuxLoader

过程分析

这算是UEFI的一个应用程序

然后就去找 fastboot oem unlock 对应的处理逻辑 :

如果没有在设置-开发者选项中点击允许解锁BL，直接oem unlock是不行的，

在abl中也找到了对应的报错信息:

这里没符号不太好理解，要么找edk2的源码做参考辅助分析，要么某个基线代码build一份带符号的abl出来，这里因为没有在设置中 “允许解锁boot loader” 所以可以结合上面AOSP中的代码做辅助分析。

看看LinuxLoader的源码会更好理解

这里其实是判断了两个标志位:

unlock: 解锁，不验证BL了
unlock_critical: 设置后了之后才能刷对应的敏感分区

edk2开源实现中默认的保护分区，这个是可以修改的

结合LinuxLoader的源码，网上可以找到一些leak的实现，能用于辅助分析

在入口 LinuxLoaderEntry 开始的时候，会初始化一个Deviceinfo的结构体

// Initialize verified boot & Read Device Info
Status = DeviceInfoInit ();
if (Status != EFI_SUCCESS) {
  DEBUG ((EFI_D_ERROR, "Initialize the device info failed: %r\\n", Status));
  goto stack_guard_update_default;
}

结构体如下:

#define DEVICE_MAGIC "ANDROID-BOOT!"
#define DEVICE_MAGIC_SIZE 13
#define MAX_VERSION_LEN 64
#define MAX_VB_PARTITIONS 32
#define MAX_USER_KEY_SIZE 2048

enum unlock_type {
  UNLOCK = 0,
  UNLOCK_CRITICAL,
};
typedef struct device_info {
  CHAR8 magic[DEVICE_MAGIC_SIZE];
  BOOLEAN is_unlocked;
  BOOLEAN is_unlock_critical;
  BOOLEAN is_charger_screen_enabled;
  CHAR8 bootloader_version[MAX_VERSION_LEN];
  CHAR8 radio_version[MAX_VERSION_LEN];
  BOOLEAN verity_mode; // TRUE = enforcing, FALSE = logging
  UINT32 user_public_key_length;
  CHAR8 user_public_key[MAX_USER_KEY_SIZE];
  UINT64 rollback_index[MAX_VB_PARTITIONS];
  struct usb_composition usb_comp;
} DeviceInfo;
EFI_STATUS
ReadWriteDeviceInfo (vb_device_state_op_t Mode, void *DevInfo, UINT32 Sz)
{
  EFI_STATUS Status = EFI_INVALID_PARAMETER;
  QCOM_VERIFIEDBOOT_PROTOCOL *VbIntf;

  Status = gBS->LocateProtocol (&gEfiQcomVerifiedBootProtocolGuid, NULL,
                                (VOID **)&VbIntf);
  if (Status != EFI_SUCCESS) {
    DEBUG ((EFI_D_ERROR, "Unable to locate VB protocol: %r\\n", Status));
    return Status;
  }

  Status = VbIntf->VBRwDeviceState (VbIntf, Mode, DevInfo, Sz);
  if (Status != EFI_SUCCESS) {
    DEBUG ((EFI_D_ERROR, "VBRwDevice failed with: %r\\n", Status));
    return Status;
  }

  return Status;
}
# VerifiedBoot Protocol
gEfiQcomVerifiedBootProtocolGuid =    { 0x8e5eff91, 0x21b6, 0x47d3, { 0xaf, 0x2b, 0xc1, 0x5a, 0x1, 0xe0, 0x20, 0xec } }

可以根据这个gEfiQcomVerifiedBootProtocol 去基线中搜到对应的实现，这里就无法展示了。

结合利用FH读出来的devinfo分区:

看来

1 2	BOOLEAN is_unlocked; BOOLEAN is_unlock_critical;

都是0，这个和目前未解锁的状态是符合的。

FH读写分区

这里我本来想用QFIL的，但是一加的firehose显然是自己改过的，只能读，写的话有个认证token，所以考虑了开源实现 edl，这个工具我发现对xiaomi和oneplus有支持，

就在我想着能一把梭实现 r/w的时候，悲剧发生了 :

# jiazhenjie @ mbp in ~/tools/edl on git:01f84bf o [16:54:13] C:1
$ python3 edl.py  w devinfo  /Users/jiazhenjie/Downloads/devinfo.bin  --loader=/Users/jiazhenjie/Downloads/prog_firehose_ddr.elf --memory=UFS --lun=4
Qualcomm Sahara / Firehose Client V3.52 (c) B.Kerler 2018-2021.
main - Using loader /Users/jiazhenjie/Downloads/prog_firehose_ddr.elf ...
main - Waiting for the device
main - Device detected :)
main - Mode detected: firehose
firehose - Chip serial num: 2360036966 (0x8cab4e66)
firehose - Supported Functions: program,read,nop,patch,configure,setbootablestoragedrive,erase,power,firmwarewrite,getstorageinfo,benchmark,emmc,ufs,fixgpt,getsha256digest,gethwversion,getrfversion,getprjversion,setprojmodel,sha256init,sha256final
firehose -
firehose
firehose - [LIB]: Couldn't detect MaxPayloadSizeFromTargetinBytes
firehose
firehose - [LIB]: Couldn't detect TargetName
firehose - TargetName=Unknown
firehose - MemoryName=UFS
firehose - Version=1
firehose_client - Supported functions:
-----------------
program,read,nop,patch,configure,setbootablestoragedrive,erase,power,firmwarewrite,getstorageinfo,benchmark,emmc,ufs,fixgpt,getsha256digest,gethwversion,getrfversion,getprjversion,setprojmodel,sha256init,sha256final
firehose -
Writing to physical partition 4, sector 962718, sectors 1
Traceback (most recent call last):
  File "/Users/jiazhenjie/tools/edl/edl.py", line 358, in 
    base.run()
  File "/Users/jiazhenjie/tools/edl/edl.py", line 340, in run
    fh.handle_firehose(cmd, options)
  File "/Users/jiazhenjie/tools/edl/edl/Library/firehose_client.py", line 651, in handle_firehose
    if self.firehose.cmd_program(lun, startsector, filename):
  File "/Users/jiazhenjie/tools/edl/edl/Library/firehose.py", line 438, in cmd_program
    data += self.modules.addprogram()
  File "/Users/jiazhenjie/tools/edl/edl/Library/Modules/init.py", line 64, in addprogram
    return self.ops.addprogram()
  File "/Users/jiazhenjie/tools/edl/edl/Library/Modules/oneplus.py", line 233, in addprogram
    pk, token = self.ops.generatetoken(True)
AttributeError: 'NoneType' object has no attribute 'generatetoken'

这个需要逆向刷机工具来分析了

逆向MSM Download

喜闻乐见的逆向环节

USB抓包

因为每次都会发token，所以想着抓个包，如果固定，那就万事大吉，结果发现不固定

1
2
3

<data>
<setprojmodel token="C5DB7CFB89D7A9DBB005388A52F8622FC20BDDD89F5CAD8ED42DEA046DE93F079F47021C7C2A8033300F437881B8FA799FE634A0B7876819DC612799A7B2822A4674B4312FC04FFB20CFE4F40CB487FBD8FDA78A9492E8B1AE0FEEBB0A88802497336B98A1DE35B0691AF563F2DED6837333AAAFE62AB576A73667AFA61E874FC0380223C9CFE3360ED9775014F0E921BE2C101DD979132412CB4E196A1CD05BEDFA19B13419F3DC722ECBA7CB54A9EE67930DE7EADCB0A31E272415A5DBF9948C2EB656D9925D35CE66B60ADFB7F66249319F2ABA9050D0C8019090214D595F59D23EEB2D6C65E8218B66134393A350EFAE4DC3030A6B4F7FC7AC576D07FFF2" pk="Yc9vlwu65U6PvhYO" />
data>

这两个值并不是固定的，应该是固定算法+一些随机数算出来的

核心逻辑还是在计算这两个值，算是在刷写分区之前的验证工作，根据edl中的代码可知大概的逻辑，辅助逆向就方便多了

token & pk 逆向结果

先把结论放前面

prodkey固定 b2fad511325185e5
random_postfix 是随机字符串 // 这个可以写成固定值，反正是刷机工具生成的
时间戳随机
pk 随机

head = c4b95538c57df231 
tail = 5b0217457e49381b 
cf = 0
soc_sn = 2360036966
ModelVerifyPrjName = 18821
Version = guacamole_21_H.04_190416
prodkey = b2fad511325185e5
random_postfix = 随机的16字节字符串

ModelVerifyHashToken = sha256(prodkey + ModelVerifyPrjName + random_postfix)
secret = sha256(head + ModelVerifyPrjName + cf + soc_sn + Version + 时间戳 + ModelVerifyHashToken + tail)
items = [ModelVerifyPrjName, random_postfix, ModelVerifyHashToken, Version, cf, soc_sn, timestamp, secret]

pk = 随机16字节字符串 
aeskey = b"\x10\x45\x63\x87\xE3\x7E\x23\x71" + bytes(pk, 'utf-8') + b"\xA2\xD4\xA0\x74\x0f\xD3\x28\x96"
aesiv = b"\x9D\x61\x4A\x1E\xAC\x81\xC9\xB2\xD3\x76\xD7\x49\x31\x03\x63\x79"
pdata = "FEF0FFDA0CEF3E6C50E187E4A37D1B7DB860877A5F0ABFEC491DAC8DD5FD7F77D5D2859ADCDABED5B3018929CA10A00E786A675CD19184BB9BF2EF66A19AC234E4FD7EDFA8EB19E039B0FDD7BE0D3BC8DEA2453A6058D5370C923C9C4E632F3DEB1DA9F66F7BEA5B6D050B88C202BD5EEAA654DBF7AF410A14F5CB7DD481AEFAA6175685D565005D21CBBC2D62F860143FFE971F2845B2BD93A03ABDF6EE61F93E35740D8E2A09F89EB702D7E604914F0EDCE86F754FB994C1F82A20A094C8814EAD18FA6F24396A62A9C83D5412A53D740E662B7A9699ACA4352773B2F79374FF764EBC16143578481C0AD01135AE4BBA477C056320F690F4427E0635E91CEE"

token = hex(aes_cbc(items, key, iv))

为什么edl直接刷会失败呢?

没获取到prjid(18821)，所以我在patch里直接硬编码了
prodkey不对

     def getprodkey(self, projid):
-        if projid in ["18825", "18801"]:  # key_guacamoles, fajiita
+        if projid in ["18825", "18801", "18821"]:  # key_guacamoles, fajiita, guacamole
             prodkey = "b2fad511325185e5"
         else:  # key_op7t/op8/N10
             prodkey = "7016147d58e8c038"
@@ -164,7 +165,6 @@ class oneplus(metaclass=LogBase):
             rand = int(random.randint(0, 0x100))
             nr = (rand & 0xFF) % 0x3E
             pk += chr(val[nr])

其他地方这个工具都是对的，逆向过程的笔记没整理，也比较简单，没壳没混淆的，找到关键位置慢慢看就行了。

尝试修改分区实现unlock

想模拟一下把ufs吹下来修改后焊回去的操作

修改了edl之后发现是可以正常写分区的

修改devinfo之后刷回去，发现还是locked，看来只改这里是不行的， GG~

VerifiedBoot Protocol 分析

abl分析的时候提到了这个protocol，所以想搞清楚为什么失败就要看看这里

根据boot_images/QcomPkg/Drivers/VerifiedBootDxe/VerifiedBootDxe.inf

可知对应的实现在同目录的 VerifiedBootDxe.c 中

这里注册了这个protocol

EFI_STATUS
EFIAPI
VerifiedBootDxeEntryPoint(IN EFI_HANDLE ImageHandle,
                          IN EFI_SYSTEM_TABLE *SystemTable)
{
  EFI_STATUS Status;
  EFI_HANDLE Handle = NULL;

  Status = gBS->InstallMultipleProtocolInterfaces(
      &Handle, &gEfiQcomVerifiedBootProtocolGuid,
      (VOID **)&QCOMVerifiedBootProtocol, NULL);

  return Status;
}

要看的方法是 VBRwDeviceState 对应的是 QCOM_VB_RWDeviceState，这个代码很长就不贴了，只放关键的一部分:

/* We use devinfo partition when the device is not secure */
 AsciiStrnCpy((CHAR8 *)img_name, "devinfo", AsciiStrLen("devinfo"));
 if (convert_char8_to_char16(img_name, img_label, AsciiStrLen("devinfo")) != EFI_SUCCESS) {
   status = RETURN_INVALID_PARAMETER;
   goto exit;
 }

显然，只有没烧efuse的时候才会用devinfo作为存放是否unlock的标志，这一点也符合预期，至此这次探索基本上就结束了。

结束

我也把firehose和对edl的patch放到了github，过程也确实好玩:) 不过还是有不少没研究到的地方，比如他的verifyboot实现是否安全啥的 -。-

参考

https://www.droidwin.com/how-to-extract-oneplus-ops-firmware/

https://zhuanlan.zhihu.com/p/427390226

https://github.com/theopolis/uefi-firmware-parser

https://blog.omitol.com/2017/09/30/Bypass-QCOM-Secure-Boot

https://tjtech.me/analyze-oem-unlocking-under-android.html

https://www.oneplusbbs.com/forum.php?mod=viewthread&tid=4730052

optee学习(2) CA&TA调用流程分析

2022-10-26T15:33:52.000Z

环境

ubuntu22.04
ADS + optee-fvp

调用流程梳理

这里直接从optee-examples中最简单的hello world入手来看的，从宏观上来看整个调用流程是 :

1	CA --> optee client --> tee driver --> ATF --> TEE --> TA

根据个人的理解画了个省流版本的图，省略了部分调用

CA & TA 的工作流程

//1. 初始化context用于和TEE交互
res = TEEC_InitializeContext(NULL, &ctx);

//2. 打开“会话”，此时TEE侧会验证并且加载对应的TA
res = TEEC_OpenSession(&ctx, &sess, &uuid,
                   TEEC_LOGIN_PUBLIC, NULL, NULL, &err_origin);

//3. 交互，通过invoke command来触发，调用到TA里具体的逻辑
res = TEEC_InvokeCommand(&sess, TA_HELLO_WORLD_CMD_INC_VALUE, &op,
                 &err_origin);

//4. 使用完毕，关闭“会话”
TEEC_CloseSession(&sess);

// 5. 释放context对象
TEEC_FinalizeContext(&ctx);

1. 执行的入口，会话的另一端
TA_CreateEntryPoint // TA加载的时候执行
TA_OpenSessionEntryPoint


2. 交互，业务代码
TEE_Result TA_InvokeCommandEntryPoint(void __maybe_unused *sess_ctx,
            uint32_t cmd_id,
            uint32_t param_types, TEE_Param params[4])
{
    (void)&sess_ctx; /* Unused parameter */

    switch (cmd_id) {
    case TA_HELLO_WORLD_CMD_INC_VALUE:
        return inc_value(param_types, params);
    case TA_HELLO_WORLD_CMD_DEC_VALUE:
        return dec_value(param_types, params);
    default:
        return TEE_ERROR_BAD_PARAMETERS;
    }
}


3. 交互完毕，关闭会话
TA_CloseSessionEntryPoint
TA_DestroyEntryPoint

CA 和 TA的对应关系

TEEC_OpenSession    ->   TA_CreateEntryPoint
                         TA_OpenSessionEntryPoint

TEEC_InvokeCommand  ->   TA_InvokeCommandEntryPoint


TEEC_CloseSession   ->   TA_CloseSessionEntryPoint
                         TA_DestroyEntryPoint

源码阅读

TEEC_InitializeContext

TEEC_InitializeContext → 打开tee driver，要用于通信了，主要是一些初始化的工作

1
2
3

TEEC_InitializeContext
    teec_open_dev
        ioctl(fd, TEE_IOC_VERSION, &vers)

注意此时的CMD是 TEE_IOC_VERSION，对应执行的是 tee_ioctl_version

TEEC_OpenSession

// context
// tee session
// TA的uuid，唯一
// connection method
// connection data
// operation 
// ret 
TEEC_OpenSession(&ctx, &sess, &uuid, TEEC_LOGIN_PUBLIC, NULL, NULL, &err_origin);
....

rc = ioctl(ctx->fd, TEE_IOC_OPEN_SESSION, &buf_data);

此时CMD是 TEE_IOC_OPEN_SESSION，到tee driver中查看对应的处理逻辑 :

往后会调用到对应的handler:

1 2	rc = ctx->teedev->desc->ops->open_session(ctx, &arg, params);

在进TEE之前，传递的参数需要做转换，反过来也是；从REE往TEE走，其实是一个入口 do_call_with_arg，这些operations都定义在：

/**
 * struct optee_ops - OP-TEE driver internal operations
 * @do_call_with_arg:    enters OP-TEE in secure world
 * @to_msg_param:    converts from struct tee_param to OPTEE_MSG parameters
 * @from_msg_param:    converts from OPTEE_MSG parameters to struct tee_param
 *
 * These OPs are only supposed to be used internally in the OP-TEE driver
 * as a way of abstracting the different methogs of entering OP-TEE in
 * secure world.
 */
struct optee_ops {
    int (*do_call_with_arg)(struct tee_context *ctx,
                struct tee_shm *shm_arg, u_int offs);
    int (*to_msg_param)(struct optee *optee,
                struct optee_msg_param *msg_params,
                size_t num_params, const struct tee_param *params);
    int (*from_msg_param)(struct optee *optee, struct tee_param *params,
                  size_t num_params,
                  const struct optee_msg_param *msg_params);
};

直接在目录中搜open_session

发现有两个实现，这里的话ffa_abi.c中的应该是FF-A标准对应的那个实现，这里直接看smc的那个就行，即linux/drivers/tee/optee/smc_abi.c 里 :

910      while (true) {
911          struct arm_smccc_res res;
912  
913          trace_optee_invoke_fn_begin(¶m);
914          optee->smc.invoke_fn(param.a0, param.a1, param.a2, param.a3,
915                       param.a4, param.a5, param.a6, param.a7,
916                       &res);
917          trace_optee_invoke_fn_end(¶m, &res);
918  
919          if (res.a0 == OPTEE_SMC_RETURN_ETHREAD_LIMIT) {
920              /*
921               * Out of threads in secure world, wait for a thread
922               * become available.
923               */
924              optee_cq_wait_for_completion(&optee->call_queue, &w);
925          } else if (OPTEE_SMC_RETURN_IS_RPC(res.a0)) {
926              cond_resched();
927              param.a0 = res.a0;
928              param.a1 = res.a1;
929              param.a2 = res.a2;
930              param.a3 = res.a3;
931              optee_handle_rpc(ctx, rpc_arg, ¶m, &call_ctx);
932          } else {
933              rc = res.a0;
934              break;
935          }
936      }

中间这个 smc.invoke_fn就是通过smc进入到ATF，然后ATF会转发到TEE处理

对于ATF来说，这是一个通过 SMC #0 过来的中断，这是core内部发生的，且异常等级发生了变化，所以应该是到了ATF的第三组向量表的sync中断处理程序处

这里细节就不深入看了，主要是为了梳理工作流程，ATF里会调用到系统启动的时候注册的optee的tspd来处理，(opteed_smc_handler 函数)

这个handler里会保存 non-secure的上下文，恢复secure的上下文，然后直接eret到TEE侧。

进入optee之后来到:

53  uint32_t thread_handle_std_smc(uint32_t a0, uint32_t a1, uint32_t a2,
54                     uint32_t a3, uint32_t a4, uint32_t a5,
55                     uint32_t a6 __unused, uint32_t a7 __maybe_unused)
56  {
            ....

69      if (a0 == OPTEE_SMC_CALL_RETURN_FROM_RPC) {
70          thread_resume_from_rpc(a3, a1, a2, a4, a5);
71          rv = OPTEE_SMC_RETURN_ERESUME;
72      } else {
73          thread_alloc_and_run(a0, a1, a2, a3, 0, 0);
74          rv = OPTEE_SMC_RETURN_ETHREAD_LIMIT;
75      }

            ...

第一次走到 thread_alloc_and_run，传入参数是 thread_std_smc_entry，所以会执行到 thread_std_smc_entry

后续的流程 :

__thread_std_smc_entry
    std_smc_entry(a0, a1, a2, a3);
        std_entry_with_parg(...)
            call_entry_std
            tee_entry_std
            __tee_entry_std

至此，到了关键的逻辑:

538  TEE_Result __tee_entry_std(struct optee_msg_arg *arg, uint32_t num_params)
539  {
540      TEE_Result res = TEE_SUCCESS;
541  
542      /* Enable foreign interrupts for STD calls */
543      thread_set_foreign_intr(true);
544      switch (arg->cmd) {
545      case OPTEE_MSG_CMD_OPEN_SESSION:
546          entry_open_session(arg, num_params);
547          break;
548      case OPTEE_MSG_CMD_CLOSE_SESSION:
549          entry_close_session(arg, num_params);
550          break;
551      case OPTEE_MSG_CMD_INVOKE_COMMAND:
552          entry_invoke_command(arg, num_params);
553          break;
554      case OPTEE_MSG_CMD_CANCEL:
555          entry_cancel(arg, num_params);
556          break;
557  #ifndef CFG_CORE_FFA
558  #ifdef CFG_CORE_DYN_SHM
559      case OPTEE_MSG_CMD_REGISTER_SHM:
560          register_shm(arg, num_params);
561          break;
562      case OPTEE_MSG_CMD_UNREGISTER_SHM:
563          unregister_shm(arg, num_params);
564          break;
565  #endif
566  #endif
567  
568      case OPTEE_MSG_CMD_DO_BOTTOM_HALF:
569          if (IS_ENABLED(CFG_CORE_ASYNC_NOTIF))
570              notif_deliver_event(NOTIF_EVENT_DO_BOTTOM_HALF);
571          else
572              goto err;
573          break;
574      case OPTEE_MSG_CMD_STOP_ASYNC_NOTIF:
575          if (IS_ENABLED(CFG_CORE_ASYNC_NOTIF))
576              notif_deliver_event(NOTIF_EVENT_STOPPED);
577          else
578              goto err;
579          break;
580  
581      default:
582  err:
583          EMSG("Unknown cmd 0x%x", arg->cmd);
584          res = TEE_ERROR_NOT_IMPLEMENTED;
585      }
586  
587      return res;
588  }

这次的cmd是 open session所以走 entry_open_session函数

373     res = tee_ta_open_session(&err_orig, &s, &tee_open_sessions, &uuid,
374                   &clnt_id, TEE_TIMEOUT_INFINITE, ¶m);

// uuid，需要根据uuid来加载TA了

然后去加载对应的TA，在 tee_ta_open_session // tee_ta_manager.c

1	715 res = tee_ta_init_session(err, open_sessions, uuid, &s);

加载完毕之后，如果成功加载了，那就调用 ts_ctx->ops->enter_open_session(&s->ts_sess);

根据注册信息，应该是 user_ta_enter_open_session

调用到 user_ta_enter 函数，此时还是在optee里的，需要跳到TA去执行

166      res = thread_enter_user_mode(func, kaddr_to_uref(session),
167                       (vaddr_t)usr_params, cmd, usr_stack,
168                       utc->uctx.entry_func, utc->uctx.is_32bit,
169                       &utc->ta_ctx.panicked,
170                       &utc->ta_ctx.panic_code);

S-EL1 → S-EL0，应该是eret过去的

1
2
3

__thread_enter_user_mode(regs, exit_status0, exit_status1);
    b eret_to_el0
        eret

跳转前设置好了上下文，所以eret后就回到了TA中执行，这就到了TA中的 TA_OpenSessionEntryPoint

TEEC_InvokeCommand

逻辑基本和上面OpenSession差不多，差别就在于传递的 InvokeCommand

所以最后是走到

1 2	user_ta_enter_invoke_cmd user_ta_enter(s, UTEE_ENTRY_FUNC_INVOKE_COMMAND, cmd);

然后调用到TA的 TEEC_InvokeCommand 函数

TEEC_CloseSession

void TEEC_CloseSession(TEEC_Session *session)
{
        struct tee_ioctl_close_session_arg arg;

        memset(&arg, 0, sizeof(arg));

        if (!session)
                return;

        arg.session = session->session_id;
        if (ioctl(session->ctx->fd, TEE_IOC_CLOSE_SESSION, &arg))
                EMSG("Failed to close session 0x%x", session->session_id);
}

也是类似的情况，调用到内核里tee_ioctl_close_session ，区别只是cmd不同，最后会一路到TA侧的 TA_CloseSessionEntryPoint

TEEC_FinalizeContext

关闭打开的驱动

void TEEC_FinalizeContext(TEEC_Context *ctx)
{
        if (ctx)
                close(ctx->fd);
}

调试

根据上面的流程梳理，只要在optee 往TA里跳的时候下个断，就能去分析TA了，然后再加载TA的符号就能快乐地debug了，没有源码那就纯黑盒调试TA了

结合optee的文档里的描述，会用到TA的 .text段 LMA信息

1 2	$ objdump -h 8aaaf200-2450-11e4-abe2-0002a5d5c51b.elf \| grep ".text" 1 .text 00012e5c 00000020 00000020 00001020 2**2

启动ADS，然后在加载tee的时候断住，加载tee的符号，参考我上一篇博客就行了。

如果想调试全部的过程，按照文章把 Linux kernel、 bl31 runtime 的符号也加载进来就行了

1	b user_ta_enter_open_session

然后执行CA，可以观察到已经断下来了

其实这个时候TEE侧log已经看到了TA被加载到了哪里了，直接下断也可以的

1	b *EL0S:0x40060020

但是没断下来且报错了，很奇怪的是eret之后还是显示SEL1，我查看了currentel寄存器之后发现确实是在EL0的

问了下组里的大佬，这个反汇编窗口显示的ELxS/N 应该是这块内存的属性，而不是当前执行状态 (之前直接靠这个tag来做判断，看来是错的离谱了)

个人猜测因为TA加载是optee做的，所以可能optee分配出来的内存就是EL1S，所以跑到TA的时候，反汇编窗口地址tag会显示EL1S

然后尝试加载符号就行了:

1	add-symbol-file /home/muhe/Study/optee-fvp/out-br/build/optee_examples_ext-1.0/hello_world/ta/out/8aaaf200-2450-11e4-abe2-0002a5d5c51b.elf 0x40060020

参考

https://blog.csdn.net/weixin_42135087/article/details/119384252
https://www.timesys.com/security/trusted-software-development-op-tee/
https://optee.readthedocs.io/en/latest/building/gits/optee_examples/optee_examples.html

Paper read <>

2022-09-12T05:33:26.000Z

`Background`

最近阅读了一篇论文<>，很巧合的是论文的研究中，关于将SAST工具应用于二进制文件(通过decompiler)，即获取伪代码之后，在伪代码上跑SAST工具来找漏洞这个模式我和@C0ss4ck一起做过，在我们收到一些成效之后发现也有人做了类似的工作，不过他好像没有特别深入 :D

我们这做主要是因为一些不可说的原因，最开始是@C0ss4ck搞的用IDAPython搞的工具，但是由于做适配比较麻烦不够灵活；后来我提出了decompiler+weggli的做法的时候，我们都不是那么的看好，但是搞了一些demo发现确实可行，对于一些简单的漏洞模型是可以召回的，主要的瓶颈就在decompile code的质量和规则的编写了，同时由于weggli本身不支持数据流，并且主要是过程内的漏洞模式匹配(AST regexp)，所以后面就又面临瓶颈的问题了；在我做调研的时候，发现了这篇新鲜的论文，在读完之后感触良多，对decompiler+SAST的做法也有了更多的理解。

Read this `PAPER`

这篇论文讨论了源码/伪代码+SAST工具在漏洞挖掘上的效果，以及对于伪代码+SAST这种模式的局限性的探究，对其中的误报&漏报根本原因的分析。

关于论文中的实验设计

源码直接使用 SAST 工具
多种decompiler反编译之后获取伪代码，丢给SAST工具
伪代码修正之后(达到可编译的程度，有些复杂目标要裁剪)，给SAST工具用

工具 & 目标选择

尝试召回 real world vulns

基本上都是优秀的工具，其中两款商业工具并没有写具体是啥，但是这个 Comm_1看起来好像Coverity :) 不管怎么样，其中的 codeql和joern我很感兴趣，毕竟可以自定义规则，这对我来说无疑是更好的，可以召回更多问题 & 适用于更多的场景。

对于漏洞的选择，该论文也选的比较广泛，各种类型都有，复杂度也够，可以更好的“测量”这些工具 :)

结论

反编译代码并不是开箱即用的
对于二进制文件，伪代码+SAST的模式可行，但是有限
SAST工具设计上是给源码用的，这是by design的；二进制文件丢失了关键信息(尤其是编译器优化的影响)，不适合给SAST工具做分析，这也是为什么论文中说不用LLVM Lifter的原因
decompilers are still designed to generate code that is easy to understand for humans, and SAST tools are still designed to parse “well-written” code that is not generated by a machine.
编译器优化很有意思，有些漏洞因为优化inline，所以从过程间–>过程内，decompile之后的代码反而找到了漏洞 :)

优化的话，两个思路，相当于朝着同一个方向前进的路:

提高反编译代码的质量
优化SAST工具，让其适配反编译的代码

漏报 & 误报 Root cause

个人认为比较核心的地方了

P1 - Inability to Recover the Size of Stack Buffers

经过编译优化，下面的代码中s1由于是指向了为初始化内存，所以可能会报告成栈溢出

说是这样说，但是我个人认为，这种情况是可以避免的，通过汇编是可以判断出来这个 stack buffer 有多大，这种误报理论上是可以排出的，前提是收集更多的信息 <– 优化项

P2 - Signed and Unsigned Integers

没什么好说的，变量类型分析错误，在对伪代码中产生误报正常，这个如果不人为干预，确实没办法

P3 - Integer Operations on Uninitialized Variables

由于缺少必要的信息，导致在 sub 129CF丢失了a2和a4的信息，导致SAST工具产生误报

P4 - Function Pointers

函数指针问题，这个很巧合，前两天请教@jmpews的时候，提到了decompiler+SAST的做法，当时我问的是 joern，大佬的说法是C更不好整， c++ 还可以走 demangle

上面的代码反编译之后得到:

基本上是无法分析的，就算是人肉逆向，也要重建这个结构体，然后转换变量类型，自动化不太现实，这块的误报确实没办法

P5 - Pointers as Integers

还是变量类型的问题，反编译代码对特定变量类型分析错误，导致的误报

反编译之后:

P6 - Integers of Wrong Size

对v22 和 v26 类型识别错误，混用了 uint8_t 和 int64，所以可能会误报整数溢出 :(

P7 - Simplified Expressions

这是一类特殊情况

这里显然把||和&&搞混了，但是反编译之后

这类表达式在编译器优化处理之后，再反编译，该表达式已经看不出来了，就会漏报这个问题 :(

Futher work

decompiler+SAST可行，但是需要优化，能覆盖的场景也有限，目前来看IoT场景是比较适合的，比如各种奇葩的命令注入，显然是可以召回的。

最好不要选依赖编译的SAST工具，如codeql
选择可以自定义规则的工具
最好可以支持过程间分析、数据流
为了弥补反编译代码的不足，可以结合汇编层面收集一些信息，比如栈上变量的大小

个人来一个大胆的构想，从ctree上收集信息，生成codeql那样的rel db，目前来看比较接近的是joern，但是它是基于ghirda，优化空间还是有的。

Reference

https://dl.acm.org/doi/10.1145/3488932.3497764

https://security.humanativaspa.it/automating-binary-vulnerability-discovery-with-ghidra-and-semgrep/

https://docs.joern.io/home

HW OTA unpack

2022-09-02T05:43:15.000Z

步骤

unzip解开OTA包

我们的目标在 update_sd_base.zip里，其他部分咨询了是一些出厂带的APP，比如里面就看到了今日头条抖音啥的。

直接解开 update_sd_base.zip 到下一步

从UPDATE.APP提取SYSTEM

直接用 https://github.com/jenkins-84/split_updata.pl/blob/master/splitupdate 来分割就行

unpack erofs

方法1: simg2img然后挂在erofs(kernel 5.4)

1 2	~/android-simg2img/simg2img SYSTEM.img system1.img sudo mount -t erofs system1.img 1 -oloop

尝试读文件的时候发现报错

dmesg发现 :

方法2: 直接使用 extractor里的 erofs_tools.py 来直接把system镜像解开

1	~/extracotr/erofs_tool.py extract --verify-zip system1.img harmony_system

参考

https://zhuanlan.zhihu.com/p/60617375

https://github.com/jenkins-84/split_updata.pl

https://github.com/srlabs/extractor

optee学习篇(1) 环境&调试

2022-08-24T15:15:33.000Z

环境配置

本篇主要是环境配置、调试、流程梳理

qemu_v8环境搭建

https://optee.readthedocs.io/en/latest/building/prerequisites.html

$ repo init -u https://github.com/OP-TEE/manifest.git -m qemu_v8.xml
$ repo sync -c -j8
$ cd build
$ make toolchains
$ make run

同步下来的仓库如下

运行一下试试看:

需要指定版本跑的话 : make -f qemu_v8.mk run-only

https://optee.readthedocs.io/en/latest/debug/index.html

这里以qemu-v8为例

1 2	cd build make DEBUG=1 -f qemu_v8.mk all

1	make DEBUG=1 -f qemu_v8.mk run-only

因为Makefile中启动的时候已经写了设置了 -s -S了，所以可以直接连接

可以从这里下载对应的gdb来用

装了libncurses5-dev还是找不到so的话，可以参考 https://www.cnblogs.com/wanglouxiaozi/p/14987053.html

gdb-multiarch 也可以，更好用

符号加载

bl1 --- /home/work/optee/trusted-firmware-a/build/qemu/debug/bl1/bl1.elf
bl2 ---  /home/work/optee/trusted-firmware-a/build/qemu/debug/bl2/bl2.elf
bl31 ---  /home/work/optee/trusted-firmware-a/build/qemu/debug/bl31/bl31.elf 
bl32(teeOS)  ----  /home/work/optee/optee_os/out/arm/core/tee.elf
bl33(UEFI)  ---  /home/work/optee/edk2/Build/

fvp可视化调试环境搭建

代码获取

$ repo init -u https://github.com/OP-TEE/manifest.git -m fvp.xml 
$ repo sync -j4 -c
Updating depot_tools...

工具链

需要下载 FVP_Base_RevC-2xAEMvA_11.18_16_Linux64.tgz并解压到optee-fvp目录下

1 2	$ tar -zxvf ../FVP_Base_RevC-2xAEMvA_11.18_16_Linux64.tgz -C .

# work @ work-virtual-machine in ~/optee-fvp [23:34:36] 
$ ls -al
total 72
drwxrwxr-x 18 work work 4096 Sep 22 23:32 .
drwx------ 70 work work 4096 Sep 22 23:34 ..
drwxrwxr-x 10 work work 4096 Sep 22 23:32 Base_RevC_AEMvA_pkg
drwxrwxr-x 12 work work 4096 Sep 22 23:26 build
drwxrwxr-x 14 work work 4096 Sep 22 23:26 buildroot
drwxrwxr-x 50 work work 4096 Sep 22 23:26 edk2
drwxrwxr-x  4 work work 4096 Sep 22 23:26 edk2-platforms
drwxrwxr-x 14 work work 4096 Sep 22 23:26 grub
drwxr-xr-x  3 work work 4096 Jun 16 10:34 license_terms
drwxrwxr-x 24 work work 4096 Sep 22 23:26 linux
drwxrwxr-x 14 work work 4096 Sep 22 23:26 mbedtls
drwxrwxr-x  5 work work 4096 Sep 22 23:26 ms-tpm-20-ref
drwxrwxr-x  9 work work 4096 Sep 22 23:26 optee_client
drwxrwxr-x 10 work work 4096 Sep 22 23:26 optee_examples
drwxrwxr-x 10 work work 4096 Sep 22 23:26 optee_os
drwxrwxr-x  7 work work 4096 Sep 22 23:26 optee_test
drwxrwxr-x  7 work work 4096 Sep 22 23:26 .repo
drwxrwxr-x 19 work work 4096 Sep 22 23:26 trusted-firmware-a

编译

编译流程参考上面qemu_v8部分

# work @ work-virtual-machine in ~/optee-fvp [23:35:06]
$ cp -rf Base_RevC_AEMvA_pkg Foundation_Platformpkg # build toolchains的时候文件夹名需要改一下
$ cd build
$ make toolchains
$ make DEBUG=1 FVP_USE_BASE_PLAT=y  -f fvp.mk all

开启调试

修改build/fvp.mk ，以便启动时进入调试模式

添加:

1 2	-I \ --iris-allow-remote\

################################################################################
# Run targets
################################################################################
# This target enforces updating root fs etc
run: all
        $(MAKE) run-only

ifeq ($(FVP_USE_BASE_PLAT),y)
FVP_ARGS ?= \
        -I \
        --iris-allow-remote\
        -C bp.ve_sysregs.exit_on_shutdown=1 \
        -C cache_state_modelled=0 \
        -C pctl.startup=0.0.0.0 \
        -C cluster0.NUM_CORES=4 \

运行

1 2	cd build make DEBUG=1 FVP_USE_BASE_PLAT=y -f fvp.mk run-only

ARM Developer Studio连接

启动的时候需要license，注册个账号就行，先试用。

启动之后，选择 : File->New->Model Connection

模型选择 : Base_RevC_AEMvA 和 Base_RevC_AEMvA 都没法直接调试，好像是模型没装好 :(

点Finish之后，需要手动选择，连接本地的模型 localhost 7100

加载了bl31的符号，然后对入口下断:

1
2
3

b *EL3:0x0000000004003000

add-symbol-file /home/muhe/Study/optee-fvp/trusted-firmware-a/build/fvp/debug/bl31/bl31.elf

芜湖 🛫️

ARM 安全架构

ARM v8 的文档

分三个异常等级
两个“世界”，non-secure 和 secure

opteeos跑在 secure world，ta在secure world的上层(el0); linux在non-secure world，ca在el0

optee项目中还有个``atf，这个跑在el3`。

该图来自周贺贺老师的OPTEE系列课程中

OPTEE 启动流程

这里我直接用了周贺贺老师OPTEE系列课程中的图，我在对着代码分析的时候结合这个图感觉十分的清晰，有助于理解 :)

先来看大概的启动流程



bl31_entrypoint (trusted-firmware-a/bl31/aarch64/bl31_entrypoint.S)
    bl31_main (trusted-firmware-a/bl31/bl31_main.c)
        runtime_svc_init (trusted-firmware-a/common/runtime_svc.c)
            opteed_setup (trusted-firmware-a/services/spd/opteed/opteed_main.c DECLARE_RT_SVC里定义)
                bl31_plat_get_next_image_ep_info(SECURE) 
                opteed_init_optee_ep_state
                bl31_register_bl32_init(&opteed_init);

        bl32_init // 这个函数就是opteed_init，在上面注册的    
            // 进入tee
            opteed_synchronous_sp_entry(optee_ctx);
                opteed_enter_sp(&optee_ctx->c_rt_ctx);
            // 出tee
    bl31_prepare_next_image_entry (进入uboot)

下断点的時候注意，切换到对应的阶段之后再去 file xxx 加载符号

file /home/work/optee/trusted-firmware-a/build/qemu/debug/bl1/bl1.elf
file /home/work/optee/trusted-firmware-a/build/qemu/debug/bl2/bl2.elf
file /home/work/optee/trusted-firmware-a/build/qemu/debug/bl31/bl31.elf 
file /home/work/optee/optee_os/out/arm/core/tee.elf

比如下面要进入tee的时候

加载符号之后:

ads可视化流程梳理

ads可视化调试记录

bl1

add-symbol-file /home/muhe/Study/optee-fvp/trusted-firmware-a/build/fvp/debug/bl1/bl1.elf

bl2

b *EL1S:0x0000000004022000

add-symbol-file /home/muhe/Study/optee-fvp/trusted-firmware-a/build/fvp/debug/bl2/bl2.elf

bl31

b *EL3:0x0000000004003000

add-symbol-file /home/muhe/Study/optee-fvp/trusted-firmware-a/build/fvp/debug/bl31/bl31.elf

bl32

b *EL1S:0x6000000
add-symbol-file /home/muhe/Study/optee-fvp/optee_os/out/arm/core/tee.elf

UEFI 的符号加载比较特殊，这个部分是相对地址，并且很多模块是动态加载的，断点下到加载UEFI的地址，也就是BL31 跳转到BL33时的地址。断下后，

commands下通过 cmd_load_symbols 加载，执行前先要弄清楚几个参数

/home/muhe/Study/optee-fvp/edk2/ArmPlatformPkg/Scripts/Ds5/cmd_load_symbols.py

def usage():
    print "-v,--verbose"
    print "-a,--all: Load all symbols"
    print "-l,--report=: Filename for the EDK2 report log"
    print "-m,--sysmem=(base,size): System Memory region"
    print "-f,--fv=(base,size): Firmware region"
    print "-r,--rom=(base,size): ROM region"

-m 参数在

/home/muhe/Study/optee-fvp/edk2-platforms/Platform/ARM/VExpressPkg/ArmVExpress-FVP-AArch64.dsc

# System Memory (2GB - 16MB of Trusted DRAM at the top of the 32bit address space)

gArmTokenSpaceGuid.PcdSystemMemoryBase|0x80000000

gArmTokenSpaceGuid.PcdSystemMemorySize|0x7F000000

-f 参数在

/home/muhe/Study/optee-fvp/edk2-platforms/Platform/ARM/VExpressPkg/ArmVExpress-FVP-AArch64.fdf

[FD.FVP_AARCH64_EFI]

!ifdef ARM_FVP_RUN_NORFLASH

BaseAddress   = 0x08000000|gArmTokenSpaceGuid.PcdFdBaseAddress  # The base address of the Firmware in Flash0.

!else

BaseAddress   = 0x88000000|gArmTokenSpaceGuid.PcdFdBaseAddress  # UEFI in DRAM + 128MB.

!endif

Size          = 0x04000000|gArmTokenSpaceGuid.PcdFdSize         # The size in bytes of the device (64MiB).

ErasePolarity = 1

bl33

UEFI

b *EL2N:0x88000000

断点触发后，执行下面的命令加载符号。

1	source /home/muhe/Study/optee-fvp/edk2/ArmPlatformPkg/Scripts/Ds5/cmd_load_symbols.py -a -m (0x80000000, 0x7F000000) -f (0x88000000, 0x04000000)

info files
Symbols from "/home/muhe/Study/optee-fvp/edk2-platforms/Build/ArmVExpress-FVP-AArch64/DEBUG_GCC49/AARCH64/ArmPlatformPkg/PrePi/PeiUniCore/DEBUG/ArmPlatformPrePiUniCore.dll".
Local exec file:
        "/home/muhe/Study/optee-fvp/edk2-platforms/Build/ArmVExpress-FVP-AArch64/DEBUG_GCC49/AARCH64/ArmPlatformPkg/PrePi/PeiUniCore/DEBUG/ArmPlatformPrePiUniCore.dll", file type ELF64.
        Entry point: EL2N:0x0000000088000800.
        EL2N:0x0000000088000800 - EL2N:0x0000000088018AD7 is .text
        EL2N:0x0000000088019000 - EL2N:0x000000008801916F is .data

DxeCore的加载这个脚本处理不了，还是要自己加载

1	add-symbol-file /home/muhe/Study/optee-fvp/edk2-platforms/Build/ArmVExpress-FVP-AArch64/DEBUG_GCC49/AARCH64/MdeModulePkg/Core/Dxe/DxeMain/DEBUG/DxeCore.dll 0x00fe3d3000

现在就正常了:

Symbols from "/home/muhe/Study/optee-fvp/edk2-platforms/Build/ArmVExpress-FVP-AArch64/DEBUG_GCC49/AARCH64/ArmPlatformPkg/PrePi/PeiUniCore/DEBUG/ArmPlatformPrePiUniCore.dll".
Local exec file:
        "/home/muhe/Study/optee-fvp/edk2-platforms/Build/ArmVExpress-FVP-AArch64/DEBUG_GCC49/AARCH64/ArmPlatformPkg/PrePi/PeiUniCore/DEBUG/ArmPlatformPrePiUniCore.dll", file type ELF64.
        Entry point: EL2N:0x0000000088000800.
        EL2N:0x0000000088000800 - EL2N:0x0000000088018AD7 is .text
        EL2N:0x0000000088019000 - EL2N:0x000000008801916F is .data
Symbols from "/home/muhe/Study/optee-fvp/edk2-platforms/Build/ArmVExpress-FVP-AArch64/DEBUG_GCC49/AARCH64/MdeModulePkg/Core/Dxe/DxeMain/DEBUG/DxeCore.dll".
Local exec file:
        "/home/muhe/Study/optee-fvp/edk2-platforms/Build/ArmVExpress-FVP-AArch64/DEBUG_GCC49/AARCH64/MdeModulePkg/Core/Dxe/DxeMain/DEBUG/DxeCore.dll", file type ELF64.
        Entry point: EL2N:0x00000000FE3D4000.
        EL2N:0x00000000FE3D4000 - EL2N:0x00000000FE41AEBF is .text
        EL2N:0x00000000FE41B000 - EL2N:0x00000000FE435860 is .data

GRUB

TODO，这部分一直没时间搞，先挂起了

Linux Kernel

BL33是UEFl,其实UEFI 还会引导grub2, 这里grub2作为一个UEFl的driver(or 应用)被UEFl加载, grub执行完毕,引导linux时,其实linux 内核也打包作为一个UEFl的应用了,所以BL33的执行过程是, UEFI-＞ grub->linux内核的efi stub -＞ linux内核

加载符号，注意EL1N：0，因为内核主要运行在EL1N

1	add-symbol-file /home/muhe/Study/optee-fvp/linux/vmlinux EL1N:0

根据启动流程 :

__HEAD
        primary_entry
                __primary_switch
                        __enable_mmu
                        __primary_switched
                                设置异常向量表 // `adr_l       x8, vectors`
                                start_kernel()

我们可以对__primary_switch 下断，如果符号对不上，可以根据地址下断

1
2
3

# muhe @ muhe-NUC11PAHi5 in ~/Study/optee-fvp/linux on git:29aee39cf x [23:24:42]
$ cat System.map | grep "primary_switched"
ffff80000919032c t __primary_switched

JVM设置

修改ads的jvm，否则调试的时候容易oom影响体验

https://developer.arm.com/documentation/ka003567/latest

# muhe @ muhe-NUC11PAHi5 in /usr/arm/developmentstudio-2022.1/sw/ide [20:20:40]
$ cat armds_ide.ini
-startup
plugins/org.eclipse.equinox.launcher_1.6.400.v20210924-0641.jar
--launcher.library
plugins/org.eclipse.equinox.launcher.gtk.linux.x86_64_1.2.400.v20211117-0650
-vm
../java/lib/server/libjvm.so
-vmargs
--add-opens=java.base/java.io=ALL-UNNAMED
--add-opens=java.base/sun.nio.ch=ALL-UNNAMED
--add-opens=java.base/java.lang=ALL-UNNAMED
--add-opens=java.base/java.util=ALL-UNNAMED
--add-opens=java.base/java.nio.charset=ALL-UNNAMED
--add-opens=java.base/java.nio=ALL-UNNAMED
--add-opens=java.base/java.lang.reflect=ALL-UNNAMED
-Dnashorn.args=--no-deprecation-warning

添加参数

1
2
3

-Xms4096m 
-Xmx4096m 
-Xmn256m

参考

https://download.csdn.net/course/detail/37655

https://optee.readthedocs.io/en/latest/

https://armv8-ref.codingbelief.com/zh/

https://edu.csdn.net/lecturer/6964

weggli debug

2022-07-24T01:19:32.000Z

关于Weggli

AST Pattern Search

核心是使用和 tree-sitter 库，然后搞了 query-tree 来在 AST上进行搜索，这只能说是匹配特定的代码片段，还达不到程序分析的那个级别，所以理论上只能过程内分析，而且没有上下文啥的 :D 直白点说的话，像是AST的正则表达式，不过某种意义上来说对于使用白盒方案快速召回一些漏洞也是一种借鉴吧。

当然我也用这个工具做了一些扩展，结合其他工具解决了一些问题，目前看来这个东西还是具有一定的可玩性的 :D

Weggli如何工作

看代码，调试分析

idea配置

安装Rust插件，调试的话，会默认再去安装Native Debugging Support，有了这俩东西就可以调试了

配置传递给weggli的参数的话跟在 -- 后面即可 :

1	run --package weggli --bin weggli -- "{$func($b);system($b);}" -R "func=printf$" /path/to/src

工作流程

只描述核心流程

query-tree 构建

参考 tree-sitter文档

let work: Vec = args
        .pattern
        .iter()
        .map(|pattern| {
            match parse_search_pattern(pattern, args.cpp, args.force_query, ®ex_constraints) {
                Ok(qt) => {
                    let identifiers = qt.identifiers();
                    variables.extend(qt.variables());
                    WorkItem { qt, identifiers }
        // ....

构造 WorkItem{qt, identifiers}

qt : query-tree, tree-sitter的Tree对象
identifiers : 标识符，query中”终结符”

调用链:

main
    parse_search_pattern
        weggli::parse(pattern, is_cpp) // 返回Tree对象
        //修正pattern
        validate_query
        build_query_tree

修正pattern : weggli处理了“不合法的”格式，如:

memcpy(a,b,size) -> memcpy(a,b,size);
memcpy(a,b,size); -> {memcpy(a,b,size);}

1	validate_query(&tree, p, force_query)? // 返回 TreeCursor对象，用于遍历AST

语法合法性检查，如果 force_query为True，意味着忽略这些语法错误

如 :

1	"{$func($b);_($b);}"

对应 :

(translation_unit 
    (
        compound_statement 
        (
            expression_statement (call_expression function: (identifier) arguments: (argument_list (identifier)))
        ) 
        (
            expression_statement (call_expression function: (identifier) arguments: (argument_list (identifier)))
        )
    )
)

同时还不允许 :

返回的是 : c.goto_first_child();，即花括号中间的内容

Ok(build_query_tree(
 p,
 &mut c,
 is_cpp,
 Some(regex_constraints.clone()),
))

_build_query_tree(source, cursor, 0, is_cpp, false, false, regex_constraints)

QueryTree数据结构:

pub struct QueryTree {
    query: Query,
    captures: Vec,
    negations: Vec,
    variables: HashSet<String>,
    id: usize,
}

转换的tree_sitter query (核心逻辑都在 builder.rs 的 QueryBuilder.build)

1 2	Translate the tree below `c` into a tree-sitter query string. "{$func($b);_($b);}"

1
2

tree_sitter query 1: ((call_expression function:[(identifier) (field_expression) (field_identifier)] @0 arguments:(argument_list [(identifier) (field_expression) (field_identifier)] @1)) )([(identifier) (field_expression) (field_identifier)] @2 )
tree_sitter query 0: (function_definition body: (compound_statement) @0) @1

深度优先的方式递归生成query tree string，按照AST解析出来不同的节点，后面跟着的 @x 用来区分不同的 identifier，方便后面做匹配。

如简单的 {printf(var, bar);} 生成的 query-tree是 :

((call_expression         
        function:  [(field_expression field: (field_identifier)@0) (identifier) @0] 
        arguments: (argument_list 
                        . (identifier) @1 
                        . (identifier) @2)
                    ) 
                        
                        (#eq? @0 "printf")(#eq? @1 "var")(#eq? @2 "bar")) // captures

结合tree-sitter的playground来看就很容易看明白了:

query执行(pattern 匹配)

在执行query之前会做

对于需要正则匹配的 identifer做合法性确认

for v in regex_constraints.variables() {
        if !variables.contains(v) {
            eprintln!("'{}' is not a valid query variable", v.red());
            std::process::exit(1)
        }
    }

确定待解析源码文件(Verify that the --include and --exclude regexes are valid.) 主要是根据后缀来

随后就是通过管道来处理，分为：

文件读取 & AST解析 let (ast_tx, ast_rx) = mpsc::channel();
QueryTree 匹配 & 结果输出 let (results_tx, results_rx) = mpsc::channel();

// Spawn worker to iterate through files, parse potential matches and forward ASTs
s.spawn(move |_| parse_files_worker(files, ast_tx, w, cpp));

// Run search queries on ASTs and apply CLI constraints
// on the results. For single query executions, we can
// directly print any remaining matches. For multi
// query runs we forward them to our next worker function
s.spawn(move |_| execute_queries_worker(ast_rx, results_tx, w, &args));

if w.len() > 1 {
    s.spawn(move |_| multi_query_worker(results_rx, w.len(), before, after));
}

**这玩意描述起来就像个流水线 :D **

详细描述的话就是：在有了 query-tree就需要把目标文件，解析(parse_files_worker)成 (Tree, source_code)，结果发送到 ast_tx，然后从ast_rx获取这些信息来执行查询操作(execute_queries_worker)；结果放在 result_tx，后面处理结果的函数会从result_rx获取，然后输出。

parse_files_worker(files, ast_tx, w, cpp);
    weggli::parse(....);
execute_queries_worker(ast_rx, results_tx, w, &args); // w  WorkItem，里面有query-tree
    qt.matches(tree.root_node(), &source);
    match_internal(...);
    QueryCursor.matches(...);
    QueryTree.process_match(...);

TODO: 需要细读逻辑

这里简单的加一句print之类的可以来看看每次query的时候目标tree是啥样的(生成过程和query tree类似)

// Run query
let tmp_tree = tree.root_node().to_sexp();
let matches = qt.matches(tree.root_node(), &source);

所以这就转换成了一个字符串匹配的问题，结合之前的 -R ，能支持正则匹配，所以说weggli是在AST上搞正则匹配一点都没说错 :D

multi-query(`-p` 参数)

漏洞模型测试

Question - query construction 这个issue里提到了这个场景，先还原一下场景 :

vuln.c 是个类似的情况，尝试query

#include 
#include 
#include 

int wtf(int a){
    return a + 1337;
}


int foo(int bar){

    wtf(bar);

    system(bar);
}


int vuln(char *data){

    char cmd[2048] = {0};

    sprintf(cmd, "/bin/bash %s > /tmp", data);

    return system(cmd);
}


int main(int argc, char*argv[]){


    if (argc < 2){
        return 0;
    }

    foo(11111);
    vuln(argv[1]);
    return 0;
}

匹配函数定义(vuln)
匹配func call vuln(argv[1])

假如没有对vuln的调用，那就不回返回结果

multi-query 实现

这块逻辑主要在 multi_query_worker ，即存在多个workitem的时候会触发，就是在匹配的时候会结合这些query，即将第一个query匹配到的结果先收集起来

let mut query_results = Vec::with_capacity(num_queries);
for _ in 0..num_queries {
    query_results.push(Vec::new());
}

// collect all results
for ctx in results_rx {
    query_results[ctx.query_index].push(ctx);
}

然后根据后面的query去做过滤，找到满足的pattern就打印出来

let filter = |x: &mut Vec, y: &mut Vec| {
        x.retain(|r| {
            y.iter()
                .any(|f| r.result.chainable(&r.source, &f.result, &f.source))
        })
    };

for i in 0..query_results.len() {
        let (part1, part2) = query_results.split_at_mut(i + 1);
        let a = part1.last_mut().unwrap();
        for b in part2 {
            filter(a, b);
            filter(b, a);
        }
    }

方便调试做的修改

1. 打印 query-tree 和源码 AST方便定位问题

query-tree的话增加一个 -v 参数就行，会把query tree打印出来

少量代码测试这样是可以的，也可以使用log模块把信息打出来，不过数据太多了。

diff --git a/src/main.rs b/src/main.rs
index a819c5c..caf9a51 100644
--- a/src/main.rs
+++ b/src/main.rs
@@ -468,6 +468,8 @@ fn execute_queries_worker(
                 .enumerate()
                 .for_each(|(i, WorkItem { qt, identifiers: _ })| {
                     // Run query
+                    let tmp_tree = tree.root_node().to_sexp();
+                    info!("AST : {}", tmp_tree);
                     let matches = qt.matches(tree.root_node(), &source);
 
                     if matches.is_empty() {

直观多了 :

MTK Preloader 踩坑

2022-03-05T13:07:17.000Z

背景

MT6737T
Android

前期readback 什么都都正常，也切出来了各个分区，并制作了scatter。

折腾的时候发现SP Flash Tool 加载preloader的时候有报错：

看日志

02/23/22 22:35:20.309 BROM_DLL[3848][1900]: DL_HANDLE()::Rom_Load(): ROM loaded, name = preloader (flashtool_handle_internal.cpp:4693)

02/23/22 22:35:20.309 BROM_DLL[3848][1900]: DEBUG: DL_HANDLE::UpdateRomFileInfoByPreloader(): UpdateRomFileInfoByPreloader get bbchiptype : 159 (flashtool_handle_internal.cpp:4359) //chip type 所以应该是强绑定的
02/23/22 22:35:20.309 BROM_DLL[3848][1900]: DL_HANDLE()::UpdateRomFileInfoByPreloader(): Loading SV5 BL, name = preloader (flashtool_handle_internal.cpp:4374)

02/23/22 22:35:20.309 BROM_DLL[3848][1900]: ERROR: DL_HANDLE(0x0BC38DE8)::UpdateRomFileInfoByPreloader(): [0]: preloader - Parse GFH_FILE_INFO error(0x00001008)!  (flashtool_handle_internal.cpp:4385)
02/23/22 22:35:20.309 BROM_DLL[3848][1900]: ERROR: DL_HANDLE(0xB7B1A8AC)::File length not match with GFH specified file length (flashtool_handle_internal.cpp:4386) // 不匹配！ GFH 指定的文件长度不匹配
02/23/22 22:35:20.309 BROM_DLL[3848][1900]: ERROR: File length (262160) / GFH specified file length (0) (flashtool_handle_internal.cpp:4387)  // 这里，文件长度是xxx，但是GFH里指定的不对
02/23/22 22:35:20.309 BROM_DLL[3848][1900]: ERROR: DL_Rom_Load(): [232][error][5066] [S_DL_PC_BL_INVALID_GFH_FILE_INFO] (flashtool_handle.cpp:941)
02/23/22 22:35:20.309 BROM_DLL[3848][1900]: DL_Rom_Load(): DL_HANDLE->rwlock: WRITE_UNLOCK. (rwlock.cpp:476)

所以：

DL_HANDLE()::Rom_Load() 函数
这个平台校验了size字段和实际preloader文件的size

逆向分析

1 2	$ file libflashtool.v1.so libflashtool.v1.so: ELF 64-bit LSB shared object, x86-64, version 1 (GNU/Linux), dynamically linked, BuildID[sha1]=de4c47b0bb41c274fd42efb55ceb476bcc840d7a, not stripped

在 DL_HANDLE::UpdateRomFileInfoByPreloader 方法中找到了校验的逻辑：

if ( *((_DWORD *)var48 + 15) == 7 )
{
  err_code = DL_HANDLE::UpdateRomFileInfoByPreloader(this, sys_index);// updateROM File!
  if ( err_code )
    return err_code;
}

erro_code = ROM_ID_Class::LoadGFH((__int64)this + 112, *((_QWORD *)ROM + 123), 0, 
(__int64)&GFH);
if ( erro_code > 0xFFF )
{
  r12_12 = (const char *)std::string::c_str(ROM);
  rbx12 = g_hBROM_DEBUG;
  MetaTrace::MetaTrace(
    (MetaTrace *)var1030,
    "FlashToolLib/source/common/handle/src/flashtool_handle_internal.cpp",
    4417,
    0xFFu,
    " ERROR:");
  MetaTrace::operator()(
    var1030,
    rbx12,
    "DL_HANDLE(0x%08X)::UpdateRomFileInfoByPreloader(): [%u]: %s - Load GFH_FILE_INFO error(0x%08X)!  ",
    this,
    rom_file_name,
    r12_12,
    erro_code);
  MetaTrace::~MetaTrace((MetaTrace *)var1030);
  return 5066;
}
if ( *((_DWORD *)GFH + 8) != *((_QWORD *)ROM + 0x7C) )// length check!!
{

  //.....error log

 }

ROM + 0x7C 是实际的文件大小
GFH + 8 是解析preloader 中的GFH结构中的size字段

ROM_ID_Class::LoadGFH
    GFH_Find(rom_buffer, type, (_QWORD *)st);
        GFH_Internal_Parser(buff_addr, 0LL, type, GFG_st);

__int64 __fastcall GFH_Internal_Parser(__int64 buf_addr, __int64 flag_0, int type, _QWORD *GFG_st)
{
  __int64 result; // rax
  __int64 st; // [rsp+20h] [rbp-30h]
  __int64 v8; // [rsp+28h] [rbp-28h]
  unsigned int cnt; // [rsp+3Ch] [rbp-14h]
  unsigned int v10; // [rsp+40h] [rbp-10h]
  unsigned int i; // [rsp+44h] [rbp-Ch]
  unsigned int ret; // [rsp+48h] [rbp-8h]
  unsigned int reta; // [rsp+48h] [rbp-8h]
  char v14; // [rsp+4Eh] [rbp-2h]
  char v15_0; // [rsp+4Fh] [rbp-1h]

  v15_0 = 0;
  v14 = 0;
  if ( flag_0 )
    v15_0 = 1;
  ret = GFH_FILE_INFO_BasicCheck(buf_addr);
  if ( ret > 0xFFF )
    return ret;
  cnt = *(_DWORD *)(buf_addr + 0x28);
  for ( i = 0; i < cnt; i = v10 )               // parse sub struct?
  {
    st = buf_addr + i;
    if ( (*(_DWORD *)st & 0xFFFFFF) != 5066061 )
      return 0x1003LL;
    v10 = i + *(unsigned __int16 *)(st + 4);
    if ( cnt < v10 )
      return 0x1005LL;
    if ( v15_0 )
    {
      if ( *(_WORD *)(st + 6) <= 0x104u )
      {
        v8 = flag_0 + 24LL * *(unsigned __int16 *)(st + 6) + 8;
        if ( *(_BYTE *)v8 )
        {
          reta = (*(__int64 (__fastcall **)(__int64, _QWORD))(v8 + 8))(st, *(_QWORD *)(v8 + 16));
          if ( reta > 0xFFF )
            return reta;
          v14 = 1;
        }
      }
    }
    else if ( type == *(unsigned __int16 *)(st + 6) )
    {
      *GFG_st = st;                             // [1]
      return 0LL;
    }
  }
  if ( v15_0 && v14 )
    result = 0LL;
  else
    result = 0x1003LL;
  return result;
}

[1] 的位置找到这个结构，然后把指针赋值，分析这段逻辑，其实就是文件头:

指定preloader文件大小是 0x26794，修改文件大小即可。

解决报错

所以只需要修改 preloader文件的长度为其 +0x24 处 4bytes代表size的字段即可
PS：不能修改这个长度字段

深入研究

之前搞的平台也没注意这个问题，也没报错，但是size对不上，所以需要探究文件格式和为什么检查

什么是preloader

MTK6735 pre-loader源代码分析 - luoyuna - 博客园
[MT6765]Preloader_流程分析–基于android 10_nancy的专栏-CSDN博客_android pmic
还有leak的MT6577的基线代码参考

介于boot rom 和 bootloader之间的桥梁，主要工作是初始化环境，包括c环境，timer,gpio,pmic,uart,i2c等以及装载lk镜像至DRAM中,建立起最基本的运行环境,最重要的就是初始化DRAM。

执行在 ARM EL3

工作原理 – 启动过程

另一种情况是实现了ATF(Arm Trust Firmware)的时候：

ATF实现原理_chenying126的博客-CSDN博客_atf

boot rom中执行boot code
把preloader加载到 ISRAM中
执行preloader，各种初始化的工作(DRAM初始化)
把bootloader(uboot, lk)加载到DRAM
跳转到lk执行
lk执行
把Linux kernel 和 ramdisk加载到DRAM
跳转到kernel
kernel执行
这是在Linux启动过程中使用的一个临时根

preloader 解析

preloader可以看成一个特定格式的可执行文件，所以需要找入口点。

/Users/muhe/Code/MTK6577/mediatek/platform/mt6577/preloader/src/init/init.s

github上找的一个可能是泄漏的基线代码来参考的

.globl _start

_start :

b resethandler

bss_start:

.word _bss_start

bss_end:

.word _bss_end

stack :

.long sys_stack

stacksz:

.long sys_stack_sz

  
resethandler :
    MOV r0, #0
    
    MOV r1, #0
    
    MOV r2, #0
    
    MOV r3, #0
    
    MOV r4, #0
    
    MOV r5, #0
    
    MOV r6, #0
    
    MOV r7, #0
    
    MOV r8, #0
    
    MOV r9, #0
    
    MOV r10, #0
    
    MOV r11, #0
    
    MOV r12, #0
    
    MOV sp, #0
    
    MOV lr, #0

这个特征还是很明显的，可以试试看:

上面这个0xEA应该是 b指令，可以借由这个搞定基地址

然后是到main.c，继续人肉找特征

找到了字符串，但是没有引用关系 :(

通过Ghrida的强制整个binary的分析，然后引用关系确定了main的位置，至此就可以往下看了，对比其他平台preloader的源码，能看个七七八八了。

PS : 基地址编译的时候可以指定的，比如在 linux/bootloader/preloader/platform/mt6735/link_descriptor.ld

OUTPUT_ARCH(arm)

ENTRY(_start)

romBase = 0x00201000;
ramBase = 0x00102180;

MEMORY {
    ram : ORIGIN = ramBase, LENGTH = 0xBA80
    rom : ORIGIN = romBase, LENGTH = 0x1F000
}

还有 : linux/bootloader/preloader/platform/mt6735/default.mak

github真是个好地方啊，还有一个完整的MT6737平台Linux based的基线代码，全套的环境和build产物都有的，可以看到：

推测preloader应该是一个elf 经过copyobj之类的处理之后拼接上了特定的文件头

1 2	$ file *.elf preloader_bd6737m_35g_b_m0.elf: ELF 32-bit LSB executable, ARM, EABI5 version 1 (SYSV), statically linked, with debug_info, not stripped

查看相关的makefile可以验证该猜想:

$(D_BIN)/preloader.elf: $(D_BIN)/$(PL_IMAGE_NAME).elf

    $(OBJCOPY) -R .dram $(D_BIN)/$(PL_IMAGE_NAME).elf -O elf32-littlearm $(D_BIN)/preloader.elf


ifeq ($(CFG_PRELOADER_DRAM_USE), 1)

preloader_bin: $(D_BIN)/$(PL_DRAM_IMAGE_NAME).bin

    $(D_BIN)/$(PL_DRAM_IMAGE_NAME).bin: $(D_BIN)/$(PL_IMAGE_NAME).elf
    
    $(hide) $(OBJCOPY) ${OBJCFLAGS} $(OBJSECOND_FLAG) $(D_BIN)/$(PL_IMAGE_NAME).elf -O binary $(D_BIN)/$(PL_DRAM_IMAGE_NAME).bin

遂尝试：

PL_IMG_SECOND_PARTION_SECTION :=.pl_dram.text .pl_dram.data .pl_dram.rodata .pl_dram.start
OBJSECOND_FLAG := $(addprefix -j , $(PL_IMG_SECOND_PARTION_SECTION))

objcopy --gap-fill=0xff $OBJSECOND_FLAG input.elf -O binary output.bin

addprefix这个可以忽略

当然，hash想一样还是想多了，毕竟编译环境都不一样，直接上diff：

一共两处：

这个是多了一个GFH结构（说好的 NO_GFH 难道只是说头没有)

preloader_bd6737m_35g_b_m0_LINKED.bin
- 比output.bin 多了一个GFH在尾部
preloader_bd6737m_35g_b_m0_NO_GFH.bin
- 中间与部分数据不一致
- 比output.bin 多了一个GFH在尾部
preloader_bd6737m_35g_b_m0.bin 比 preloader_bd6737m_35g_b_m0_NO_GFH.bin 又多了一个GFH头和尾部的签名数据

所以这里可以认定：

preloader是一个elf，通过copyobj处理后，头、尾添加GFH相关的数据，得到MTK平台的preloader
然后MTK平台的preloader再添加EMMC BOOT头，就得到了从EMMC_BOOT_[1,2] 分区中得到的数据

结构

这里以EMMC为例：

EMMC_BOOT + GFH_INFO_EMMC + WTF1 + preloader_code + WTF2

EMMC_BOOT
- MT6737/linux/bootloader/preloader/tools/gen-preloader-img.py
GFH_INFO_EMMC :
- linux/bootloader/preloader/platform/mt6735/gfh/default/ns/GFH_INFO_EMMC.txt
GFH Part 2 : GFH 的另一部分，还会修改上面的size
- linux/bootloader/preloader/tools/pbp/*
preloader_code
- preloader.elf objcopy处理之后
WTF 2 :
- ?

继续看Makefile来分析：

$(D_BIN)/$(PL_IMAGE_NAME).bin: $(D_BIN)/$(PL_IMAGE_NAME)_NO_GFH.bin $(GFH_INFO) $(GFH_HASH) $(PBP_TOOL)

    @echo "[ Only for Non-Secure Chip ]"
    
    @echo "============================================"
    
    @echo "INI_GFH_GEN=NO"
    
    @echo "[ Attach $(MTK_PLATFORM) GFH ]"
    
    @echo "============================================"
    
    @echo " : GFH_INFO - $(GFH_INFO)"
    
    @echo " : GFH_HASH - $(GFH_HASH)"
    
    cp -f $(GFH_INFO) $@
    
    @chmod 777 $@
    
    cat $< >> $@
    
    cat $(GFH_HASH) >> $@
    
    $(PBP_TOOL) $@
    
    @echo "$(PBP_TOOL) pass !!!!"

// ...

$(D_BIN)/$(PL_IMAGE_NAME).bin: $(D_BIN)/$(PL_IMAGE_NAME)_LINKED.bin

    cp -f $< $@

遂可以得到：

EMMC_BOOT
- MT6737/linux/bootloader/preloader/tools/gen-preloader-img.py 生成
GFH_INFO_EMMC
- **linux/bootloader/preloader/platform/mt6735/gfh/default/ns/GFH_INFO_EMMC.txt** 但是这个file size字段是0xffffffff，后续会处理
WTF1 : GFH_HASH
- GFH_HASH.txt // GFH部分会由PBP_TOOL再次处理
preloader code
- 编译的elf经过objcopy处理之后的代码数据
WTF2 ：preloader extension

参考

将Android/iOS上的流量转发到Wireshark分析

2021-12-15T08:50:53.000Z

背景&&需求

迫于要分析一些SDK里的协议，需要抓到所有的流量来分析交互过程，所以有了这篇记录，主要是基于实时监控Android设备网络封包做的尝试，然后使用相同的思路扩展到了iOS上。

原理图：

1 2	tcpdump---nc---端口转发---nc----wireshark \|------手机------\|\|-------PC端-------\|

Android

手机必须root

adb
tcpdump
nc

手机端:

1	tcpdump -l -n -s 0 -v -w - \| nc -l -p 11233

PC端:

1	adb forward tcp:11233 tcp:11233 && nc 127.0.0.1 11233 \| wireshark -k -S -i -

iOS

手机必须越狱

nc
tcpdump
iproxy(libimobiledevice)

手机端:

1	tcpdump -l -n -s 0 -v -w - \| nc -l -p 11233

PC端:

1 2	~  iproxy 11233 11233 Creating listening port 11233 for device port 11233

1	~  nc 127.0.0.1 11233 \| wireshark -k -S -i -

参考

实时监控Android设备网络封包

Android Native Fuzz Demo

2021-12-08T14:54:18.000Z

Background

TrapFuzz的思路Fuzzing Android native库，这就是个简单的Demo，只针对黑盒的库。

honggfuzz on Android

设置好NDK路径
brew install automake

构建所有的arch(arm64-v8a, armeabi, armeabi-v7a, x86, x86_64)

1	make android-all

坑1: libunwind编译的各种问题:

macos不好使，换linux去编译，然后用ndk r20.

传到手机上试试看：

然后就是写个demo，在手机上跑一下看看情况

hfuzz-cc is missing on android build · Issue #341 · google/honggfuzz

No coverage information on android · Issue #342 · google/honggfuzz

参数 fsanitize-coverage=trace-pc-guard,trace-cmp,trace-div,indirect-calls

这个参数的话会有警告信息，应该是clang 参数的问题。

后面参考了谷歌的文档，替换了参数，结果没警告了，但是cov还是0.

# muhe @ muhe-Parallels-Virtual-Platform in ~/ndk_fuzzing_demo [14:51:59] 
$ cat Android.mk 
LOCAL_PATH:= $(call my-dir)

include $(CLEAR_VARS)
LOCAL_PATH = .
LOCAL_MODULE := hfuzz
LOCAL_EXPORT_C_INCLUDES := $HOME/honggfuzz/includes
LOCAL_SRC_FILES := /home/muhe/honggfuzz/libs/arm64-v8a/libhfuzz.a
LOCAL_ARM_MODE := arm
include $(PREBUILT_STATIC_LIBRARY)

include $(CLEAR_VARS)
LOCAL_PATH = .
LOCAL_MODULE := hfuzzcommon
LOCAL_EXPORT_C_INCLUDES := $HOME/honggfuzz/includes
LOCAL_SRC_FILES := /home/muhe/honggfuzz/obj/local/arm64-v8a/libcommon.a
LOCAL_ARM_MODE := arm
include $(PREBUILT_STATIC_LIBRARY)

include $(CLEAR_VARS)
LOCAL_STATIC_LIBRARIES := hfuzz hfuzzcommon
LOCAL_SRC_FILES := fuzz_test.c
LOCAL_MODULE := fuzz_test
LOCAL_ARM_MODE := arm

include $(BUILD_EXECUTABLE)

# muhe @ muhe-Parallels-Virtual-Platform in ~/ndk_fuzzing_demo [14:52:01] 
$ cat Application.mk 
APP_BUILD_SCRIPT := ./Android.mk
APP_STL := c++_shared # Or system, or none.
APP_CFLAGS := -fsanitize=address  -fno-omit-frame-pointer
APP_LDFLAGS := -fsanitize=address 

# muhe @ muhe-Parallels-Virtual-Platform in ~/ndk_fuzzing_demo [14:52:03] 
$

退回到honggfuzz 2.2 然后用最开始 #342 那个issue的编译参数是可以的

完整项目:

# muhe @ muhe-Parallels-Virtual-Platform in ~/ndk_fuzzing_demo [15:53:52] C:130
$ cat Android.mk 
LOCAL_PATH:= $(call my-dir)

include $(CLEAR_VARS)
LOCAL_PATH = .
LOCAL_MODULE := hfuzz
LOCAL_EXPORT_C_INCLUDES := $HOME/honggfuzz/includes
LOCAL_SRC_FILES := /home/muhe/honggfuzz/libs/arm64-v8a/libhfuzz.a
include $(PREBUILT_STATIC_LIBRARY)

include $(CLEAR_VARS)
LOCAL_PATH = .
LOCAL_MODULE := hfuzzcommon
LOCAL_EXPORT_C_INCLUDES := $HOME/honggfuzz/includes
LOCAL_SRC_FILES := /home/muhe/honggfuzz/obj/local/arm64-v8a/libcommon.a
include $(PREBUILT_STATIC_LIBRARY)

include $(CLEAR_VARS)
LOCAL_STATIC_LIBRARIES := hfuzz hfuzzcommon
LOCAL_SRC_FILES := fuzz_test.c
LOCAL_MODULE := fuzz_test
LOCAL_CFLAGS := -fsanitize-coverage=trace-pc-guard,trace-cmp,trace-div,indirect-calls
LOCAL_LD_FLAGS := -fsanitize-coverage=trace-pc-guard,trace-cmp,trace-div,indirect-calls

include $(BUILD_EXECUTABLE)

# muhe @ muhe-Parallels-Virtual-Platform in ~/ndk_fuzzing_demo [15:53:53] 
$ cat Application.mk 
APP_BUILD_SCRIPT := ./Android.mk
#APP_STL := c++_shared # Or system, or none.
#APP_CFLAGS := -fsanitize-coverage=trace-pc-guard,trace-cmp,trace-div,indirect-calls 
#APP_LDFLAGS := -fsanitize-coverage=trace-pc-guard,trace-cmp,trace-div,indirect-calls

# muhe @ muhe-Parallels-Virtual-Platform in ~/ndk_fuzzing_demo [15:53:55] 
$ cat fuzz_test.c 

#include 
#include 
#include 

int test_target(char* input_file_path, char* argv_0)
{
    char *crash = NULL;
    FILE *fp = fopen(input_file_path, "rb");
    char c;
    if (!fp) {
        printf("Error opening file\\n");
        return 0;
    }
    if (fread(&c, 1, 1, fp) != 1) {
        printf("Error reading file\\n");
        fclose(fp);
        return 0;
    }
    if (c != 't') {
        printf("Error 1\\n");
        fclose(fp);
        return 0;
    }
    if (fread(&c, 1, 1, fp) != 1) {
        printf("Error reading file\\n");
        fclose(fp);
        return 0;
    }
    if (c != 'e') {
        printf("Error 2\\n");
        fclose(fp);
        return 0;
    }
    if (fread(&c, 1, 1, fp) != 1) {
        printf("Error reading file\\n");
        fclose(fp);
        return 0;
    }
    if (c != 's') {
        printf("Error 3\\n");
        fclose(fp);
        return 0;
    }
    if (fread(&c, 1, 1, fp) != 1) {
        printf("Error reading file\\n");
        fclose(fp);
        return 0;
    }
    if (c != 't') {
        printf("Error 4\\n");
        fclose(fp);
        return 0;
    }
    printf("!!!!!!!!!!OK!!!!!!!!!!\\n");

    if (fread(&c, 1, 1, fp) != 1) {
        printf("Error reading file\\n");
        fclose(fp);
        return 0;
    }
    if (c == '1') {
        // cause a crash
        crash[0] = 1;
    }
    else if (c == '2') {
        char buffer[5] = { 0 };
        // stack-based overflow to trigger the GS cookie corruption
        for (int i = 0; i < 5; ++i)
            strcat(buffer, argv_0);
        printf("buffer: %s\\n", buffer);
    }
    else {
        printf("Error 5\\n");
    }
    fclose(fp);
    return 0;
}

int main(int argc, char** argv)
{
    if(argc < 2) {
        printf("Usage: %s \\n", argv[0]);
        return 0;
    }

        //regular single target call
    return test_target(argv[1], argv[0]);
}

ndk构建命令：

1	ndk-build NDK_PROJECT_PATH=. NDK_APPLICATION_MK=Application.mk TARGET_ARCH_ABI=arm64-v8a

write harness for `.so`

使用native-harness-target

参考项目 : https://github.com/CalebFenton/native-harness-target

Android 7.1.1

可以使用这个方式跑起来，不过速度及其的慢。

TODO :

速度问题，考虑docker Android或者qemu-kvm
port 到 Android 10

Android 10 :

rednaga/native-shim

export LD_LIBRARY_PATH=`pwd`:/apex/com.android.runtime/lib::$LD_LIBRARY_PATH

export LD_LIBRARY_PATH=`pwd`:/apex/com.android.runtime/lib64:$LD_LIBRARY_PATH
255|walleye:/data/local/tmp # ./shim libstr-crypt.so
[*] native-shim - diff
 [+] Attempting to load : [ libstr-crypt.so ]
 [+] Library Loaded!
 [+] Initializing JavaVM Instance
 [+] Initialization success (vm=0x74eb6901c0, env=0x74eb6e06c0)
 [+] Found JNI_OnLoad, attempting to call
 [+] Closing library
walleye:/data/local/tmp #

libpl_droidsonroids_gif.so测试

work with honggfuzz

经典的 patch 跳转指令，实现一个debugger来获取覆盖率的方案

使用之前 patch跳转的方式搞覆盖率，修改honggfuzz即可
问题：创建JVM相关的操作耗时，影响效率
为了解决效率问题，如果可以自己写一个，初始化之后，fork，然后疯狂搞fork出来的子进程即可，这样效率就上去了。

get all JUMP INS

获取patch需要patch的指令地址，直接从p0tools里抄

import idautils
import idaapi
import ida_nalt
import idc

# See 

from os.path import expanduser
home = expanduser("~")

patchpoints = set()

max_offset = 0
for seg_ea in idautils.Segments():
    name = idc.get_segm_name(seg_ea)
    if name != ".text":
        continue

    start = idc.get_segm_start(seg_ea)
    end = idc.get_segm_end(seg_ea)
    print(hex(start), hex(end))
    
    for func_ea in idautils.Functions(start, end):
        f = idaapi.get_func(func_ea)
        if not f:
            continue
        for block in idaapi.FlowChart(f):
            if start <= block.start_ea < end:
                max_offset = max(max_offset, block.start_ea)
                patchpoints.add(block.start_ea)
            else:
                print("Warning, broken CFG?")

# Round up max_offset to page size
size = max_offset
rem = size % 0x1000
if rem != 0:
    size += 0x1000 - rem

with open(home + "/Desktop/patches.txt", "w") as f:
    f.write(ida_nalt.get_root_filename() + ':' + hex(size) + '\\n')
    f.write('\\n'.join(map(hex, sorted(patchpoints))))
    f.write('\\n')

print("Done, found {} patchpoints".format(len(patchpoints)))

Patch or hook INS

问题：需要想办法做到 hfuzzcc一样的效果，即把 libhfuzz.a 链接进目标binary，不然没有桩信息。

看看hfuzzcc是怎么工作的

看起来就是一层wrapper，给clang/gcc编译的时候增加了 CFLAGS 和 LDFLAGS，看起来只需要按照需求把参数放到 Android.mk即可。

这里参考ImageIO例子中的编译的参数

cc
-I/Users/vuln_test/honggfuzz/includes/
-Wno-unused-command-line-argument
-fsanitize-coverage=trace-pc-guard,trace-cmp,trace-div,indirect-calls
-mllvm
-sanitizer-coverage-prune-blocks=1
-fno-inline
-fno-builtin
-fno-omit-frame-pointer
-D__NO_STRING_INLINES

-DHFND_FUZZING_ENTRY_FUNCTION_CXX(x,y)=extern const char* LIBHFNETDRIVER_module_netdriver;const char** LIBHFNETDRIVER_tmp1 = &LIBHFNETDRIVER_module_netdriver;extern "C" int HonggfuzzNetDriver_main(x,y);int HonggfuzzNetDriver_main(x,y)

-DHFND_FUZZING_ENTRY_FUNCTION(x,y)=extern const char* LIBHFNETDRIVER_module_netdriver;const char** LIBHFNETDRIVER_tmp1 = &LIBHFNETDRIVER_module_netdriver;int HonggfuzzNetDriver_main(x,y);int HonggfuzzNetDriver_main(x,y)

-Wl,-U,_HonggfuzzNetDriver_main
-Wl,-U,_LIBHFUZZ_module_instrument
-Wl,-U,_LIBHFUZZ_module_memorycmp
**-o
runner**
**runner.m**
-framework
Foundation
-framework
CoreGraphics
-framework
AppKit
/tmp/libhfnetdriver.501.7140081f7cd58e92.a
/tmp/**libhfuzz**.501.2fdc27091cd8b54d.a
/tmp/libhfuzz.501.a5556386f906dc80.a
-pthread
-ldl
include $(CLEAR_VARS)
LOCAL_STATIC_LIBRARIES := hfuzz hfuzzcommon 
LOCAL_SRC_FILES := fuzz_test.c
LOCAL_MODULE := fuzz_test
LOCAL_CFLAGS :=  -fsanitize-coverage=trace-pc-guard,trace-cmp,trace-div,indirect-calls \\
                 -fno-omit-frame-pointer -fno-inline -fno-builtin \\
                 -fno-omit-frame-pointer -Wl,-u,_LIBHFUZZ_module_instrument -Wl,-u,_LIBHFUZZ_module_memorycmp -ldl

LOCAL_LDFLAGS :=  -fsanitize-coverage=trace-pc-guard,trace-cmp,trace-div,indirect-calls \\
                   -fno-inline -fno-builtin \\
                   -fno-omit-frame-pointer -Wl,-u,_LIBHFUZZ_module_instrument -Wl,-u,_LIBHFUZZ_module_memorycm

harness里需要主动调用 initializeTrapfuzz()

看起来一切都不错！

获取指定so地址也有了：

Patch

参考这里修改honggfuzz的代码即可

后续&问题

这个方案主要是效率实在是太差了，性能损耗都在jvm获取那里了，本来也是工作之余的一个小点子，后面也没深入去看了，个人最开始的想法是 winafl模式搬到安卓上 lol…

参考

https://googleprojectzero.blogspot.com/2020/04/fuzzing-imageio.html

https://github.com/googleprojectzero/p0tools/blob/master/TrapFuzz/trapfuzz.patch

ByteCTF2021 chatroom writeup

2021-10-17T10:10:17.000Z

前言

在今年的ByteCTF中，我出了一道pwn题目，距离上一次打比赛/出题已经过去很久了，所以传统的 heap trick 就没有考虑，而是从我日常工作中挖掘的安全风险入手，简化场景，出了一道 chatroom ，看起来像一个web的奇怪题目。

这个题目其实背后是 Headless Chrome 相关的pwn，我早期的一篇博客其实已经阐述过相关风险，可以参考 Exploit Headless Chrome。其实这个风险暴露出来的不仅仅是：低版本、误用参数这两个显而易见的问题，其背后的原因是一些不好的编程习惯被错误地传播：大家都在用 --no-sandbox 参数，好像 it works就够了，但是在实际场景中，这是很危险的。

题目设计思路

我的本意是设计一个类似聊天室的场景，用户可以在聊天室内发送消息、多媒体文件、链接等，尽可能模拟一个真实场景。处于风控考虑，对于非白名单的链接，需要进行检查（是否恶意，色流等）。对于URL 检查的逻辑，最好是服务端接收到内容之后，判断是否是URL，随后通过RPC调用走到URL检查的服务去。但是考虑到实际题目，我大大简化了这个场景，直接把检查放在前端了，而且我没有混淆JS，所以可以很直接看到一个HTTP请求。

解决了场景问题，聊天室部分直接用了github的开源项目 node-websocket-Chatroom，后端使用 puppeteer来抓取用户的URL。

为了提升一些难度，同时这也是我曾经遇到过的问题：UA不可靠的情况下怎么判断Chrome版本？

所以我直接在启动参数里把UA给改了：


 const browser = await puppeteer.launch({ 
   args: ['--no-sandbox', '--disable-setuid-sandbox', 
          '--user-agent="Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7)
           AppleWebKit/537.36 (KHTML, like Gecko) Chrome/1337.13.37.0  Safari/4141.42"'], 
ignoreHTTPSErrors: true, dumpio: false });

最终题目成型：

非最新版本puppeteer
–no-sandbox
UA不准确

Writeup & 非预期

非预期

主要是 zh1x1an2 同学的做法，Exploit狂轰滥炸术，挨个挨个来，最终拿到flag。

预期

UA不可信，但是V8 和 Blink是可信的，不同Chrome版本会有不同的features，所以可以借助这个点，判断一个大版本，便于后续做利用。

参考 : https://chromestatus.com/features

不过这个需要一些积累 && 测试 :)

随后判断出来版本是 M88 之后，找个合适的nday就可以打了 : )

题目环境

1
2
3

docker pull muhe/ctf_chal_chatroom:v7

docker run -dit --name chatroom1 -p 3000:3000 -p 31337:31337 muhe/ctf_chal_chatroom:v7

访问 http://localhost:3000 就可以本地测试题目了 :)

不足之处

无法防止爆破这种非预期解题方式。
使用nday似乎很无趣，但是塞进去一个洞，给一个 patch.diff 似乎又有点奇怪，偏离题目原本的出发点。

Expand Chrome Exploit : From client to server

2021-10-03T16:30:35.000Z

前言

过去的近一年的时间(本文在21年开的头，期间一直是hidden状态)，我接触了~~万恶的~~浏览器安全，不过只是一个脚本小子的水平 :(

最开始是由于一些工作上的因素，关注了一些主流的IM客户端，难易程度不等，当然也看了不少前辈的精彩工作，比如二哥的各种奇妙的xss、伪协议打🐧啥的。无奈功夫不到家只能另辟蹊径，再加上大学时候@wuyan学长某次回学校给我们做小组分享的时候展示了当时印象笔记的一个xss的时候提了一句，很多客户端你可以把它当成一个浏览器来看；至此这才有了后来的探究和一点点成果吧，时至今日，相关漏洞早已修复，攻击手法也早已“众所周知”，所以写个记录也没有什么:D

客户端

主要是一些Electron和CEF客户端

一些背景 & 调研工作

主流客户端的情况，以前 & 现在

关注客户端安全的同学应该会发现Electron&CEF的应用越来越广泛了，从早些的时候某音乐播放器的xss2rce到后面被关注到内置浏览器本身，当然大佬可能更早的时候就这么玩了 :D

其实是用浏览器框架来开发客户端是一直以来就有的东西，比如下面这张图(可能不完全):

也有直接从chromium做定制开发的，即原生的方式开发，比如某先进IM

这么做的好处是显而易见的:

使用成熟的嵌入式浏览器框架(cef, electron等)能够快速开发应用
能够规避很多复杂的底层设计(c/c++)
前端–>APP跨平台的特性，且很灵活，
更加方便支持自定义协议/扩展/JS对象等
…
与此同时，浏览器的攻击面就自然而然地引入进来了，再结合客户端本身，1+1>2的即视感。本文重点关注浏览器相关的内容，那按照浏览器的思路去考虑就是:

1
2
3

攻击者构造恶意页面-->客户端访问-->RCE
                              |
                        Render---(sbx)--->Broker

这条攻击链路上的前置条件是**客户端可以打开任意URL(直接or间接)**，随后就是常规的浏览器Exploit，分成Render RCE+SBX两部分。

妙就妙在很多客户端出于一些特殊的需求他没有开沙箱。

这里有一份统计 : https://github.com/sickcodes/no-sandbox，当然也不一定对(比如微信是CEF吧)，有些客户端也发生了一些变化，不过可以通过历史记录看出来变化趋势，大家都在慢慢地开启沙箱，尝试逐渐收敛风险。

--no-sandbox的风险是显而易见的，另一个问题是patch gap，chromium那个更新频率没有几个客户端能跟上，甚至说基本跟不上，再加上功能优先，版本升级或者补丁合入并没有那么高的优先级(也有可能是风险没体现出来，不受重视)，所以大部分基于chromium的客户端多多少少都滞后一些大版本，这就造成了大量潜在的Nday影响这些客户端，甚至从RCE到SBX一条龙。

攻击思路

是否直接打开URL

直接打开，发链接点了就内置浏览器打开，这类早期IM会这样干，可能是为了“用户体验没有割裂感”
特殊的消息才会内置浏览器打开，比如卡片？
是否有url白名单，不能绕过的话可能需要多一个白名单域名下的xss做桥梁
特殊的scheme有url参数，参考Android客户端的那种情况
其他的奇奇怪怪的入口，比如监听端口，处理函数有个啥openBrowser的东西

Chromium版本确定

UA，这个不一定准吧，毕竟启动参数是可以改的，代码里也可以改，一般情况下是可信的
JS引擎特性，这个我在之前一个文章里提到过ByteCTF2021 chatroom writeup，用于探测后端puppeteer的版本

以上两种方式结合是最好的，能判断出来很精准的版本

选个好`"day"`

Pj0/github/twitter/v8 commits
@BugsChromium

版本-代码commit之前互查询可以参考: https://omahaproxy.appspot.com/

case1

xxminibrowser (xx是啥我也不知道)这个洞应该在21年上半年就修复了，而且陆陆续续补掉了不少攻击的前置条件

Open URL

最早可以随便打开，后面就变成了特殊的消息，再后来越来越窄吧

版本确定

用上面的方法确定了具体的版本，还是很准确的

选个好day
当然了，在那个时候这个客户端他的好兄弟“小而美”也是差不多的情况，好好选day能都打了，21年hvv爆出的RCE就是这个情况(藏洞没有好下场 - -!)

当时用的是crbug659475，挺好用的，感谢keen lab的大哥 :D 为了提高成功率甚至还做了这样的事情:

var worker;
var exploitSucc = false;

function startExploit() {
    if(exploitSucc){
        return;
    }
    worker = new Worker('exp.js');
 
    worker.onmessage = function (e) {
        exploitSucc = e.data;
        if (exploitSucc == false) {
            document.write("exploit failed, retry....
");
            return;
        }
        document.write("exploit done!!!!!
");
    }
}

startExploit();

var hangMonitor = setInterval(function () {
    if (exploitSucc == true) {
        clearInterval(hangMonitor);
    } else {
        startExploit();
    }
}, 20000);

2022.8 update

“小而美”好像在hvv期间开了 --jit-less后面又下掉了，现在的cmdline，与此同时也升级到了M81

case2

S***e

Open URL

这个点说来还有点故事，20年的时候发现了，直到21年吧有一个老外也发现了并且发在了推特上

说来也简单，就是个看起来是A打开确实B的问题，主要服务端也不做校验就转发是有点离谱的；对于打开的URL也是有白名单检查的，所以特定域下的xss是攻击的桥梁 :(

版本

M78 这个没什么好说的

选个day

m78可选的很多(比如CVE-2020-6418)，注意目标的是x86，需要做一些改造，而且之前遇到过有些洞只在x86_64 work的情况

2022.8 update

参数 & 版本

case3

Android webview

这类其实也算个重灾区，很多厂商会选择自己定制webview，且为了方便不开沙箱，线上丰富多彩的功能也提供了很多攻击的入口，发链接、扫码、卡片消息；但是也都会在打开URL前考虑加一层拦截，提示用户“xxx不是xxxxxx，确定要打开吗”。但是21年反垄断之后，这个限制就下掉了，随之而来的就是这样的安全风险。

对于甲方来说就是，我的定制webview依赖chromium，我又没办法及时更新，沙箱也一定能开，在 nday和 patch gap的双重打击之下，你的SRC可能就变成“提款机”，每个月谷歌一发补丁，再加上是不是爆出个在野利用，你的SRC一定经常收到这样的报告: xxxxx RCE 。

我也有做安全运营的朋友~~饱受其害~~，我只能建议他内部专项治理，定期合补丁，能上沙箱就沙箱，这个真没啥好办法。

总结

作为攻击方

搞定入口，这个比较吃经验了，见招拆招吧
多盯着点commit，开发一些工具啥的也可以，方便用
利用武器化，不是只弹个计算器就完了的

作为防守方

打补丁case by case，但是每个月都要来那么一次，还不能全自动化，有效但费人力。
开沙箱，毕竟是个浏览器，还是能打IPC穿沙箱穿出来，不过这就要看具体漏洞情况了。
升级到最新版，如果不稳定怎么办，这个也不是个好办法

补丁+升级+沙箱 三个维度一起来，毕竟短板效应，少了哪一块都不行，甲方的话也可以搞一些白盒工具来做补丁check，确认漏洞是否存在，这块就见仁见智了，我也写过一套，效果还行:D

服务端

chrome headless_shell 和 puppeteer

基本上还是 Exploit Headless Chrome这篇文章的内容，核心问题还是沙箱&版本过低的问题，这块比较严重的是网上很多人写教程、博客都喜欢--no-sandbox，我也不知道他们知不知道这个参数的影响，不过一传十十传百，你会发现很多后端无头浏览器多多少少有这类问题。

总结

作为防守方

安全开发意识提高，不要为了方便乱用参数
及时更新版本or打补丁

~~扯远一些，有些扫描器用chrome，可以使用这手段做反制，你敢爬我轻则crash重则rce。~~

作为攻击方

版本探测比较重要，做这个操作前先想想银手镯
什么？你还想exp？我看你想戴上银手镯

为了风险治理做了什么

说到这个就想到了2020.11.13 那个下午弹出计算器的时候

主要是三块吧，我发现甲方里涮一圈之后思维确实不太一样了。

首先要讲明白风险，这里也包含证明风险，需要强有力的证明，比如exp打穿这样，研发可能不太理解为什么这样可以RCE，这就需要沟通好让大家有相同的sense
其次是修复方案，不同业务线、场景不一样，这个得和业务聊明白了才好给方案，不然就是“空中楼阁”，这块就算是治理存量问题了
- 沙箱开不开
- 补丁无法自动合入，怎么处理更高效，能不能自动化节省排期
- 以后怎么办，建立个什么流程跑这个事情
最后可以开发一些工具做一些预警工作，相当于治理增量问题
- 存量怎么扫，补丁怎么提取，这个部分得好好设计构思
- 预警Bot，这个本质就是个爬虫+机器人，之前研究的时候自己搞过一个tg bot专门干这个，还能搞漏洞查询

总结

我认为很有意思的是这个攻击面对于防守方来说简直是“折磨”，只要你的项目使用chromium，你就不得不面临各种补丁、升级，这实际上是很难做到及时补丁&升级的，所以理论上存在patch gap，这就导致很多吸引眼球的 xxx RCE 传播的非常广泛。早在21年7月份，腾讯的蓝军在21年发布了攻防启示：Chromium组件风险剖析与收敛，也详细地剖析了该攻击面以及修复方案，对于我自己来说比较可惜的是在公司内部搞了这块攻击面的治理工作没有出去讲一讲or发个文章啥的，到后面这篇文章出来后已经没什么可讲的了 :(

主要想对自己的一些工作做个简单的总结，所以才有了本文，时至2022.8，这个攻击面应该已经变得众所周知，没有什么秘密可言了，想来这手法我在17年某项目上也见过，不过当时是webkit。

iOS RE 4 beginners 3 - fishhook

2021-07-23T16:05:49.000Z

关于

Fishhook是Facebook提供的利用MachO文件惰性加载原理，通过修改懒加载和非懒加载两个表的指针达到C函数HOOK的目的一个轻量级的hook库。理解这个工具和熟悉流程也是可以帮助更好的理解MachO文件格式 :)

原理图如下：

源码阅读

核心其实就是rebind_symbols 这个接口，另一个 rebind_symbols_image 是指定macho中的symbol进行rebind，所以从 rebind_symbols函数看起就行了。

1 2	FISHHOOK_VISIBILITY int rebind_symbols(struct rebinding rebindings[], size_t rebindings_nel);

简单看下关键的调用路径:

rebind_symbols(struct rebinding rebindings[], size_t rebindings_nel);
        _rebind_symbols_for_image(_dyld_get_image_header(i), _dyld_get_image_vmaddr_slide(i));
            rebind_symbols_for_image(_rebindings_head, header, slide);
                perform_rebinding_with_section(...)

_rebindings_head 指向一个需要重绑定的符号的单项链表:

struct rebinding {
  const char *name;
  void *replacement;
  void **replaced;
};

struct rebindings_entry {
  struct rebinding *rebindings;
  size_t rebindings_nel;
  struct rebindings_entry *next;
};

static struct rebindings_entry *_rebindings_head;
segment_command_t *cur_seg_cmd;
  segment_command_t *linkedit_segment = NULL;
  struct symtab_command* symtab_cmd = NULL;
  struct dysymtab_command* dysymtab_cmd = NULL;

  uintptr_t cur = (uintptr_t)header + sizeof(mach_header_t); // now, cur points to LOAD_CMDs
  // iter LOAD CMDs
  for (uint i = 0; i < header->ncmds; i++, cur += cur_seg_cmd->cmdsize) {
    cur_seg_cmd = (segment_command_t *)cur;
    // find LINK_EDIT seg
    if (cur_seg_cmd->cmd == LC_SEGMENT_ARCH_DEPENDENT) {
      if (strcmp(cur_seg_cmd->segname, SEG_LINKEDIT) == 0) {
        linkedit_segment = cur_seg_cmd;
      }
    } else if (cur_seg_cmd->cmd == LC_SYMTAB) {
      // find SYMTAB CMD
      symtab_cmd = (struct symtab_command*)cur_seg_cmd;
    } else if (cur_seg_cmd->cmd == LC_DYSYMTAB) {
      // find DYSYM CMD
      dysymtab_cmd = (struct dysymtab_command*)cur_seg_cmd;
    }
  }

  if (!symtab_cmd || !dysymtab_cmd || !linkedit_segment ||
      !dysymtab_cmd->nindirectsyms) {
    return;
  }

...

// Get indirect symbol table (array of uint32_t indices into symbol table)
  uint32_t *indirect_symtab = (uint32_t *)(linkedit_base + dysymtab_cmd->indirectsymoff);

  cur = (uintptr_t)header + sizeof(mach_header_t);
  for (uint i = 0; i < header->ncmds; i++, cur += cur_seg_cmd->cmdsize) {
    cur_seg_cmd = (segment_command_t *)cur;
    if (cur_seg_cmd->cmd == LC_SEGMENT_ARCH_DEPENDENT) {
      if (strcmp(cur_seg_cmd->segname, SEG_DATA) != 0 &&
          strcmp(cur_seg_cmd->segname, SEG_DATA_CONST) != 0) {
        continue;
      }
      for (uint j = 0; j < cur_seg_cmd->nsects; j++) {
        section_t *sect =
          (section_t *)(cur + sizeof(segment_command_t)) + j;
        if ((sect->flags & SECTION_TYPE) == S_LAZY_SYMBOL_POINTERS) {
          perform_rebinding_with_section(rebindings, sect, slide, symtab, strtab, indirect_symtab);
        }
        if ((sect->flags & SECTION_TYPE) == S_NON_LAZY_SYMBOL_POINTERS) {
          perform_rebinding_with_section(rebindings, sect, slide, symtab, strtab, indirect_symtab);
        }
      }
    }
  }
static void perform_rebinding_with_section(struct rebindings_entry *rebindings,
                                           section_t *section,
                                           intptr_t slide,
                                           nlist_t *symtab,
                                           char *strtab,
                                           uint32_t *indirect_symtab) {
  // if _DATA,CONST
  const bool isDataConst = strcmp(section->segname, SEG_DATA_CONST) == 0;

  //__la_symbol_ptr的reserved1字段标识了section描述的符号在符号表中开始的index
  //动态符号表中第一个需要解析的符号 开始地址
  uint32_t *indirect_symbol_indices = indirect_symtab + section->reserved1;
  // section __la_symbol_ptr
  void **indirect_symbol_bindings = (void **)((uintptr_t)slide + section->addr);
  vm_prot_t oldProtection = VM_PROT_READ;
  // chang memory protection to write && back old memery protection
  if (isDataConst) {
    oldProtection = get_protection(rebindings);
    mprotect(indirect_symbol_bindings, section->size, PROT_READ | PROT_WRITE);
  }
  
  // Traverse section -> symtab
  for (uint i = 0; i < section->size / sizeof(void *); i++) {
    uint32_t symtab_index = indirect_symbol_indices[i];
    if (symtab_index == INDIRECT_SYMBOL_ABS || symtab_index == INDIRECT_SYMBOL_LOCAL ||
        symtab_index == (INDIRECT_SYMBOL_LOCAL   | INDIRECT_SYMBOL_ABS)) {
      continue;
    }

      // nlist_t
    uint32_t strtab_offset = symtab[symtab_index].n_un.n_strx;
    char *symbol_name = strtab + strtab_offset;
    bool symbol_name_longer_than_1 = symbol_name[0] && symbol_name[1];
    struct rebindings_entry *cur = rebindings;
    while (cur) {
      for (uint j = 0; j < cur->rebindings_nel; j++) {
        // yes, it's target symbol to rebind!
        if (symbol_name_longer_than_1 &&
            strcmp(&symbol_name[1], cur->rebindings[j].name) == 0) {
          if (cur->rebindings[j].replaced != NULL &&
              indirect_symbol_bindings[i] != cur->rebindings[j].replacement) {
            *(cur->rebindings[j].replaced) = indirect_symbol_bindings[i]; // backup old func 
          }
          // do rebind, hook!
          **indirect_symbol_bindings[i] = cur->rebindings[j].replacement;**
          goto symbol_loop;
        }
      }
      cur = cur->next;
    }
  symbol_loop:;
  }
  // restore protection
  if (isDataConst) {
    int protection = 0;
    if (oldProtection & VM_PROT_READ) {
      protection |= PROT_READ;
    }
    if (oldProtection & VM_PROT_WRITE) {
      protection |= PROT_WRITE;
    }
    if (oldProtection & VM_PROT_EXECUTE) {
      protection |= PROT_EXEC;
    }
    mprotect(indirect_symbol_bindings, section->size, protection);
  }
}

调试

直接拿官方的demo编译出来调试分析流程：

~/study/ios_re_link/fishhook  cat main.c
#include 
#include 
#include 
#include 
#include "fishhook.h"

static int (*orig_close)(int);
static int (*orig_open)(const char *, int, ...);

int my_close(int fd) {
  printf("Calling real close(%d)\\n", fd);
  return orig_close(fd);
}

int my_open(const char *path, int oflag, ...) {
  va_list ap = {0};
  mode_t mode = 0;

  if ((oflag & O_CREAT) != 0) {
    // mode only applies to O_CREAT
    va_start(ap, oflag);
    mode = va_arg(ap, int);
    va_end(ap);
    printf("Calling real open('%s', %d, %d)\\n", path, oflag, mode);
    return orig_open(path, oflag, mode);
  } else {
    printf("Calling real open('%s', %d)\\n", path, oflag);
    return orig_open(path, oflag, mode);
  }
}

int main(int argc, char * argv[])
{
      getchar();
    rebind_symbols((struct rebinding[2]){{"close", my_close, (void *)&orig_close}, {"open", my_open, (void *)&orig_open}}, 2);

    // Open our own binary and print out first 4 bytes (which is the same
    // for all Mach-O binaries on a given architecture)
    int fd = open(argv[0], O_RDONLY);
    uint32_t magic_number = 0;
    read(fd, &magic_number, 4);
    printf("Mach-O Magic Number: %x \\n", magic_number);
    close(fd);

     return 0;

}%
 ~/study/ios_re_link/fishhook  cat Makefile
all:
    xcrun -sdk iphoneos clang main.c fishhook.c -o main -target arm64-apple-ios12.2
    codesign -s "A64593A4DDFA3557CCEFF47FC8E688DCD3E6E455" --entitlements entitlements.xml -f main

push:
    scp main root@10.2.5.0:/tmp

clean:
    rm main

* thread #1, queue = 'com.apple.main-thread', stop reason = step over
    frame #0: 0x0000000100a3f6ac main`rebind_symbols_for_image(rebindings=0x00000001012005b0, header=0x0000000100a38000, slide=10715136) at fishhook.c:187:8
   184         }
   185       }
   186
-> 187       if (!symtab_cmd || !dysymtab_cmd || !linkedit_segment ||
   188           !dysymtab_cmd->nindirectsyms) {
   189         return;
   190       }
Target 0: (main) stopped.
(lldb) po symtab_cmd
0x0000000100a38440

(lldb) po dysymtab_cmd
0x0000000100a38458

(lldb) po linkedit_segment
0x0000000100a383c8

(lldb)

然后找到 LC_SEGMENT_64_DATA 处理 S_LAZY_SYMBOL_POINTERS 和 S_NON_LAZY_SYMBOL_POINTERS

(lldb) n
Process 2046 stopped
* thread #1, queue = 'com.apple.main-thread', stop reason = step over
    frame #0: 0x0000000100a3f828 main`rebind_symbols_for_image(rebindings=0x00000001012005b0, header=0x0000000100a38000, slide=10715136) at fishhook.c:215:42
   212               perform_rebinding_with_section(rebindings, sect, slide, symtab, strtab, indirect_symtab);
   213             }
   214             if ((sect->flags & SECTION_TYPE) == S_NON_LAZY_SYMBOL_POINTERS) {
-> 215               perform_rebinding_with_section(rebindings, sect, slide, symtab, strtab, indirect_symtab);
   216             }
   217           }
   218         }

这里为了调试，重点关注 S_LAZY_SYMBOL_POINTERS 的处理

首先在rebind之前查看open符号

(lldb) image lookup -va 0x0000000100a3fee0
      Address: main[0x0000000100007ee0] (main.__TEXT.__stub_helper + 180)
      Summary:
       Module: file = "/private/var/tmp/main", arch = "arm64"

//....
Process 2046 resuming
Process 2046 stopped
* thread #1, queue = 'com.apple.main-thread', stop reason = breakpoint 4.1
    frame #0: 0x0000000100a3fbc8 main`perform_rebinding_with_section(rebindings=0x00000001012005b0, section=0x0000000100a382d8, slide=10715136, symtab=0x0000000100a44210, strtab=" ", indirect_symtab=0x0000000100a44780) at fishhook.c:135:46
   132                 strcmp(&symbol_name[1], cur->rebindings[j].name) == 0) {
   133               if (cur->rebindings[j].replaced != NULL &&
   134                   indirect_symbol_bindings[i] != cur->rebindings[j].replacement) {
-> 135                 *(cur->rebindings[j].replaced) = indirect_symbol_bindings[i];
   136               }
   137               indirect_symbol_bindings[i] = cur->rebindings[j].replacement;
   138               goto symbol_loop;
Target 0: (main) stopped.
(lldb) p symbol_name
(char *) $20 = 0x0000000100a44937 "_open"
(lldb)

首先备份了原函数地址，确保hook后可以通过 orign_open调用到原本的函数。

(lldb) p i
(uint) $24 = 13
(lldb) po indirect_symbol_bindings[13]
0x0000000100a3fee0

(lldb) image lookup -va 0x0000000100a3fee0
      Address: main[0x0000000100007ee0] (main.__TEXT.__stub_helper + 180)
      Summary:
       Module: file = "/private/var/tmp/main", arch = "arm64"

(lldb)

之后找到函数指针，完成替换

Process 2046 stopped
* thread #1, queue = 'com.apple.main-thread', stop reason = step over
    frame #0: 0x0000000100a3fbfc main`perform_rebinding_with_section(rebindings=0x00000001012005b0, section=0x0000000100a382d8, slide=10715136, symtab=0x0000000100a44210, strtab=" ", indirect_symtab=0x0000000100a44780) at fishhook.c:137:41
   134                   indirect_symbol_bindings[i] != cur->rebindings[j].replacement) {
   135                 *(cur->rebindings[j].replaced) = indirect_symbol_bindings[i];
   136               }
-> 137               indirect_symbol_bindings[i] = cur->rebindings[j].replacement;
   138               goto symbol_loop;
   139             }
   140           }
Target 0: (main) stopped.
(lldb) image list |grep main
[  0] EAE1AE51-465A-32E0-8B3F-195FE2480F4F 0x0000000100a38000 /private/var/tmp/main
      /System/Volumes/Data/Users/muhe/study/ios_re_link/fishhook/main.dSYM/Contents/Resources/DWARF/main(0x0000000100a38000)
(lldb)
(lldb) x/20gx indirect_symbol_bindings
0x100a40018: 0x00000001d8642a68 0x0000000100a3fe50
0x100a40028: 0x0000000100a3fe5c 0x0000000100a3fe68
0x100a40038: 0x0000000100a3fe74 0x00000001d8581374
0x100a40048: 0x0000000100a3f224 0x00000001d8581694
0x100a40058: 0x0000000100a3fea4 0x00000001d860ae30
0x100a40068: 0x00000001d871060c 0x00000001d873dd30
0x100a40078: 0x0000000100a3fed4 0x0000000100a3f270
0x100a40088: 0x0000000100a3feec 0x0000000100a3fef8
0x100a40098: 0x00000001d873dfd0 0x0000000100a3ff10
0x100a400a8: 0x0000000100d04498 0x0000000100a3ff72
(lldb) x/gx 0x100a40078+8
0x100a40080: 0x0000000100a3f270
(lldb)

---
>>> hex(0x100a40080-0x0000000100a38000)
'0x8080'
>>>

如果调用原本的函数会走什么流程？

0x100a3f448 <+176>: bl     0x100a3fd9c               ; symbol stub for: close
->  0x100a3f44c <+180>: adrp   x8, 1
    0x100a3f450 <+184>: ldr    x8, [x8]
    0x100a3f454 <+188>: ldr    x8, [x8]
    0x100a3f458 <+192>: ldur   x10, [x29, #-0x8]
    0x100a3f45c <+196>: subs   x8, x8, x10
    0x100a3f460 <+200>: b.ne   0x100a3f478               ; <+224> at main.c
    0x100a3f464 <+204>: mov    w8, #0x0
    0x100a3f468 <+208>: mov    x0, x8
    0x100a3f46c <+212>: ldp    x29, x30, [sp, #0x70]
    0x100a3f470 <+216>: add    sp, sp, #0x80             ; =0x80
    0x100a3f474 <+220>: ret
    0x100a3f478 <+224>: bl     0x100a3fd60               ; symbol stub for: __stack_chk_fail
(lldb) dis -a 0x100a3fd9c
main`close:
    0x100a3fd9c <+0>: nop
    0x100a3fda0 <+4>: ldr    x16, #0x2a8               ; (void *)0x0000000100a3f224: my_close at /Users/muhe/study/ios_re_link/fishhook/main.c:10
    0x100a3fda4 <+8>: br     x16

引用

https://github.com/facebook/fishhook

iOS RE 4 beginners 2 - 静态链接&&动态链接

2021-07-14T09:15:47.000Z

ENV

macos11.4 + iphone6 iOS 12.2

静态链接

静态链接：输入多个目标文件，输出一个文件（一般是可执行文件）。这个过程中，把多个目标文件里相同性质的段合并到一起。

过程

地址和空间分配 (Address and Storage Allocation)
符号决议 (Symbol Resolution) / 符号绑定 (Symbol Binding)
重定位 (Relocation)

源码

~/study/ios_re_link/static_link  cat main.c

extern int global_var;

int foo(int i);

int main(void){

    int ret = foo(42 + global_var);

    return 0;
}
 ~/study/ios_re_link/static_link  cat foo.c
int global_var = 0x1337;

int foo(int i){
    return i + global_var;
}

1
2

~/study/ios_re_link/static_link  xcrun -sdk iphoneos clang -c main.c foo.c -target arm64-apple-ios12.2
~/study/ios_re_link/static_link  xcrun -sdk iphoneos clang main.o foo.o -o main -target arm64-apple-ios12.2

两个模块(main.o 和 foo.o) 通过静态链接组合成了一个可执行文件(main)

模块&&产物

main.o

通过machoview可以看到重定位段有三条信息，意味着程序中有三处需要重定位处理：

这个图是hopper反汇编的main函数，可以看到对于引用到其他模块(foo.o)重的变量/函数的地方看起来“正常”，但是点击 bl _foo 就会发现跳转到了：

根据的定义，可以看到reloc段的结构：

struct relocation_info {
   int32_t    r_address;    /* offset in the section to what is being
                   relocated */
   uint32_t     r_symbolnum:24,    /* symbol index if r_extern == 1 or section
                   ordinal if r_extern == 0 */
        r_pcrel:1,     /* was relocated pc relative already */
        r_length:2,    /* 0=byte, 1=word, 2=long, 3=quad */
        r_extern:1,    /* does not include value of sym referenced */
        r_type:4;    /* if not 0, machine specific relocation type */
};

结合上面的图来看(以_foo符号为例)：

r_address : 0x28
r_symbolnum(24bits): 指向_foo 字符串
剩下的8bits是标志位

对应到汇编里就是，main函数的0x28行引用了 _foo 符号，reloc段把这个信息告知linker，这样在链接的时候linker就会处理这条信息，把对应的符号做替换处理。

foo.o

其实都是对 global_var的引用

在foo.o模块中，是 0x20处的data，这个信息也要告诉linker，在link的阶段做替换。

main

最终的可执行文件main，可以看到没有重定位信息，而且mian和foo函数中改替换的符号都已经完成了替换，可以顺利的索引到想要使用的符号(foo和global_var)。

对比两者符号表：

以foo符号为例 :

Type 从 N_UNDF → NSECT

Value 从0 → 0x100007f90

符号表结构:

struct nlist_64 {
    union {
        uint32_t n_strx;   /* index into the string table */
    } n_un;
    uint8_t  n_type;       /* type flag, see below */
    uint8_t  n_sect;       /* section number or NO_SECT */
    uint16_t n_desc;       /* see  */
    uint64_t n_value;      /* value of this symbol (or stab offset) */
};

foo 符号的话

string table index : 指向符号的字符串
n_sect : 改符号在第几个section
n_value : 符号具体值(地址)

举个🌰

这里以demo中 global_var 使用的代码举例子。

源码中:

1	int ret = foo(42 + global_var);

如果对应到汇编里应该是:


0000000000000014         adrp       x9, #0x0                                    ; 0x68@PAGE
0000000000000018         ldr        x9, [x9, #0x68]                             ; 0x68@PAGEOFF
000000000000001c         ldr        w10, [x9]
0000000000000020         add        w0, w10, #0x2a
0000000000000024         str        w8, [sp, #0x10 + var_C]
0000000000000028         bl         _foo

可知 w0 是参数，w10是global_var的值，来自x9

w10 = [x9 + 0x68] (未重定位修复）

最开始索引x9的时候可以发现是把0赋给了x9，因为这里还没有重定位，所以用0代替。

最终的产物中可以看到：

0000000100007f64         adrp       x9, #0x100008000                            ; 0x100008000@PAGE
0000000100007f68         add        x9, x9, #0x0                                ; 0x100008000@PAGEOFF, _global_var
0000000100007f6c         ldr        w10, [x9]                                   ; _global_var
0000000100007f70         add        w0, w10, #0x2a
0000000100007f74         str        w8, [sp, #0x10 + var_C]
0000000100007f78         bl         _foo

把0替换成了 0x100008000，这个地址恰好指向global_var。

可以看到经过linker的处理，可以正确找到global_var，符号foo同理

动态链接

debug set up

应该是签名有问题，最终解决方案：

/usr/bin/security find-identity -v -p codesigning
# get : A64593A4DDFA3557CCEFF47FC8E688DCD3E6E455

codesign -s "A64593A4DDFA3557CCEFF47FC8E688DCD3E6E455" --entitlements entitlements.xml -f libFoo.dylib
codesign -s "A64593A4DDFA3557CCEFF47FC8E688DCD3E6E455" --entitlements entitlements.xml -f main

# scp ....
# ssh ....
mude-iPhone:/tmp root# ./main
magic is : 4919
4920

debug lazy binding process

可以看到，第一次调用 printf的时候，bl跳过去并不是 printf函数

Target 0: (main) stopped.
(lldb) s
Process 1453 stopped
* thread #1, queue = 'com.apple.main-thread', stop reason = instruction step into
    frame #0: 0x000000010089bf7c main
->  0x10089bf7c: br     x16
    0x10089bf80: ldr    w16, 0x10089bf88
    0x10089bf84: b      0x10089bf68
    0x10089bf88: udf    #0x0
Target 0: (main) stopped.
(lldb) re re x16
     x16 = 0x00000001d858080c  libdyld.dylib`dyld_stub_binder
(lldb) re re x0
      x0 = 0x000000010089bfa4  "magic is : %d\n"
(lldb) re re x1
      x1 = 0x0000000000001337

通过 dyld_stub_binder 找 printf的地址，把找到的地址写回到 DATA,__la_symbol_ptr

第二次调用printf的时候就可以看到，这个地方printf函数地址已经被写过来了

(lldb) x/10i $pc
->  0x100dcff60: 0x58000610   ldr    x16, #0xc0                ; (void *)0x00000001d860e14c: printf
    0x100dcff64: 0xd61f0200   br     x16
    0x100dcff68: 0x10000611   adr    x17, #0xc0                ; _dyld_private
    0x100dcff6c: 0xd503201f   nop
    0x100dcff70: 0xa9bf47f0   stp    x16, x17, [sp, #-0x10]!
    0x100dcff74: 0xd503201f   nop
    0x100dcff78: 0x58000490   ldr    x16, #0x90                ; (void *)0x00000001d858080c: dyld_stub_binder
    0x100dcff7c: 0xd61f0200   br     x16
    0x100dcff80: 0x18000050   ldr    w16, 0x100dcff88
    0x100dcff84: 0x17fffff9   b      0x100dcff68
(lldb) x/3i $pc
->  0x100dcff60: 0x58000610   ldr    x16, #0xc0                ; (void *)0x00000001d860e14c: printf
    0x100dcff64: 0xd61f0200   br     x16
    0x100dcff68: 0x10000611   adr    x17, #0xc0                ; _dyld_private
(lldb) x/gx $pc+0xc0
0x100dd0020: 0x00000001d860e14c
(lldb) memory region 0x00000001d860e14c

所以这里就可以直接获取到地址，然后直接跳转过去就行:

(lldb) s
Process 1453 stopped
* thread #1, queue = 'com.apple.main-thread', stop reason = instruction step into
    frame #0: 0x000000010089bf60 main`printf + 4
main`printf:
->  0x10089bf60 <+4>: ldr    x16, #0xc0                ; (void *)0x00000001d860e14c: printf
    0x10089bf64 <+8>: br     x16
    0x10089bf68:      adr    x17, #0xc0                ; _dyld_private
    0x10089bf6c:      nop
Target 0: (main) stopped.
(lldb) s
Process 1453 stopped
* thread #1, queue = 'com.apple.main-thread', stop reason = instruction step into
    frame #0: 0x000000010089bf64 main`printf + 8
main`printf:
->  0x10089bf64 <+8>: br     x16
    0x10089bf68:      adr    x17, #0xc0                ; _dyld_private
    0x10089bf6c:      nop
    0x10089bf70:      stp    x16, x17, [sp, #-0x10]!
Target 0: (main) stopped.
(lldb) re re x16
     x16 = 0x00000001d860e14c  libsystem_c.dylib`printf
(lldb)

libdyld.dylib`dyld_stub_binder

dyld-852的代码：

因为我目标环境是iOS12.2，所以具体汇编代码有一些差别：

Target 0: (main) stopped.
(lldb) x/30i $pc
->  0x1d858080c: 0xa9bf7bfd   stp    x29, x30, [sp, #-0x10]!
    0x1d8580810: 0x910003fd   mov    x29, sp
    0x1d8580814: 0xd103c3ff   sub    sp, sp, #0xf0             ; =0xf0
    0x1d8580818: 0xa93f07a0   stp    x0, x1, [x29, #-0x10]
    0x1d858081c: 0xa93e0fa2   stp    x2, x3, [x29, #-0x20]
    0x1d8580820: 0xa93d17a4   stp    x4, x5, [x29, #-0x30]
    0x1d8580824: 0xa93c1fa6   stp    x6, x7, [x29, #-0x40]
    0x1d8580828: 0xa93b27a8   stp    x8, x9, [x29, #-0x50]
    0x1d858082c: 0xad3c07a0   stp    q0, q1, [x29, #-0x80]
    0x1d8580830: 0xad3b0fa2   stp    q2, q3, [x29, #-0xa0]
    0x1d8580834: 0xad3a17a4   stp    q4, q5, [x29, #-0xc0]
    0x1d8580838: 0xad391fa6   stp    q6, q7, [x29, #-0xe0]
    0x1d858083c: 0xf9400fa0   ldr    x0, [x29, #0x18]
    0x1d8580840: 0xf9400ba1   ldr    x1, [x29, #0x10]
    0x1d8580844: 0x940004e4   bl     0x1d8581bd4               ; _dyld_fast_stub_entry(void*, long)
    0x1d8580848: 0xaa0003f0   mov    x16, x0
    0x1d858084c: 0xa97f07a0   ldp    x0, x1, [x29, #-0x10]
    0x1d8580850: 0xa97e0fa2   ldp    x2, x3, [x29, #-0x20]
    0x1d8580854: 0xa97d17a4   ldp    x4, x5, [x29, #-0x30]
    0x1d8580858: 0xa97c1fa6   ldp    x6, x7, [x29, #-0x40]
    0x1d858085c: 0xa97b27a8   ldp    x8, x9, [x29, #-0x50]
    0x1d8580860: 0xad7c07a0   ldp    q0, q1, [x29, #-0x80]
    0x1d8580864: 0xad7b0fa2   ldp    q2, q3, [x29, #-0xa0]
    0x1d8580868: 0xad7a17a4   ldp    q4, q5, [x29, #-0xc0]
    0x1d858086c: 0xad791fa6   ldp    q6, q7, [x29, #-0xe0]
    0x1d8580870: 0x910003bf   mov    sp, x29
    0x1d8580874: 0xa8c17bfd   ldp    x29, x30, [sp], #0x10
    0x1d8580878: 0x910043ff   add    sp, sp, #0x10             ; =0x10
    0x1d858087c: 0xd61f0200   br     x16
    0x1d8580880: 0xd10103ff   sub    sp, sp, #0x40             ; =0x40

但是本质上是差不多的，影响不大。

下面看看怎么一步一步调用进去，找到所需要的符号

1. call dyld_stub_binder

0000000100007f98         ldr        w16, =0x6967616d0000001a
0000000100007f9c         b          0x100007f68

....

0000000100007f68         adr        x17, #0x100008028                           ; CODE XREF=0x100007f84, 0x100007f90, 0x100007f9c
// x17-> _dyld_private

0000000100007f6c         nop
0000000100007f70         stp        x16, x17, [sp, #-0x10]!

0000000100007f74         nop
0000000100007f78         ldr        x16, #dyld_stub_binder_100008008

0000000100007f7c         br         x16 // call dyld_stub_binder

个人猜测：0x000000000000001a 应该是类似 linux下elf lazy binding的时候那个index参数的东西，每个符号都不一样。

初始化好需要的参数就调用进去dyld中去做符号绑定操作了

(lldb) s
Process 1465 stopped
* thread #1, queue = 'com.apple.main-thread', stop reason = instruction step into
    frame #0: 0x0000000100fb7f7c main
->  0x100fb7f7c: br     x16
    0x100fb7f80: ldr    w16, 0x100fb7f88
    0x100fb7f84: b      0x100fb7f68
    0x100fb7f88: udf    #0x0
Target 0: (main) stopped.
(lldb) re re x16
     x16 = 0x00000001d858080c  libdyld.dylib`dyld_stub_binder
(lldb) x/10gx $sp
0x16ee4f5a0: 0x000000000000001a 0x0000000100fb8028
0x16ee4f5b0: 0x0000000000001337 0x0000000000000000
0x16ee4f5c0: 0x0000000000000000 0x0000000000000001
0x16ee4f5d0: 0x000000016ee4f5f0 0x00000001d857e8e0
0x16ee4f5e0: 0x00000001d857e8e0 0x0000000000000000
(lldb) re re x0
      x0 = 0x0000000100fb7fa4  "magic is : %d\n"
(lldb) re re x1
      x1 = 0x0000000000001337
(lldb) re re x2
      x2 = 0x00000000000120a8

2. call dyld::fastBindLazySymbol(loadercache, lazyinfo)

保存栈帧，保存当前的寄存器信息(一大堆stp指令，后面符号绑定完成后，ldp会恢复，这些是成对的)，然后设置好参数，就直接转到 dyld::fastBindLazySymbol

（函数前面的保存操作看起来和x86上函数开头的保存栈帧抬高栈給临时变量预留空间的操作差不多）

Process 1465 resuming
Process 1465 stopped
* thread #1, queue = 'com.apple.main-thread', stop reason = breakpoint 3.1
    frame #0: 0x00000001d8580844 libdyld.dylib`dyld_stub_binder + 56
libdyld.dylib`dyld_stub_binder:
->  0x1d8580844 <+56>: bl     0x1d8581bd4               ; _dyld_fast_stub_entry(void*, long)
    0x1d8580848 <+60>: mov    x16, x0
    0x1d858084c <+64>: ldp    x0, x1, [x29, #-0x10]
    0x1d8580850 <+68>: ldp    x2, x3, [x29, #-0x20]
Target 0: (main) stopped.
(lldb) re re x0
      x0 = 0x0000000100fb8028  _dyld_private
(lldb) re re x1
      x1 = 0x000000000000001a

调用的是 : fastBindLazySymbol(0x0000000100fb8028, 0x1a)

//  LINK_EDIT seg
const uint8_t* const start = fLinkEditBase + fDyldInfo->lazy_bind_off;
const uint8_t* const end = &start[fDyldInfo->lazy_bind_size];

// ....

do{
    if ( ! getLazyBindingInfo(lazyBindingInfoOffset, start, end, &segIndex, &segOffset, &libraryOrdinal, &symbolName, &doneAfterBind) )
            dyld::throwf("bad lazy bind info");

}while (!doneAfterBind && !context.strictMachORequired);

对应汇编中：

(lldb) c
Process 1465 resuming
Process 1465 stopped
* thread #1, queue = 'com.apple.main-thread', stop reason = breakpoint 4.1
    frame #0: 0x0000000100fe5e6c dyld`ImageLoaderMachOCompressed::doBindFastLazySymbol(unsigned int, ImageLoader::LinkContext const&, void (*)(), void (*)()) + 136
dyld`ImageLoaderMachOCompressed::doBindFastLazySymbol:
->  0x100fe5e6c <+136>: bl     0x100fe1d98               ; ImageLoaderMachO::getLazyBindingInfo(unsigned int&, unsigned char const*, unsigned char const*, unsigned char*, unsigned long*, int*, char const**, bool*)
    0x100fe5e70 <+140>: tbz    w0, #0x0, 0x100fe5f80     ; <+412>
    0x100fe5e74 <+144>: ldrb   w1, [sp, #0x43]
    0x100fe5e78 <+148>: ldrb   w8, [x20, #0x74]
Target 0: (main) stopped.
(lldb) re re x1
      x1 = 0x0000000100fbc030
(lldb) re re x2
      x2 = 0x0000000100fbc058
(lldb) memory region 0x0000000100fbc030
[0x0000000100fbc000-0x0000000100fc0000) r-- __LINKEDIT

(lldb)

这里用到了我这个可执行文件的LINK_EDIT 段去做符号绑定工作：

(lldb) image lookup -va $x1
      Address: main[0x000000010000c030] (main.__LINKEDIT + 48)
      Summary:
       Module: file = "/private/var/tmp/main", arch = "arm64"

3. ImageLoaderMachO::getLazyBindingInfo

根据不同的opcode，走不同分支：

if ( lazyBindingInfoOffset > (lazyInfoEnd-lazyInfoStart) )
        return false;
    bool done = false;
    const uint8_t* p = &lazyInfoStart[lazyBindingInfoOffset];
    while ( !done && (p < lazyInfoEnd) ) {
        uint8_t immediate = *p & BIND_IMMEDIATE_MASK;
        uint8_t opcode = *p & BIND_OPCODE_MASK;
        ++p;
        switch (opcode) {

        }

....

获取目标符号相关的信息 :

1	&segIndex, &segOffset, &libraryOrdinal, &symbolName, &doneAfterBind

然后根据这些信息，获取该符号的地址：

1	uintptr_t address = segActualLoadAddress(segIndex) + segOffset;

// dyld版本不一致，实现的函数有些差别，但是本质是一样的
(lldb) n
Process 1465 stopped
* thread #1, queue = 'com.apple.main-thread', stop reason = instruction step over
    frame #0: 0x0000000100fe5ee4 dyld`ImageLoaderMachOCompressed::doBindFastLazySymbol(unsigned int, ImageLoader::LinkContext const&, void (*)(), void (*)()) + 256
dyld`ImageLoaderMachOCompressed::doBindFastLazySymbol:
->  0x100fe5ee4 <+256>: mov    x26, x0
    0x100fe5ee8 <+260>: mov    x0, x20
    0x100fe5eec <+264>: bl     0x100fe1fb0               ; ImageLoaderMachO::imageBaseAddress() const
    0x100fe5ef0 <+268>: mov    x1, x0
Target 0: (main) stopped.
(lldb) re re x0
      x0 = 0x00000001d860e14c  libsystem_c.dylib`printf

执行符号绑定：

1	result = bindAt(context, this, address, BIND_TYPE_POINTER, symbolName, 0, 0, libraryOrdinal,NULL, "lazy ", patcher, NULL, true);

// 调试：
frame #0: 0x0000000100fe5f28 dyld`ImageLoaderMachOCompressed::doBindFastLazySymbol(unsigned int, ImageLoader::LinkContext const&, void (*)(), void (*)()) + 324
dyld`ImageLoaderMachOCompressed::doBindFastLazySymbol:
->  0x100fe5f28 <+324>: bl     0x100fe0664               ; ImageLoaderMachO::bindLocation(ImageLoader::LinkContext const&, unsigned long, unsigned long, unsigned long, unsigned char, char const*, long, char const*, char const*, char const*, ImageLoaderMachO::ExtraBindData*, unsigned long)
    0x100fe5f2c <+328>: ldrb   w8, [sp, #0x27]
    0x100fe5f30 <+332>: ldrb   w9, [x21, #0x139]
    0x100fe5f34 <+336>: orr    w8, w8, w9
Target 0: (main) stopped.
(lldb) re re x0
      x0 = 0x00000001010235e0  dyld::gLinkContext
(lldb) re re x1
      x1 = 0x0000000100000000
(lldb) re re x2
      x2 = 0x0000000100fb8020  (void *)0x0000000100fb7f98
(lldb) re re x3
      x3 = 0x00000001d860e14c  libsystem_c.dylib`printf
(lldb) re re x4
      x4 = 0x0000000000000001
(lldb) re re x5
      x5 = 0x0000000100fbc04e
(lldb) re re x6
      x6 = 0x0000000000000000
(lldb)

执行之后:

(lldb) n
Process 1465 stopped
* thread #1, queue = 'com.apple.main-thread', stop reason = instruction step over
    frame #0: 0x0000000100fe5f2c dyld`ImageLoaderMachOCompressed::doBindFastLazySymbol(unsigned int, ImageLoader::LinkContext const&, void (*)(), void (*)()) + 328
dyld`ImageLoaderMachOCompressed::doBindFastLazySymbol:
->  0x100fe5f2c <+328>: ldrb   w8, [sp, #0x27]
    0x100fe5f30 <+332>: ldrb   w9, [x21, #0x139]
    0x100fe5f34 <+336>: orr    w8, w8, w9
    0x100fe5f38 <+340>: cbz    w8, 0x100fe5e4c           ; <+104>
Target 0: (main) stopped.
(lldb) x/gx 0x0000000100fb8020
0x100fb8020: 0x00000001d860e14c
(lldb) image lookup -va 0x00000001d860e14c
      Address: libsystem_c.dylib[0x00000001809a614c] (libsystem_c.dylib.__TEXT.__text + 263364)
      Summary: libsystem_c.dylib`printf
       Module: file = "/Users/muhe/Library/Developer/Xcode/iOS DeviceSupport/12.2 (16E227)/Symbols/usr/lib/system/libsystem_c.dylib", arch = "arm64"
       Symbol: id = {0x00000617}, range = [0x00000001d860e14c-0x00000001d860e1a8), name="printf"

可以看到符号地址已经被写过去了(0x0000000100fb8020)

至此，符号绑定过程完成。

reference

《程序员的自我修养-链接、装载和库》

https://juejin.cn/post/6844903912147795982

https://juejin.cn/post/6844903922654511112#heading-10

https://bbs.pediy.com/thread-263907.htm

https://iosre.com/t/ios-12-4-killed-9/15633

ql query for CVE-2021-30660 XNU Kernel Memory Disclosure

2021-07-11T08:22:50.000Z

CVE-2021-30660 - XNU Kernel Memory Disclosure

Vuln

msgsz 可控

msginfo.msgssz 是 8

如果控制 msgsz 不是 8的整数倍，比如9，就会导致在第二次循环的时候 leak出来 7字节的内核数据。

next = msghdr->msg_spot;
    for (len = 0; len < msgsz; len += msginfo.msgssz) {
        size_t tlen;

        /* compare input (size_t) value against restrict (int) value */
        if (msgsz > (size_t)msginfo.msgssz) {
            tlen = msginfo.msgssz;
        } else {
            tlen = msgsz;
        }
        if (next <= -1) {
            panic("next too low #3");
        }
        if (next >= msginfo.msgseg) {
            panic("next out of range #3");
        }
        SYSV_MSG_SUBSYS_UNLOCK();
        eval = copyout(&msgpool[next * msginfo.msgssz],
            user_msgp, tlen);
        SYSV_MSG_SUBSYS_LOCK();
        if (eval != 0) {
#ifdef MSG_DEBUG_OK
            printf("error (%d) copying out message segment\\n",
                eval);
#endif
            msg_freehdr(msghdr);
            wakeup((caddr_t)msqptr);
            goto msgrcvout;
        }
        user_msgp = user_msgp + tlen;   /* ptr math */
        next = msgmaps[next].next;
    }

Patch

for (len = 0; len < msgsz; len += msginfo.msgssz) {
        size_t tlen;

        /*
         * copy the full segment, or less if we're at the end
         * of the message
         */
        tlen = MIN(msgsz - len, (size_t)msginfo.msgssz);
        if (next <= -1) {
            panic("next too low #3");
        }
        if (next >= msginfo.msgseg) {
            panic("next out of range #3");
        }
        SYSV_MSG_SUBSYS_UNLOCK();
        eval = copyout(&msgpool[next * msginfo.msgssz],
            user_msgp, tlen);

补丁保证了，在非8 整数倍的时候，只拷贝剩余的长度的数据。

CodeQL query

import cpp
import semmle.code.cpp.dataflow.TaintTracking
import DataFlow::PathGraph

// 存在误报 IOKit
predicate isSYSCall(Function f) {
    exists(Macro m |
        m.getName().toUpperCase().regexpMatch("SYS(.)*") and
        m.getLocation().getFile().getBaseName() = "syscall.h" and 
        m.getName().indexOf(f.getName()) > 0
    )
}

/*
syscall -> copyout
source : syscall fucntion 's params
sink   : copyout 3rd param(size)
*/

class Config extends TaintTracking::Configuration {
  Config() { this = "taint size to copy size" }

  override predicate isSource(DataFlow::Node source) {
    exists(LocalVariable lv, Function f |
        isSYSCall(f) and
        lv.getFunction() = f and
        (
            not source.asExpr().(Literal).isConstant()
        ) and
        lv.getAnAccess() = source.asExpr()
    )
  }

  override predicate isSink(DataFlow::Node sink) {
    exists (FunctionCall fc | 
            fc.getTarget().getName() = "copyout" and
            fc.getArgument(2) = sink.asExpr()
        )
  }
}

from Config cfg, DataFlow::PathNode source, DataFlow::PathNode sink
where cfg.hasFlowPath(source, sink)
select source, " to ", sink, " in ", source.getNode().getFunction().getName()

有误报，但是够用了，替换成copyin，也可以看看其他的调用路径，不过笔者没发现什么有价值的东西 : (

reference

CVE-2021-30660 - XNU Kernel Memory Disclosure

iOS RE 4 beginners 1 - MachO && class-dump

2021-07-11T06:48:13.000Z

roadmap

之前在 iosre看到一张比较系统的iOS逆向学习路线图，因为接触过一段时间macOS上服务的漏洞挖掘，所以对*OS安全还是挺有兴趣的，也一直想系统性地学习下iOS逆向，之前的一直不成体系，也很零碎，正好对着这个图重构下知识体系。

macho file format

类似Windows/Linux平台逆向学习，首先要学习正向开发的基础知识，以及涉及的文件格式(指可执行文件)：

Windows - PE
Linux - ELF
*OS - MachO

根据roadmap中的app分析流程，第一步就是“砸壳“，就是在根据文件格式做文章，因为macho文件是加密的，被加载到内存执行的时候才会解密，所以我们做静态分析，需要把内存中解密之后的可执行文件dump出来，并修复文件才可以拖入hopper/IDA正常分析。

Overview

我感觉这些可执行文件大同小异的味道，基本都是文件头+各种节区。在macOS上你可以使用：

MachOView
MachOExplorer

来查看一个macho文件的结构，推荐前者，后者不知道为什么总是卡卡的，而且很容易崩溃 :(

总体上来看，macho文件格式可以看做：

Header
Load Commands
- LC_SEGMENT
  - TEXT
  - DATA
  - LINKEDIT
- LC_CODESIGNATURE
- LC_DYLD_INFO_ONLY
- LC_XXXX_DYLIB
Data
- Segment(1-n)

只关注几个基本字段

magic number : 表示macho的类型，FAT, ARMv7,ARM64,x86_64
- FAT 就是 “胖文件”，表示这个文件里包含了多个架构的MachO文件，可以使用lipo分离
CPU Type, CPU SubType : arch
Number of load commands : Load commands的数量
flags：表示一些标识位，比如是否开了PIE，checksec可以从这里获取一些信息。
reversed：64位保留字段

Load Commands

即告诉操作系统，该如何加载文件中的数据。

LC_SEGMENT_64：定义一个段，加载后被映射到内存中，包括里面的节。比如代码段数据段 :
- TEXT 代码段
- DATA 数据段
LC_DYLD_INFO_ONLY：记录了有关链接的重要信息，包括在_LINKEDIT中动态链接相关信息的具体偏移和大小。ONLY表示这个加载指令是程序运行所必需的，如果旧的链接器无法识别它，程序就会出错。
LC_SYMTAB：为文件定义符号表和字符串表，在链接文件时被链接器使用，同时也用于调试器映射符号到源文件。符号表定义的本地符号仅用于调试，而已定义和未定义的external符号被链接器使用。
LC_DYSYMTAB:将符号表中给出符号的额外符号信息提供给动态链接器。
LC_LOAD_DYLINKER：默认的加载器路径。 /usr/lib/dyld
LC_UUID：用于标识MachO文件的ID，也用于崩溃堆栈和符号文件的对应解析。
LC_VERSION_MIN_IPHONEOS：系统要求的最低版本。
LC_SOURCE_VERSION：构建二进制文件的源代码版本号。
LC_MAIN：程序的入口。dyld获取该地址，然后跳转到该处执行。
LC_ENCRYPTION_INFO_64：文件是否加密的标志，加密内容的偏移和大小。
- lldb dump 砸壳修复文件之后，需要修改该标识位以确保正常反汇编文件。
LC_LOAD_DYLIB:依赖的动态库，包括动态库名称、当前版本号、兼容版本号。
- “otool -L xxx”命令查看
LC_RPATH： Runpath Search Paths, @rpath 搜索的路径。
LC_FUNCTION_STARTS：函数起始地址表，使调试器和其他程序能很容易地看到一个地址是否在函数内。
LC_DATA_IN_CODE：定义在代码段内的非指令的表。
LC_CODE_SIGNATURE：代码签名信息。
- codesign -d [filename]

Data-Segments

各种节区，比如代码段，数据段，只读数据段等：

这里可以看到很多__DATA, __objc__? 节区，Symbol Table String Table也单独列了出来。

__objc_protolist
__objc_classlist
__objc_catlist section
…

这些节区保存了OC中类名，函数名等信息，这就为从MachO中dump出来头文件打下了基础。

Get class info from macho file

__DATA, __objc_protolist节区：

存储的都是指针，指向一个又一个protocol的结构，可以参考objc的代码 :

struct protocol_t : objc_object {
    const char *mangledName;
    struct protocol_list_t *protocols;
    method_list_t *instanceMethods;
    method_list_t *classMethods;
    method_list_t *optionalInstanceMethods;
    method_list_t *optionalClassMethods;
    property_list_t *instanceProperties;
    uint32_t size;   // sizeof(protocol_t)
    uint32_t flags;
    // Fields below this point are not always present on disk.
    const char **_extendedMethodTypes;
    ......
    
}

struct objc_object {
private:
    isa_t isa;

public:
  ...
}

所以我们可以按照结构体索引 __DATA, __objc_protolist 里指针指向的位置的数据，就可以解析出来protocol的类型，名字，方法等信息。

class-dump read notes

env

macos11.4 + xcode12

compile

Q : openssl/aes.h not found

A : add header file path

1 2	export LDFLAGS="-L/usr/local/opt/openssl/lib" export CPPFLAGS="-I/usr/local/opt/openssl/include"

XCode中的配置是:

Q : Library not found for -lcrypto

A : add the missing dylib

raed && debug

核心逻辑就看

- (void)processObjectiveCData;
{
    for (CDMachOFile *machOFile in self.machOFiles) {
        CDObjectiveCProcessor *processor = [[[machOFile processorClass] alloc] initWithMachOFile:machOFile];
        [processor process];
        [_objcProcessors addObject:processor];
    }
}
- (void)process;
{
    if (self.machOFile.isEncrypted == NO && self.machOFile.canDecryptAllSegments) {
        [self.machOFile.symbolTable loadSymbols];
        [self.machOFile.dynamicSymbolTable loadSymbols];

        [self loadProtocols];
        [self.protocolUniquer createUniquedProtocols];

        // Load classes before categories, so we can get a dictionary of classes by address.
        [self loadClasses];
        [self loadCategories];
    }
}

1. symbolTable loadSymbols

Load Commands 里找到 LC_SYMTAB，然后找到 __DATA(依赖属性 RW)。

然后利用 LC_SYMTAB 初始化了cursor开始遍历找符号。

strtab 从 string table 开始：一个 symbol起始位置，一个string起始位置。

然后根据 arm 还是 x64 走不同的逻辑(这里目标是ARM64的Binary) :

开始解析 symbol table，item by item

string table index  -->  在string table里找到对应的 string
type
section index
desc
value

然后根据string table index里找到对应的string，放到symbols数组里，

根据 string 的 value 判断是不是 class，这里是根据字符串的开头是不是 @"*OBJC_CLASS*$_"。

对于解析出来class name，添加到 class symbols dict里，这样处理之后，symbols， classSymbols都有了。

2. dynamicSymbolTable loadsymbols

类似1

3. loadProtocols

从 __DATA , __objc_protolist 读取对应的value

比如得到地址0x1009ccc58

走到 - (CDOCProtocol *)protocolAtAddress:(uint64_t)address

初始化对应的CDOCProtocol对象

依赖这个地址，从文件对应地址读取出来这个 proto的相关信息:

struct cd_objc2_protocol objc2Protocol;
objc2Protocol.isa                     = [cursor readPtr];
objc2Protocol.name                    = [cursor readPtr];
objc2Protocol.protocols               = [cursor readPtr];
objc2Protocol.instanceMethods         = [cursor readPtr];
objc2Protocol.classMethods            = [cursor readPtr];
objc2Protocol.optionalInstanceMethods = [cursor readPtr];
objc2Protocol.optionalClassMethods    = [cursor readPtr];
objc2Protocol.instanceProperties      = [cursor readPtr];
objc2Protocol.size                    = [cursor readInt32];
objc2Protocol.flags                   = [cursor readInt32];
objc2Protocol.extendedMethodTypes     = 0;

name protocols这些字段是一个地址，指向对应的值(字符串/数组)

最后参照objc2Protocol的值，分别获取protocol 的 name，各种methods，属性等，初始化了protocol对象

所以protocols就都处理出来了，最后得到了

_protocolsByAddress __NSDictionaryM * 6781 key/value pairs 0x0000000112f93820

4. protocolUniquer createUniquedProtocols

依赖3中找到的 _protocolsByAddress

name -> protocol 对应关系的dict addr -> protocol 对应关系的dict

p1->protocols 里还有protocol，merge进来(adopted protocols)

p1 : _name __NSCFString * @”AWEFriendsActivityWidgetConfigurationIntentHandling” 0x0000000112fbc710
p2 : _name NSTaggedPointerString * @”NSObject” 0x07518ee6ed78d7f9

@interface AWEFriendsActivityWidgetConfigurationIntentHandling : NSObject { //blablabla… }

这种情况

5. loadClasses

解析section ： __DATA __objc_classlist

和3类似的套路，先得到一个地址，然后根据地址，去文件中索引对应的结构：

CDOCClass *aClass = [self loadClassAtAddress:val]

只调试一次过程分析即可: val uint64_t 4335166480 In [2]: hex(4335166480) Out[2]: '0x102656410'

这个0x102656410，使用machoview也能看到，调试+machoview对比看，更容易理解。

loadClassAtAddress方法分析：

struct cd_objc2_class objc2Class;
objc2Class.isa        = [cursor readPtr];
objc2Class.superclass = [cursor readPtr];
objc2Class.cache      = [cursor readPtr];
objc2Class.vtable     = [cursor readPtr];
objc2Class.data       = [cursor readPtr];
objc2Class.reserved1  = [cursor readPtr];
objc2Class.reserved2  = [cursor readPtr];
objc2Class.reserved3  = [cursor readPtr];

也是读取对应的class结构，这个过程其实很眼熟，如果读过iOS逆向的书，比如庆神的书，有一章介绍oc方法调用过程的，会把oc->cpp代码，那里面这个 oc object的结构分析的很清楚。

然后解析 class->data 字段

struct cd_objc2_class_ro_t objc2ClassData;
objc2ClassData.flags         = [cursor readInt32];
objc2ClassData.instanceStart = [cursor readInt32];
objc2ClassData.instanceSize  = [cursor readInt32];
if ([self.machOFile uses64BitABI])
    objc2ClassData.reserved  = [cursor readInt32];
else
    objc2ClassData.reserved = 0;

objc2ClassData.ivarLayout     = [cursor readPtr];
objc2ClassData.name           = [cursor readPtr];
objc2ClassData.baseMethods    = [cursor readPtr];
objc2ClassData.baseProtocols  = [cursor readPtr];
objc2ClassData.ivars          = [cursor readPtr];
objc2ClassData.weakIvarLayout = [cursor readPtr];
objc2ClassData.baseProperties = [cursor readPtr];

然后得到class 的 name，methods，protocol, property信息然后返回这个class

展开说下获取 methods && property的时候

(NSArray *)loadMethodsAtAddress:(uint64_t)address; { return [self loadMethodsAtAddress:address extendedMethodTypesCursor:nil]; }

loadMethodsAtAddress :

objc2Method.name  = [cursor readPtr];
objc2Method.types = [cursor readPtr];
objc2Method.imp   = [cursor readPtr];
NSString *name    = [self.machOFile stringAtAddress:objc2Method.name];
NSString *types   = [self.machOFile stringAtAddress:objc2Method.types];

一样的套路，都是解析出来对应的字段，然后按照这些字段读取信息(string) CDOCMethod *method = [[CDOCMethod alloc] initWithName:name typeString:types address:objc2Method.imp]; [methods addObject:method]; 最后获得methods数组，给前面填充class的地方使用

loadIvarsAtAddress ,loadPropertiesAtAddress , loadMethodsOfMetaClassAtAddress 同理

至此，class解析完毕

6. loadCategories

关于Categories 可以看 https://zhuanlan.zhihu.com/p/24925196

处理 __DATA __objc_catlist section :

(CDOCCategory *)loadCategoryAtAddress:(uint64_t)address;

一样的处理方法

struct cd_objc2_category objc2Category;
objc2Category.name               = [cursor readPtr];
objc2Category.class              = [cursor readPtr];
objc2Category.instanceMethods    = [cursor readPtr];
objc2Category.classMethods       = [cursor readPtr];
objc2Category.protocols          = [cursor readPtr];
objc2Category.instanceProperties = [cursor readPtr];
objc2Category.v7                 = [cursor readPtr];
objc2Category.v8                 = [cursor readPtr];

可以看到和对objc2Class的处理有点像，就是因为是category的原因，所以字段有不同，简单的理解成处理一种特殊的class，并且提取出相应的 methods 和 properties就行

至此整个 process函数的处理结束

7. 处理 or 输出

这部分主要是处理输出了，如果没什么参数就直接stdout输出，如果有指定文件目录，就遍历之前process得到的信息，写文件(.h)到指定的目录。

Reference

https://zhuanlan.zhihu.com/p/24925196

https://en.wikipedia.org/wiki/Mach-O

https://iosre.com/

https://evilpan.com/2020/09/06/macho-inside-out/

iOS应用逆向与安全 (刘培庆著)

CodeQL JS/TS Journey

2021-06-01T03:43:11.000Z

关于

之前做过的一些使用CodeQL对JS/TS项目做扫描的笔记。

关于构建数据库过程

对于JS/TS的项目来说，CodeQL统一都是 --language=javascript 的参数处理的，而且它主要是扫描，解析，然后构建数据库，对于小项目直接默认参数应该是ok的：

1 2	codeql database create --language=javascript # codeql database bundle -o .zip

但是对于比较大型的项目来说，因为CodeQL是Java写的，所以可能会存在内存不足导致构建数据库失败的情况：

1 2	FATAL ERROR: Ineffective mark-compacts near heap limit Allocation failed - JavaScript heap out of memory

默认给的内存是2400MB，大项目必然不够啊，文件太多了。

找了一圈没有解决方案，索性直接掏出JD_GUI把它的jar包给反编译了，发现是通过环境变量控制的：

1	export SEMMLE_TYPESCRIPT_RAM=8000

这个不是给JAVA的那个内存设置(-J-Xmx1234M)

Query

接口函数

interface FooInterface{
4//...
}
export interface outerApiConfig {

4foo: (params: xxxxx) => Promise<{ // whatever ..}>;
4
4bar: (params: FooInterface) => Promise<{ // whatever..}>;
4
4// ...
}

拿这个Demo为例，很多接口函数统一导出，需要借助InterfaceDeclaration 来找，不过我的方法有点“笨”。

import javascript

predicate isOuterAPIs(Function f){
     exists(InterfaceDeclaration apis |
         apis.getIdentifier().toString() = "outerApiConfig" and
         apis.getAMember().getName() = f.getName()
     )
}

from Function f
where isOuterAPIs(f)
select f.getName()

我这里实现很粗暴，就是限制函数名(字符串值)和Interface里成员名字(字符串值)一致，就认为这个函数是导出接口中的函数。

特定参数的处理

在我的需求中，我需要重点关注，参数中带有路径的函数，换言之就是需要识别出这么多接口函数中，参数带有path的情况，那么很直接的思路就是利用正则，但是在实际的场景下，你会发现代码真的写出了“花”，不是常规的query能覆盖的。

foo: (params: WTFParams) => Promise<....>;


bar: (params: { arg: string }) => Promise<{ ...}>;
                                           
function magic(x) {
  return ()=>{
    //...
  };
}

参数是一个interface，你需要对这个interface再限制，即这个interface的成员是不是path
参数直接就是 {arg : string} 这类情况
奇怪的函数写法，函数体在return里

class PathParamInterfaceType extends InterfaceType{
    PathParamInterfaceType(){
        getInterface().getAMember().getName().toLowerCase().indexOf("path") > 0
    }
}

predicate isParamPath(Function f){
    (
        f.getAParameter().getType() instanceof PathParamInterfaceType
        or
        f.getAParameter().getType().toString().toLowerCase().indexOf("path") > 0
    ) or
    (
        f.getNumParameter() = 0
        and
        f.getAReturnStmt().getExpr().(Function).getAParameter().getType().toString().toLowerCase().indexOf("path") > 0
    )
}

必须依赖TaintTracking吗

最后一个问题比较简单了，就是有了source，然后再找合适的sink，看有没有路径就行了；但是其实还有一种办法会来得更直接，就是利用传递闭包，但是会带来比较多的误报，好处是实现起来简单，想要排除误报，只需要增加限制即可，看具体需求吧，哪个方法合适用哪个。

CodeQL的JS/TS部分实现不如cpp多，所以有些predicate需要自己手动实现，比如用cpp做query可以：

FunctionCall getFunctionToACall(FunctionCall fc){
  result = fc.getBasicBlock().getEnclosingFunction().getACallToThisFunction()
}

select
        getFunctionToACall*(FunctionCall fc)

但是JS/TS部分没有getACallToThisFunction ，根据原理，手动实现一个即可：

CallExpr getACallToThisFunction(Function f){
    exists( CallExpr c |
        c.getCalleeName() = f.getName() and
        result = c
    )
}

CallExpr getFunctionToACall(CallExpr call){
    result = getACallToThisFunction(call.getEnclosingFunction())
}

所以，如果想要查询foo函数的传递闭包，就可以：

1
2
3

from CallExpr call
where call.getCalleeName() = "foo"
select getFunctionToACall*(call)

参考

https://xz.aliyun.com/t/7482

CodeQL for research

https://ctftime.org/writeup/22177

https://kernelshaman.blogspot.com/2021/01/building-xnu-for-macos-big-sur-1101.html

https://github.com/D4rkD0g/boringforever/blob/main/xnu/boringanalysis/codeql_xnu.md

https://codeql.github.com/docs/codeql-cli/

o0xmuhe's blog

Chromium based browser/Webview启用--js-flags

背景

PC

Android

Webview

系统webview

APP自己实现的webview

参考

批量运营CodeQL Cli扫描结果(简易版)

背景&目标

工作流程

批量导入数据库

导入扫描结果

query-history

配置文件中需要的CodeQL cli信息获取

批量query & 导入结果分析

通用规则/开源规则

特有规则

结果处理

最终效果

参考

最近看过的议题&文章(Bootloader/TZ)

背景

Security Boot & Bootloader相关

TZ相关

其他

感想

议题学习:MOSEC2022 MediAttack - break the boot chain of MediaTek SoC

背景

议题学习

MTK Based Boot flow

Preloader部分

BROM部分

基本分析

议题中的漏洞

vuln1

[TBD]vuln2

攻击思路

基本概念

Attacking DA

DA stage1

DA stage2

policy_part_map？

BROM EXPLOIT

common exp

MTE mode

more exploit

后记

参考

Qual+Android方案Unlock学习 以Oneplus7Pro为例

背景

Unpack guacamole_21_H.04_190416.ops

Unlock探究

开发者选项–允许解锁

fastboot oem unlock

extract LinuxLoader from abl

过程分析

FH读写分区

逆向MSM Download

USB抓包

token & pk 逆向结果

尝试修改分区实现unlock

VerifiedBoot Protocol 分析

结束

参考

optee学习(2) CA&TA调用流程分析

环境

调用流程梳理

CA & TA 的工作流程

源码阅读

TEEC_InitializeContext

TEEC_OpenSession

TEEC_InvokeCommand

TEEC_CloseSession

TEEC_FinalizeContext

调试

参考

Paper read <>

Background

`query-history`

Qual+Android方案Unlock学习以Oneplus7Pro为例

`Background`

Read this `PAPER`

multi-query(`-p` 参数)

1. 打印 query-tree 和源码 AST方便定位问题