如何定位Android NDK开发中遇到的错误

Posted CSDN

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了如何定位Android NDK开发中遇到的错误相关的知识,希望对你有一定的参考价值。

Android NDK是什么?


android NDK 是在SDK前面又加上了“原生”二字,即Native Development Kit,因此又被Google称为“NDK”。众所周知,Android程序运行在Dalvik虚拟机中,NDK允许用户使用类似C / C++之类的原生代码语言执行部分程序。NDK包括:


  • 从C / C++生成原生代码库所需要的工具和build files;

  • 将一致的原生库嵌入可以在Android设备上部署的应用程序包文件(application packages files ,即.apk文件)中;

  • 支持所有未来Android平台的一系列原生系统头文件和库。


为何要用到NDK?概括来说主要分为以下几种情况:


  • 代码保护,由于APK的Java层代码很容易被反编译,而C/C++库反汇难度较大;

  • 在NDK中调用第三方C/C++库,因为大部分的开源库都是用C/C++代码编写的;

  • 便于移植,用C/C++写的库可以方便地在其他的嵌入式平台上再次使用。


Android JNI与NDK的关系


Java Native Interface(JNI)标准是Java平台的一部分,它允许Java代码和其他语言写的代码进行交互。JNI是本地编程接口,它使得在Java虚拟机(VM)内部运行的Java代码能够与用其它编程语言(如C、C++和汇编语言)编写的应用程序和库进行交互操作。


简单来说,可以认为NDK就是能够方便快捷开发.so文件的工具。JNI的过程比较复杂,生成.so需要大量操作,而NDK的作用则是简化了这个过程。


哪些常见的NDK类型异常会导致程序Crash?


NDK编译生成的.so文件作为程序的一部分,在运行发生异常时同样会造成程序崩溃。不同于Java代码异常造成的程序崩溃,在NDK的异常发生时,程序在Android设备上都会立即退出,即通常所说的闪退,而不会弹出“程序xxx无响应,是否立即关闭”之类的提示框。



  • 初始化错误;

  • 访问错误;

  • 内存泄露;

  • 参数错误;

  • 堆栈溢出;

  • 类型转换错误;

  • 数字除0错误。


如何发现并解决NDK错误?


利用Android NDK开发本地应用时,几乎所有的程序员都遇到过程序崩溃的问题,但它的崩溃会在logcat中打印一堆看起来类似天书的堆栈信息,让人举足无措。单靠添加一行行的打印信息来定位错误代码做在的行数,无疑是一件令人崩溃的事情。在网上搜索“Android NDK崩溃”,可以搜索到很多文章来介绍如何通过Android提供的工具来查找和定位NDK的错误,但大都晦涩难懂。下面以一个实际的例子来说明,如何通过两种不同的方法,来定位错误的函数名和代码行。


首先,来看看我们在hello-jni程序的代码中做了什么(有关如何创建或导入工程,此处略),下面代码中:在JNI_OnLoad()的函数中,即so加载时,调用willCrash()函数,而在willCrash()函数中, std::string的这种赋值方法会产生一个空指针错误。这样,在hello-jni程序加载时就会闪退。我们记一下这两个行数:在61行调用了willCrash()函数;在69行发生了崩溃。



下面我们来看看发生崩溃(闪退)时系统打印的logcat日志:


如何定位Android NDK开发中遇到的错误


如果你看过logcat打印的NDK错误的日志就会知道,我省略了后面很多的内容,很多人看到这么多密密麻麻的日志就已经头晕脑胀了,即使是很多资深的Android开发者,在面对NDK日志时也大都默默地选择了无视。


其实,只要你细心的查看,再配合Google 提供的工具,完全可以快速地准确定位出错的代码位置,这个工作我们称之为“符号化”。需要注意的是,如果要对NDK错误进行符号化的工作,需要保留编译过程中产生的包含符号表的so文件,这些文件一般保存在$PROJECT_PATH/obj/local/目录下。


第一种方法:ndk-stack


这个命令行工具包含在NDK工具的安装目录,和ndk-build及其他常用的一些NDK命令放在一起,比如在我的电脑上,其位置是/android-ndk-r9d/ndk-stack。根据Google官方文档,NDK从r6版本开始提供ndk-stack命令,如果你用的之前的版本,建议还是尽快升级至最新的版本。使用ndk –stack命令也有两种方式


实时分析日志


在运行程序的同时,使用adb获取logcat日志,并通过管道符输出给ndk-stack,同时需要指定包含符号表的so文件位置;如果你的程序包含了多种CPU架构,在这里需求根据错误发生时的手机CPU类型,选择不同的CPU架构目录,如:


如何定位Android NDK开发中遇到的错误


当崩溃发生时,会得到如下的信息:


如何定位Android NDK开发中遇到的错误


我们重点看一下#03和#04,这两行都是在我们自己生成的libhello-jni.so中的报错信息,因此会发现如下关键信息:


如何定位Android NDK开发中遇到的错误


回想一下我们的代码,在JNI_OnLoad()函数中(第61行),我们调用了willCrash()函数;在willCrash()函数中(第69行),我们制造了一个错误。这些信息都被准确无误的提取了出来!是不是非常简单?


先获取日志再分析


这种方法其实和上面的方法没有什么大的区别,仅仅是logcat日志获取的方式不同。可以在程序运行的过程中将logcat日志保存到一个文件,甚至可以在崩溃发生时,快速的将logcat日志保存起来,然后再进行分析,比上面的方法稍微灵活一点,而且日志可以留待以后继续分析。


如何定位Android NDK开发中遇到的错误


第二种方法:使用addr2line和objdump命令


这个方法适用于那些不满足于上述ndk-stack的简单用法,而喜欢刨根问底的程序员们,这两个方法可以揭示ndk-stack命令的工作原理是什么,尽管用起来稍微麻烦一点,但可以稍稍满足一下程序员的好奇心。


先简单说一下这两个命令,在绝大部分的Linux发行版本中都能找到他们,如果你的操作系统是Linux,而你测试手机使用的是Intel x86系列,那么你使用系统中自带的命令就可以了。然而,如果仅仅是这样,那么绝大多数人要绝望了,因为恰恰大部分开发者使用的是Windows,而手机很有可能是armeabi系列。


在NDK中自带了适用于各个操作系统和CPU架构的工具链,其中就包含了这两个命令,只不过名字稍有变化,你可以在NDK目录的toolchains目录下找到他们。以我的Mac电脑为例,如果我要找的是适用于armeabi架构的工具,那么他们分别为arm-linux-androideabi-addr2line和arm-linux-androideabi-objdump;位置在下面目录中,后续介绍中将省略此位置:


如何定位Android NDK开发中遇到的错误


假设你的电脑是Windows系统,CPU架构为mips,那么你要的工具可能包含在一下目录中:


如何定位Android NDK开发中遇到的错误


接下来就让我们来看看如何使用这两个工具,下面具体介绍。


找到日志中的关键函数指针


其实很简单,就是找到backtrace信息中,属于我们自己的so文件报错的行。


首先要找到backtrace信息,有的手机会明确打印一行backtrace(比如我们这次使用的手机),那么这一行下面的一系列以“#两位数字 pc”开头的行就是backtrace信息了。有时可能有的手机并不会打印一行backtrace,那么只要找到一段以“#两位数字 pc ”开头的行,就可以了。


如何定位Android NDK开发中遇到的错误



如何定位Android NDK开发中遇到的错误


使用addr2line查找代码位置



如何定位Android NDK开发中遇到的错误


结果如下:


如何定位Android NDK开发中遇到的错误


从addr2line的结果就能看到,我们拿到了我们自己的错误代码的调用关系和行数,在hello-jni.cpp的69行和61行(另外两行因为使用的是标准函数,可以忽略掉),结果和ndk-stack是一致的,说明ndk-stack也是通过addr2line来获取代码位置的。


使用objdump获取函数信息


通过addr2line命令,其实我们已经找到了我们代码中出错的位置,已经可以帮助程序员定位问题所在了。但是,这个方法只能获取代码行数,并没有显示函数信息,显得不那么“完美”,对于追求极致的程序员来说,这当然是不够的。下面我们就演示一下怎么来定位函数信息。


首先使用如下命令导出函数表:


如何定位Android NDK开发中遇到的错误


在生成的asm文件中查找刚刚我们定位的两个关键指针00004fb4和00004f58:





相当完美,和ndk-stack得到的信息完全一致!


Testin崩溃分析如何帮开发者发现NDK错误


以上提到的方法,只适合在开发测试期间,如果你的应用或游戏已经上线,而用户经常反馈说崩溃、闪退,指望用户帮你收集信息定位问题几乎是不可能的。这个时候,我们就需要用其他的手段来捕获崩溃信息。


目前业界已经有一些公司推出了崩溃信息收集的服务,通过嵌入SDK,在程序发生崩溃时收集堆栈信息,发送到云服务平台,从而帮助开发者定位错误信息。在这方面,国内的Testin和国外的crittercism都可以提供类似服务。


Testin从1.4版本开始支持NDK的崩溃分析,其最新版本已升级到1.7。当程序发生NDK错误时,其内嵌的SDK会收集程序在用户手机上发生崩溃时的堆栈信息(主要就是上面我们通过logcat日志获取到的函数指针)、设备信息、线程信息等,SDK将这些信息上报至Testin云服务平台,在平台进行唯一性的处理、并可以自定义时段进行详尽的统计分析,从多维度展示程序崩溃的信息和严重程度;最新版本还支持用户自定义场景,方便开发者定位问题所在。




尹春鹏,Testin云测技术副总裁,Testin崩溃大师研发主管。毕业于清华大学工程物理系;专注于移动应用开发,2011年起参与创建Testin,专注于Android和iOS的移动应用自动化测试研发,负责构建Testin自动化测试平台,是自动化测试技术研发及前沿探索领域的先行者。


本文为CSDN原创文章,点击“阅读原文”可查看全文并参与讨论。


以上是关于如何定位Android NDK开发中遇到的错误的主要内容,如果未能解决你的问题,请参考以下文章

如何定位Android NDK开发中遇到的错误

Android NDK 定位出错代码位置

Android NDK开发Crash错误定位

Android NDK开发Crash错误定位

我的Android进阶之旅如何在Android Studio开发NDK的时候,通过addr2line或者ndk-stack来定位出错代码的位置

我的Android进阶之旅如何在Android Studio开发NDK的时候,通过addr2line来定位出错代码的位置