Android 4.4發(fā)布了一個ART運行時,準備用來替換掉之前一直使用的Dalvik虛擬機,希望籍此解決飽受詬病的性能問題。老羅不打算分析ART的實現(xiàn)原理,只是很有興趣知道ART是如何無縫替換掉原來的Dalvik虛擬機的。畢竟在原來的系統(tǒng)中,大量的代碼都是運行在Dalvik虛擬機里面的。開始覺得這個替換工作是挺復雜的,但是分析了相關代碼之后,發(fā)現(xiàn)思路是很清晰的。本文就詳細分析這個無縫的替換過程。
老羅的新浪微博:
http://weibo.com/shengyangluo
,歡迎關注!
我們知道,Dalvik虛擬機實則也算是一個Java虛擬機,只不過它執(zhí)行的不是class文件,而是dex文件。因此,ART運行時最理想的方式也是實現(xiàn)為一個Java虛擬機的形式,這樣就可以很容易地將Dalvik虛擬機替換掉。注意,我們這里說實現(xiàn)為Java虛擬機的形式,實際上是指提供一套完全與Java虛擬機兼容的接口。例如,Dalvik虛擬機在接口上與Java虛擬機是一致的,但是它的內(nèi)部可以是完全不一樣的東西。
實際上,ART運行時就是真的和Dalvik虛擬機一樣,實現(xiàn)了一套完全兼容Java虛擬機的接口。為了方便描述,接下來我們就將ART運行時稱為ART虛擬機,它和Dalvik虛擬機、Java虛擬機的關系如圖1所示:
圖1 Java虛擬機、Dalvik虛擬機和ART運行時的關系
從圖1可以知道,Dalvik虛擬機和ART虛擬機都實現(xiàn)了三個用來抽象Java虛擬機的接口:
1. JNI_GetDefaultJavaVMInitArgs -- 獲取虛擬機的默認初始化參數(shù)
2. JNI_CreateJavaVM -- 在進程中創(chuàng)建虛擬機實例
3. JNI_GetCreatedJavaVMs -- 獲取進程中創(chuàng)建的虛擬機實例
在Android系統(tǒng)中,Davik虛擬機實現(xiàn)在libdvm.so中,ART虛擬機實現(xiàn)在libart.so中。也就是說,libdvm.so和libart.so導出了JNI_GetDefaultJavaVMInitArgs、JNI_CreateJavaVM和JNI_GetCreatedJavaVMs這三個接口,供外界調(diào)用。
此外,Android系統(tǒng)還提供了一個系統(tǒng)屬性persist.sys.dalvik.vm.lib,它的值要么等于libdvm.so,要么等于libart.so。當?shù)扔趌ibdvm.so時,就表示當前用的是Dalvik虛擬機,而當?shù)扔趌ibart.so時,就表示當前用的是ART虛擬機。
以上描述的Dalvik虛擬機和ART虛擬機的共同之處,當然它們之間最顯著還是不同之處。不同的地方就在于,Dalvik虛擬機執(zhí)行的是dex字節(jié)碼,ART虛擬機執(zhí)行的是本地機器碼。這意味著Dalvik虛擬機包含有一個解釋器,用來執(zhí)行dex字節(jié)碼,具體可以參考 Dalvik虛擬機簡要介紹和學習計劃 這個系列的文章。當然,Android從2.2開始,也包含有JIT(Just-In-Time),用來在運行時動態(tài)地將執(zhí)行頻率很高的dex字節(jié)碼翻譯成本地機器碼,然后再執(zhí)行。通過JIT,就可以有效地提高Dalvik虛擬機的執(zhí)行效率。但是,將dex字節(jié)碼翻譯成本地機器碼是發(fā)生在應用程序的運行過程中的,并且應用程序每一次重新運行的時候,都要做重做這個翻譯工作的。因此,即使用采用了JIT,Dalvik虛擬機的總體性能還是不能與直接執(zhí)行本地機器碼的ART虛擬機相比。
那么,ART虛擬機執(zhí)行的本地機器碼是從哪里來的呢?Android的運行時從Dalvik虛擬機替換成ART虛擬機,并不要求開發(fā)者要將重新將自己的應用直接編譯成目標機器碼。也就是說,開發(fā)者開發(fā)出的應用程序經(jīng)過編譯和打包之后,仍然是一個包含dex字節(jié)碼的APK文件。既然應用程序包含的仍然是dex字節(jié)碼,而ART虛擬機需要的是本地機器碼,這就必然要有一個翻譯的過程。這個翻譯的過程當然不能發(fā)生應用程序運行的時候,否則的話就和Dalvik虛擬機的JIT一樣了。在計算機的世界里,與JIT相對的是AOT。AOT進Ahead-Of-Time的簡稱,它發(fā)生在程序運行之前。我們用靜態(tài)語言(例如C/C++)來開發(fā)應用程序的時候,編譯器直接就把它們翻譯成目標機器碼。這種靜態(tài)語言的編譯方式也是AOT的一種。但是前面我們提到,ART虛擬機并不要求開發(fā)者將自己的應用直接編譯成目標機器碼。這樣,將應用的dex字節(jié)碼翻譯成本地機器碼的最恰當AOT時機就發(fā)生在應用安裝的時候。
我們知道,沒有ART虛擬機之前,應用在安裝的過程,其實也會執(zhí)行一次“翻譯”的過程。只不過這個“翻譯”的過程是將dex字節(jié)碼進行優(yōu)化,也就是由dex文件生成odex文件。這個過程由安裝服務PackageManagerService請求守護進程installd來執(zhí)行的。從這個角度來說,在應用安裝的過程中將dex字節(jié)碼翻譯成本地機器碼對原來的應用安裝流程基本上就不會產(chǎn)生什么影響。
有了以上的背景知識之后,我們接下來就從兩個角度來了解ART虛擬機是如何做到無縫替換Dalvik虛擬機的:
1. ART虛擬機的啟動過程;
2. Dex字節(jié)碼翻譯成本地機器碼的過程。
我們知道,Android系統(tǒng)在啟動的時候,會創(chuàng)建一個Zygote進程,充當應用程序進程孵化器。Zygote進程在啟動的過程中,又會創(chuàng)建一個Dalvik虛擬機。Zygote進程是通過復制自己來創(chuàng)建新的應用程序進程的。這意味著Zygote進程會將自己的Dalvik虛擬機復制給應用程序進程。通過這種方式就可以大大地提高應用程序的啟動速度,因為這種方式避免了每一個應用程序進程在啟動的時候都要去創(chuàng)建一個Dalvik。事實上,Zygote進程通過自我復制的方式來創(chuàng)建應用程序進程,省去的不僅僅是應用程序進程創(chuàng)建Dalvik虛擬機的時間,還能省去應用程序進程加載各種系統(tǒng)庫和系統(tǒng)資源的時間,因為它們在Zygote進程中已經(jīng)加載過了,并且也會連同Dalvik虛擬機一起復制到應用程序進程中去。關于Zygote進程和應用程序進程啟動的更多知識,可以參考 Android系統(tǒng)進程Zygote啟動過程的源代碼分析 和 Android應用程序進程啟動過程的源代碼分析 這兩篇文章。
即然應用程序進程里面的Dalvik虛擬機都是從Zygote進程中復制過來的,那么接下來我們就繼續(xù)Zygote進程是如何創(chuàng)建Dalvik虛擬機的。從 Dalvik虛擬機的啟動過程分析 這篇文章可以知道,Zygote進程中的Dalvik虛擬機是從AndroidRutime::start這個函數(shù)開始創(chuàng)建的。因此,接下來我們就看看這個函數(shù)的實現(xiàn):
void AndroidRuntime::start(const char* className, const char* options)
{
......
/* start the virtual machine */
JniInvocation jni_invocation;
jni_invocation.Init(NULL);
JNIEnv* env;
if (startVm(&mJavaVM, &env) != 0) {
return;
}
......
/*
* Start VM. This thread becomes the main thread of the VM, and will
* not return until the VM exits.
*/
char* slashClassName = toSlashClassName(className);
jclass startClass = env->FindClass(slashClassName);
if (startClass == NULL) {
ALOGE("JavaVM unable to locate class '%s'\n", slashClassName);
/* keep going */
} else {
jmethodID startMeth = env->GetStaticMethodID(startClass, "main",
"([Ljava/lang/String;)V");
if (startMeth == NULL) {
ALOGE("JavaVM unable to find main() in '%s'\n", className);
/* keep going */
} else {
env->CallStaticVoidMethod(startClass, startMeth, strArray);
#if 0
if (env->ExceptionCheck())
threadExitUncaughtException(env);
#endif
}
}
......
}
這個函數(shù)定義在文件frameworks/base/core/jni/AndroidRuntime.cpp中。
AndroidRutime類的成員函數(shù)start最主要是做了以下三件事情:
1. 創(chuàng)建一個JniInvocation實例,并且調(diào)用它的成員函數(shù)init來初始化JNI環(huán)境;
2. 調(diào)用AndroidRutime類的成員函數(shù)startVm來創(chuàng)建一個虛擬機及其對應的JNI接口,即創(chuàng)建一個JavaVM接口和一個JNIEnv接口;
3. 有了上述的JavaVM接口和JNIEnv接口之后,就可以在Zygote進程中加載指定的class了。
其中,第1件事情和第2件事情又是最關鍵的。因此,接下來我們繼續(xù)分析它們所對應的函數(shù)的實現(xiàn)。
JniInvocation類的成員函數(shù)init的實現(xiàn)如下所示:
#ifdef HAVE_ANDROID_OS
static const char* kLibrarySystemProperty = "persist.sys.dalvik.vm.lib";
#endif
static const char* kLibraryFallback = "libdvm.so";
bool JniInvocation::Init(const char* library) {
#ifdef HAVE_ANDROID_OS
char default_library[PROPERTY_VALUE_MAX];
property_get(kLibrarySystemProperty, default_library, kLibraryFallback);
#else
const char* default_library = kLibraryFallback;
#endif
if (library == NULL) {
library = default_library;
}
handle_ = dlopen(library, RTLD_NOW);
if (handle_ == NULL) {
if (strcmp(library, kLibraryFallback) == 0) {
// Nothing else to try.
ALOGE("Failed to dlopen %s: %s", library, dlerror());
return false;
}
// Note that this is enough to get something like the zygote
// running, we can't property_set here to fix this for the future
// because we are root and not the system user. See
// RuntimeInit.commonInit for where we fix up the property to
// avoid future fallbacks. http://b/11463182
ALOGW("Falling back from %s to %s after dlopen error: %s",
library, kLibraryFallback, dlerror());
library = kLibraryFallback;
handle_ = dlopen(library, RTLD_NOW);
if (handle_ == NULL) {
ALOGE("Failed to dlopen %s: %s", library, dlerror());
return false;
}
}
if (!FindSymbol(reinterpret_cast<void**>(&JNI_GetDefaultJavaVMInitArgs_),
"JNI_GetDefaultJavaVMInitArgs")) {
return false;
}
if (!FindSymbol(reinterpret_cast<void**>(&JNI_CreateJavaVM_),
"JNI_CreateJavaVM")) {
return false;
}
if (!FindSymbol(reinterpret_cast<void**>(&JNI_GetCreatedJavaVMs_),
"JNI_GetCreatedJavaVMs")) {
return false;
}
return true;
}
這個函數(shù)定義在文件libnativehelper/JniInvocation.cpp中。
JniInvocation類的成員函數(shù)init所做的事情很簡單。它首先是讀取系統(tǒng)屬性persist.sys.dalvik.vm.lib的值。前面提到,系統(tǒng)屬性persist.sys.dalvik.vm.lib的值要么等于libdvm.so,要么等于libart.so。因此,接下來通過函數(shù)dlopen加載到進程來的要么是libdvm.so,要么是libart.so。無論加載的是哪一個so,都要求它導出JNI_GetDefaultJavaVMInitArgs、JNI_CreateJavaVM和JNI_GetCreatedJavaVMs這三個接口,并且分別保存在JniInvocation類的三個成員變量JNI_GetDefaultJavaVMInitArgs_、JNI_CreateJavaVM_和JNI_GetCreatedJavaVMs_中。這三個接口也就是前面我們提到的用來抽象Java虛擬機的三個接口。
從這里就可以看出,JniInvocation類的成員函數(shù)init實際上就是根據(jù)系統(tǒng)屬性persist.sys.dalvik.vm.lib來初始化Dalvik虛擬機或者ART虛擬機環(huán)境。
接下來我們繼續(xù)看AndroidRutime類的成員函數(shù)startVm的實現(xiàn):
int AndroidRuntime::startVm(JavaVM** pJavaVM, JNIEnv** pEnv)
{
......
/*
* Initialize the VM.
*
* The JavaVM* is essentially per-process, and the JNIEnv* is per-thread.
* If this call succeeds, the VM is ready, and we can start issuing
* JNI calls.
*/
if (JNI_CreateJavaVM(pJavaVM, pEnv, &initArgs) < 0) {
ALOGE("JNI_CreateJavaVM failed\n");
goto bail;
}
......
}
這個函數(shù)定義在文件frameworks/base/core/jni/AndroidRuntime.cpp中。
AndroidRutime類的成員函數(shù)startVm最主要就是調(diào)用函數(shù)JNI_CreateJavaVM來創(chuàng)建一個JavaVM接口及其對應的JNIEnv接口:
extern "C" jint JNI_CreateJavaVM(JavaVM** p_vm, JNIEnv** p_env, void* vm_args) {
return JniInvocation::GetJniInvocation().JNI_CreateJavaVM(p_vm, p_env, vm_args);
}
這個函數(shù)定義在文件libnativehelper/JniInvocation.cpp中。
JniInvocation類的靜態(tài)成員函數(shù)GetJniInvocation返回的便是前面所創(chuàng)建的JniInvocation實例。有了這個JniInvocation實例之后,就繼續(xù)調(diào)用它的成員函數(shù)JNI_CreateJavaVM來創(chuàng)建一個JavaVM接口及其對應的JNIEnv接口:
jint JniInvocation::JNI_CreateJavaVM(JavaVM** p_vm, JNIEnv** p_env, void* vm_args) {
return JNI_CreateJavaVM_(p_vm, p_env, vm_args);
}
這個函數(shù)定義在文件libnativehelper/JniInvocation.cpp中。
JniInvocation類的成員變量JNI_CreateJavaVM_指向的就是前面所加載的libdvm.so或者libart.so所導出的函數(shù)JNI_CreateJavaVM,因此,JniInvocation類的成員函數(shù)JNI_CreateJavaVM返回的JavaVM接口指向的要么是Dalvik虛擬機,要么是ART虛擬機。
通過上面的分析,我們就很容易知道,Android系統(tǒng)通過將ART運行時抽象成一個Java虛擬機,以及通過系統(tǒng)屬性persist.sys.dalvik.vm.lib和一個適配層JniInvocation,就可以無縫地將Dalvik虛擬機替換為ART運行時。這個替換過程設計非常巧妙,因為涉及到的代碼修改是非常少的。
以上就是ART虛擬機的啟動過程,接下來我們再分析應用程序在安裝過程中將dex字節(jié)碼翻譯為本地機器碼的過程。
Android應用程序的安裝過程可以參考 Android應用程序安裝過程源代碼分析 這篇文章。簡單來說,就是Android系統(tǒng)通過PackageManagerService來安裝APK,在安裝的過程,PackageManagerService會通過另外一個類Instalerl的成員函數(shù)dexopt來對APK里面的dex字節(jié)碼進行優(yōu)化:
public final class Installer {
......
public int dexopt(String apkPath, int uid, boolean isPublic) {
StringBuilder builder = new StringBuilder("dexopt");
builder.append(' ');
builder.append(apkPath);
builder.append(' ');
builder.append(uid);
builder.append(isPublic ? " 1" : " 0");
return execute(builder.toString());
}
......
}
這個函數(shù)定義在文件frameworks/base/services/java/com/android/server/pm/Installer.java中。
Installer通過socket向守護進程installd發(fā)送一個dexopt請求,這個請求是由installd里面的函數(shù)dexopt來處理的:
int dexopt(const char *apk_path, uid_t uid, int is_public)
{
struct utimbuf ut;
struct stat apk_stat, dex_stat;
char out_path[PKG_PATH_MAX];
char dexopt_flags[PROPERTY_VALUE_MAX];
char persist_sys_dalvik_vm_lib[PROPERTY_VALUE_MAX];
char *end;
int res, zip_fd=-1, out_fd=-1;
......
/* The command to run depend ones the value of persist.sys.dalvik.vm.lib */
property_get("persist.sys.dalvik.vm.lib", persist_sys_dalvik_vm_lib, "libdvm.so");
/* Before anything else: is there a .odex file? If so, we have
* precompiled the apk and there is nothing to do here.
*/
sprintf(out_path, "%s%s", apk_path, ".odex");
if (stat(out_path, &dex_stat) == 0) {
return 0;
}
if (create_cache_path(out_path, apk_path)) {
return -1;
}
......
out_fd = open(out_path, O_RDWR | O_CREAT | O_EXCL, 0644);
......
pid_t pid;
pid = fork();
if (pid == 0) {
......
if (strncmp(persist_sys_dalvik_vm_lib, "libdvm", 6) == 0) {
run_dexopt(zip_fd, out_fd, apk_path, out_path, dexopt_flags);
} else if (strncmp(persist_sys_dalvik_vm_lib, "libart", 6) == 0) {
run_dex2oat(zip_fd, out_fd, apk_path, out_path, dexopt_flags);
} else {
exit(69); /* Unexpected persist.sys.dalvik.vm.lib value */
}
exit(68); /* only get here on exec failure */
}
......
}
這個函數(shù)定義在文件frameworks/native/cmds/installd/commands.c中。
函數(shù)dexopt首先是讀取系統(tǒng)屬性persist.sys.dalvik.vm.lib的值,接著在/data/dalvik-cache目錄中創(chuàng)建一個odex文件。這個odex文件就是作為dex文件優(yōu)化后的輸出文件。再接下來,函數(shù)dexopt通過fork來創(chuàng)建一個子進程。如果系統(tǒng)屬性persist.sys.dalvik.vm.lib的值等于libdvm.so,那么該子進程就會調(diào)用函數(shù)run_dexopt來將dex文件優(yōu)化成odex文件。另一方面,如果系統(tǒng)屬性persist.sys.dalvik.vm.lib的值等于libart.so,那么該子進程就會調(diào)用函數(shù)run_dex2oat來將dex文件優(yōu)化成oart文件,實際上就是將dex字節(jié)碼翻譯成本地機器碼,并且保存在一個oat文件中。
函數(shù)run_dexopt和run_dex2oat的實現(xiàn)如下所示:
static void run_dexopt(int zip_fd, int odex_fd, const char* input_file_name,
const char* output_file_name, const char* dexopt_flags)
{
static const char* DEX_OPT_BIN = "/system/bin/dexopt";
static const int MAX_INT_LEN = 12; // '-'+10dig+'\0' -OR- 0x+8dig
char zip_num[MAX_INT_LEN];
char odex_num[MAX_INT_LEN];
sprintf(zip_num, "%d", zip_fd);
sprintf(odex_num, "%d", odex_fd);
ALOGV("Running %s in=%s out=%s\n", DEX_OPT_BIN, input_file_name, output_file_name);
execl(DEX_OPT_BIN, DEX_OPT_BIN, "--zip", zip_num, odex_num, input_file_name,
dexopt_flags, (char*) NULL);
ALOGE("execl(%s) failed: %s\n", DEX_OPT_BIN, strerror(errno));
}
static void run_dex2oat(int zip_fd, int oat_fd, const char* input_file_name,
const char* output_file_name, const char* dexopt_flags)
{
static const char* DEX2OAT_BIN = "/system/bin/dex2oat";
static const int MAX_INT_LEN = 12; // '-'+10dig+'\0' -OR- 0x+8dig
char zip_fd_arg[strlen("--zip-fd=") + MAX_INT_LEN];
char zip_location_arg[strlen("--zip-location=") + PKG_PATH_MAX];
char oat_fd_arg[strlen("--oat-fd=") + MAX_INT_LEN];
char oat_location_arg[strlen("--oat-name=") + PKG_PATH_MAX];
sprintf(zip_fd_arg, "--zip-fd=%d", zip_fd);
sprintf(zip_location_arg, "--zip-location=%s", input_file_name);
sprintf(oat_fd_arg, "--oat-fd=%d", oat_fd);
sprintf(oat_location_arg, "--oat-location=%s", output_file_name);
ALOGV("Running %s in=%s out=%s\n", DEX2OAT_BIN, input_file_name, output_file_name);
execl(DEX2OAT_BIN, DEX2OAT_BIN,
zip_fd_arg, zip_location_arg,
oat_fd_arg, oat_location_arg,
(char*) NULL);
ALOGE("execl(%s) failed: %s\n", DEX2OAT_BIN, strerror(errno));
}
這兩個函數(shù)定義在文件frameworks/native/cmds/installd/commands.c中。
這從里就可以看出,函數(shù)run_dexopt通過調(diào)用/system/bin/dexopt來對dex字節(jié)碼進行優(yōu)化,而函數(shù)run_dex2oat通過調(diào)用/system/bin/dex2oat來將dex字節(jié)碼翻譯成本地機器碼。注意,無論是對dex字節(jié)碼進行優(yōu)化,還是將dex字節(jié)碼翻譯成本地機器碼,最終得到的結果都是保存在相同名稱的一個odex文件里面的,但是前者對應的是一個dexy文件(表示這是一個優(yōu)化過的dex),后者對應的是一個oat文件(實際上是一個自定義的elf文件,里面包含的都是本地機器指令)。通過這種方式,原來任何通過絕對路徑引用了該odex文件的代碼就都不需要修改了。
通過上面的分析,我們就很容易知道,只需要將dex文件的優(yōu)化過程替換成dex文件翻譯成本地機器碼的過程,就可以輕松地在應用安裝過程,無縫地將Dalvik虛擬機替換成ART運行時。
最后,還有一個地方需要注意的是,應用程序的安裝發(fā)生在兩個時機,第一個時機是系統(tǒng)啟動的時候,第二個時機系統(tǒng)啟動完成后用戶自行安裝的時候。在第一個時機中,系統(tǒng)除了會對/system/app和/data/app目錄下的所有APK進行dex字節(jié)碼到本地機器碼的翻譯之外,還會對/system/framework目錄下的APK或者JAR文件,以及這些APK所引用的外部JAR,進行dex字節(jié)碼到本地機器碼的翻譯。這樣就可以保證除了應用之外,系統(tǒng)中使用Java來開發(fā)的系統(tǒng)服務,也會統(tǒng)一地從dex字節(jié)碼翻譯成本地機器碼。也就是說,將Android系統(tǒng)中的Dalvik虛擬機替換成ART運行時之后,系統(tǒng)中的代碼都是由ART運行時來執(zhí)行的了,這時候就不會對Dalvik虛擬機產(chǎn)生任何的依賴。
至此,我們就分析完成ART運行時無縫替換Dalvik虛擬機的過程了,更多的干貨分享衣關注老羅的新浪微博: http://weibo.com/shengyangluo 。
更多文章、技術交流、商務合作、聯(lián)系博主
微信掃碼或搜索:z360901061
微信掃一掃加我為好友
QQ號聯(lián)系: 360901061
您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧,狠狠點擊下面給點支持吧,站長非常感激您!手機微信長按不能支付解決辦法:請將微信支付二維碼保存到相冊,切換到微信,然后點擊微信右上角掃一掃功能,選擇支付二維碼完成支付。
【本文對您有幫助就好】元

