当前位置:首页 > 全部子站 > IT > 思科认证

JavaSE6新特性:Instrumentation

来源:长理培训发布时间:2017-12-23 14:02:44

 百度广告

  简介  

  利用 Java 代码,即 java.lang.instrument 做动态 Instrumentation 是 Java SE 5 的新特性,它把 Java 的 instrument 功能从本地代码中解放出来,使之可以用 Java 代码的方式解决问题。使用 Instrumentation,开发者可以构建一个独立于应用程序的代理程序(Agent),用来监测和协助运行在 JVM 上的程序,甚至能够替换和修改某些类的定义。有了这样的功能,开发者就可以实现更为灵活的运行时虚拟机监控和 Java 类操作了,这样的特性实际上提供了一种虚拟机级别支持的 AOP 实现方式,使得开发者无需对 JDK 做任何升级和改动,就可以实现某些 AOP 的功能了。  

  在 Java SE 6 里面,instrumentation 包被赋予了更强大的功能:启动后的 instrument、本地代码(native code)instrument,以及动态改变 classpath 等等。这些改变,意味着 Java 具有了更强的动态控制、解释能力,它使得 Java 语言变得更加灵活多变。  

  在 Java SE6 里面,最大的改变使运行时的 Instrumentation 成为可能。在 Java SE 5 中,Instrument 要求在运行前利用命令行参数或者系统参数来设置代理类,在实际的运行之中,虚拟机在初始化之时(在绝大多数的 Java 类库被载入之前),instrumentation 的设置已经启动,并在虚拟机中设置了回调函数,检测特定类的加载情况,并完成实际工作。但是在实际的很多的情况下,我们没有办法在虚拟机启动之时就为其设定代理,这样实际上限制了 instrument 的应用。而 Java SE 6 的新特性改变了这种情况,通过 Java Tool API 中的 attach 方式,我们可以很方便地在运行过程中动态地设置加载代理类,以达到 instrumentation 的目的。  

  另外,对 native 的 Instrumentation 也是 Java SE 6 的一个崭新的功能,这使以前无法完成的功能 -- 对 native 接口的 instrumentation 可以在 Java SE 6 中,通过一个或者一系列的 prefix 添加而得以完成。  

  最后,Java SE 6 里的 Instrumentation 也增加了动态添加 class path 的功能。所有这些新的功能,都使得 instrument 包的功能更加丰富,从而使 Java 语言本身更加强大。  

  Instrumentation 的基本功能和用法  

  "java.lang.instrument"包的具体实现,依赖于 JVMTI。JVMTI(Java Virtual Machine Tool Interface)是一套由 Java 虚拟机提供的,为 JVM 相关的工具提供的本地编程接口集合。JVMTI 是从 Java SE 5 开始引入,整合和取代了以前使用的 Java Virtual Machine Profiler Interface (JVMPI) 和 the Java Virtual Machine Debug Interface (JVMDI),而在 Java SE 6 中,JVMPI 和 JVMDI 已经消失了。JVMTI 提供了一套"代理"程序机制,可以支持第三方工具程序以代理的方式连接和访问 JVM,并利用 JVMTI 提供的丰富的编程接口,完成很多跟 JVM 相关的功能。事实上,java.lang.instrument 包的实现,也就是基于这种机制的:在 Instrumentation 的实现当中,存在一个 JVMTI 的代理程序,通过调用 JVMTI 当中 Java 类相关的函数来完成 Java 类的动态操作。除开 Instrumentation 功能外,JVMTI 还在虚拟机内存管理,线程控制,方法和变量操作等等方面提供了大量有价值的函数。  

  Instrumentation 的最大作用,就是类定义动态改变和操作。在 Java SE 5 及其后续版本当中,开发者可以在一个普通 Java 程序(带有 main 函数的 Java 类)运行时,通过 –javaagent 参数指定一个特定的 jar 文件(包含 Instrumentation 代理)来启动 Instrumentation 的代理程序。  

  在 Java SE 5 当中,开发者可以让 Instrumentation 代理在 main 函数运行前执行。简要说来就是如下几个步骤:  

  编写 premain 函数  

  编写一个 Java 类,包含如下两个方法当中的任何一个  

public static void premain(String agentArgs, Instrumentation inst); [1]  

  其中,[1] 的优先级比  高,将会被优先执行([1] 和  同时存在时, 被忽略)。  

  在这个 premain 函数中,开发者可以进行对类的各种操作。  

  agentArgs 是 premain 函数得到的程序参数,随同 "–javaagent"一起传入。与 main 函数不同的是,这个参数是一个字符串而不是一个字符串数组,如果程序参数有多个,程序将自行解析这个字符串。  

  Inst 是一个 java.lang.instrument.Instrumentation 的实例,由 JVM 自动传入。java.lang.instrument.Instrumentation 是 instrument 包中定义的一个接口,也是这个包的核心部分,集中了其中几乎所有的功能方法,例如类定义的转换和操作等等。  

  jar 文件打包  

  将这个 Java 类打包成一个 jar 文件,并在其中的 manifest 属性当中加入" Premain-Class"来指定步骤 1 当中编写的那个带有 premain 的 Java类。(可能还需要指定其他属性以开启更多功能)  

  运行  

  用如下方式运行带有 Instrumentation 的 Java 程序:  

java -javaagent:jar文件的位置[=传入premain的参数]  

  对 Java 类文件的操作,可以理解为对一个 byte 数组的操作(将类文件的二进制字节流读入一个 byte 数组)。开发者可以在"ClassFileTransformer"的 transform 方法当中得到,操作并最终返回一个类的定义(一个 byte 数组)。这方面,Apache 的 BCEL 开源项目提供了强有力的支持,读者可以在参考文章"Java SE 5 特性 Instrumentation 实践"中看到一个 BCEL 和 Instrumentation 结合的例子。具体的字节码操作并非的重点,所以,中所举的例子,只是采用简单的类文件替换的方式来演示 Instrumentation 的使用。  

  下面,我们通过简单的举例,来说明 Instrumentation 的基本使用方法。  

  首先,我们有一个简单的类,TransClass, 可以通过一个静态方法返回一个整数 1。  

public class TransClass {   
return 1;   
}  

  我们运行如下类,可以得到输出 "1"。  

public class TestMainInJar {   
System.out.println(new TransClass().getNumber());   
}  

  然后,我们将 TransClass 的 getNumber 方法改成如下:  

public int getNumber() {   
}  

  再将这个返回 2 的 Java 文件编译成类文件,为了区别开原有的返回 1 的类,我们将返回 2 的这个类文件命名为 TransClass2.class.2。  

  接下来,我们建立一个 Transformer 类:  

import java.io.File;   
import java.io.IOException;   
import java.lang.instrument.ClassFileTransformer;   
import java.security.Pro???椠?? tectionDomain;  

class Transformer implements ClassFileTransformer {   
public static byte getBytesFromFile(String fileName) {   
// precondition   
InputStream is = new FileInputStream(file);   
byte bytes = new byte[(int) length];  

   // Read in the bytes   
int numRead = 0;   
= 0) {  
}  

   if (offset = 10) {  
}  
}  

  含有 agentmain 的 AgentMain 类的代码为: 

import java.lang.instrument.ClassDefinition;  
import java.lang.instrument.UnmodifiableClassException; 

public class AgentMain {  
throws ClassNotFoundException, UnmodifiableClassException,  
inst.addTransformer(new Transformer (), true);  
System.out.println("Agent Main Done");  
}  |||

  其中,retransformClasses 是 Java SE 6 里面的新方法,它跟 redefineClasses 一样,可以批量转换类定义,多用于 agentmain 场合。 

  Jar 文件跟 Premain 那个例子里面的 Jar 文件差不多,也是把 main 和 agentmain 的类,TransClass,Transformer 等类放在一起,打包为"TestInstrument1.jar",而 Jar 文件当中的 Manifest 文件为: 

Manifest-Version: 1.0  

  另外,为了运行 Attach API,我们可以再写一个控制程序来模拟监控过程:(代码片段) 

import com.sun.tools.attach.VirtualMachine;  
……  
static class AttachThread extends Thread {  
private final String jar;  
listBefore = vms; // 记录程序启动时的 VM 集合  

 public void run() {  
List listAfter = null;  
int count = 0;  
listAfter = VirtualMachine.list();  
if (!listBefore.contains(vmd)) {   
// 这时,我们开始监控这个 VM  
break;  
}  
count++;  
= 10) {  
}  
vm.loadAgent(jar);  
} catch (Exception e) {  
}  
}  
public static void main(String args) throws InterruptedException {   

  运行时,可以首先运行上面这个启动新线程的 main 函数,然后,在 5 秒钟内(仅仅简单模拟 JVM 的监控过程)运行如下命令启动测试 Jar 文件: 

java –javaagent:TestInstrument2.jar –cp TestInstrument2.jar TestMainInJar 

  如果时间掌握得不太差的话,程序首先会在屏幕上打出 1,这是改动前的类的输出,然后会打出一些 2,这个表示 agentmain 已经被 Attach API 成功附着到 JVM 上,代理程序生效了,当然,还可以看到"Agent Main Done"字样的输出。 

  以上例子仅仅只是简单示例,简单说明这个特性而已。真实的例子往往比较复杂,而且可能运行在分布式环境的多个 JVM 之中。  

  在 1.5 版本的 instumentation 里,并没有对 Java 本地方法(Native Method)的处理方式,而且在 Java 标准的 JVMTI 之下,并没有办法改变 method signature, 这就使替换本地方法非常地困难。一个比较直接而简单的想法是,在启动时替换本地代码所在的动态链接库 -- 但是这样,本质上是一种静态的替换,而不是动态的 Instrumentation。而且,这样可能需要编译较大数量的动态链接库 -- 比如,我们有三个本地函数,假设每一个都需要一个替换,而在不同的应用之下,可能需要不同的组合,那么如果我们把三个函数都编译在同一个动态链接库之中,最多我们需要 8 个不同的动态链接库来满足需要。当然,我们也可以独立地编译之,那样也需要 6 个动态链接库--无论如何,这种繁琐的方式是不可接受的。 

  在 Java SE 6 中,新的 Native Instrumentation 提出了一个新的 native code 的解析方式,作为原有的 native method 的解析方式的一个补充,来很好地解决了一些问题。这就是在新版本的 java.lang.instrument 包里,我们拥有了对 native 代码的 instrument 方式 -- 设置 prefix。 

  假设我们有了一个 native 函数,名字叫 nativeMethod,在运行中过程中,我们需要将它指向另外一个函数(需要注意的是,在当前标准的 JVMTI 之下,除了 native 函数名,其他的 signature 需要一致)。比如我们的 Java 代码是: 

package nativeTester;  
…  
…  

  那么我们已经实现的本地代码是: 

jint Java_nativeTester_nativeMethod(jclass thiz, jobject thisObj, jint input); 

  现在我们需要在调用这个函数时,使之指向另外一个函数。那么按照 J2SE 的做法,我们可以按他的命名方式,加上一个 prefix 作为新的函数名。比如,我们以 "another_" 作为 prefix,那么我们新的函数是: 

jint Java_nativeTester_another_nativePrefixTester(jclass thiz, jobject thisObj,  

  然后将之编入动态链接库之中。 

  现在我们已经有了新的本地函数,接下来就是做 instrument 的设置。正如以上所说的,我们可以使用 premain 方式,在虚拟机启动之时就载入 premain 完成 instrument 代理设置。也可以使用 agentmain 方式,去 attach 虚拟机来启动代理。而设置 native 函数的也是相当简单的: 

premain(){ // 或者也可以在 agentmain 里  
if (!isNativeMethodPrefixSupported()){  
}  
…  

  在这里要注意两个问题。一是不是在任何的情况下都是可以设置 native 函数的 prefix 的。首先,我们要注意到 agent 包之中的 Manifest 所设定的特性: 

Can-Set-Native-Method-Prefix 

  要注意,这一个参数都可以影响是否可以设置 native prefix,而且,在默认的设置之中,这个参数是 false 的,我们需要将之设置成 true(顺便说一句,对 Manifest 之中的属性来说都是大小写无关的,当然,如果给一个不是"true"的值,就会被当作 false 值处理)。 

  当然,我们还需要确认虚拟机本身是否支持 setNativePrefix。在 Java API 里,Instrumentation 类提供了一个函数 isNativePrefix,通过这个函数我们可以知道该功能是否可以实行。 

  二是我们可以为每一个 ClassTransformer 加上它自己的 nativeprefix;同时,每一个 ClassTransformer 都可以为同一个 class 做 transform,因此对于一个 Class 来说,一个 native 函数可能有不同的 prefix,因此对这个函数来说,它可能也有好几种解析方式。 

  在 Java SE 6 当中,Native prefix 的解释方式对于某一个 package 内的一个 class 当中的一个 native method 来说,首先,假设我们对这个函数的 transformer 设置了 native 的 prefix"another",它将这个函数接口解释成: 

  由 Java 的函数接口 

native void method() 

  和上述 prefix"another",去寻找本地代码中的函数 

void Java_package_class_another_method(jclass theClass, jobject thiz);   

  一旦可以找到,那么调用这个函数,整个解析过程就结束了;如果没有找到,那么虚拟机将会做进一步的解析工作。我们将利用 Java native 接口最基本的解析方式,去找本地代码中的函数: 

void Java_package_class_method(jclass theClass, jobject thiz); 

  如果找到,则执行之。否则,因为没有任何一个合适的解析方式,于是宣告这个过程失败。 

  那么如果有多个 transformer,同时每一个都有自己的 prefix,又该如何解析呢?事实上,虚拟机是按 transformer 被加入到的 Instrumentation 之中的次序去解析的(还记得我们最基本的 addT???椠?? ransformer 方法吗?)。 

  假设我们有三个 transformer 要被加入进来,他们的次序和相对应的 prefix 分别为:transformer1 和"prefix1_",transformer2 和 "prefix2_",transformer3 和 "prefix3_"。那么,虚拟机会首先做的就是将接口解析为: 

native void prefix1_prefix2_prefix3_native_method() 

  然后去找它相对应的 native 代码。 

  但是如果第二个 transformer(transformer2)没有设定 prefix,那么很简单,我们得到的解析是: 

native void prefix1_prefix3_native_method() 

  这个方式简单而自然。 

  当然,对于多个 prefix 的情况,我们还要注意一些复杂的情况。比如,假设我们有一个 native 函数接口是: 

native void native_method() 

  然后我们为它设置了两个 prefix,比如 "wrapped_" 和 "wrapped2_",那么,我们得到的是什么呢?是 

void Java_package_class_wrapped_wrapped2_method(jclass theClass, jobject thiz);  

  吗?答案是否定的,因为事实上,对 Java 中 native 函数的接口到 native 中的映射,有一系列的规定,因此可能有一些特殊的字符要被代入。而实际中,这个函数的正确的函数名是: 

void Java_package_class_wrapped_1wrapped2_1method(jclass theClass, jobject thiz);  

  很有趣不是吗?因此如果我们要做类似的工作,一个很好的建议是首先在 Java 中写一个带 prefix 的 native 接口,用 javah 工具生成一个 c 的 header-file,看看它实际解析得到的函数名是什么,这样我们就可以避免一些不必要的麻烦。 

  另外一个事实是,与我们的想像不同,对于两个或者两个以上的 prefix,虚拟机并不做更多的解析;它不会试图去掉某一个 prefix,再来组装函数接口。它做且仅作两次解析。 

  总之,新的 native 的 prefix-instrumentation 的方式,改变了以前 Java 中 native 代码无法动态改变的缺点。在当前,利用 JNI 来写 native 代码也是 Java 应用中非常重要的一个环节,因此它的动态化意味着整个 Java 都可以动态改变了 -- 现在我们的代码可以利用加上 prefix 来动态改变 native 函数的指向,正如上面所说的,如果找不到,虚拟机还会去尝试做标准的解析,这让我们拥有了动态地替换 native 代码的方式,我们可以将许多带不同 prefix 的函数编译在一个动态链接库之中,而通过 instrument 包的功能,让 native 函数和 Java 函数一样动态改变、动态替换。 

  当然,现在的 native 的 instrumentation 还有一些限制条件,比如,不同的 transformer 会有自己的 native prefix,就是说,每一个 transformer 会负责他所替换的所有类而不是特定类的 prefix -- 因此这个粒度可能不够精确。  

  我们知道,通过设置系统参数或者通过虚拟机启动参数,我们可以设置一个虚拟机运行时的 boot class 加载路径(-Xbootclasspath)和 system class(-cp)加载路径。当然,我们在运行之后无法替换它。然而,我们也许有时候要需要把某些 jar 加载到 bootclasspath 之中,而我们无法应用上述两个方法;或者我们需要在虚拟机启动之后来加载某些 jar 进入 bootclasspath。在 Java SE 6 之中,我们可以做到这一点了。 

  实现这几点很简单,首先,我们依然需要确认虚拟机已经支持这个功能,然后在 premain/agantmain 之中加上需要的 classpath。我们可以在我们的 Transformer 里使用 appendToBootstrapC???椠?? lassLoaderSearch/appendToSystemClassLoaderSearch 来完成这个任务。 

  同时我们可以注意到,在 agent 的 manifest 里加入 Boot-Class-Path 其实一样可以在动态地载入 agent 的同时加入自己的 boot class 路径,当然,在 Java code 中它可以更加动态方便和智能地完成 -- 我们可以很方便地加入判断和选择成分。 

  在这里我们也需要注意几点。首先,我们加入到 classpath 的 jar 文件中不应当带有任何和系统的 instrumentation 有关的系统同名类,不然,一切都陷入不可预料之中 -- 这不是一个工程师想要得到的结果,不是吗? 

  其次,我们要注意到虚拟机的 ClassLoader 的工作方式,它会记载解析结果。比如,我们曾经要求读入某个类 someclass,但是失败了,ClassLoader 会记得这一点。即使我们在后面动态地加入了某一个 jar,含有这个类,ClassLoader 依然会认为我们无法解析这个类,与上次出错的相同的错误会被报告。 

  再次我们知道在 Java 语言中有一个系统参数"java.class.path",这个 property 里面记录了我们当前的 classpath,但是,我们使用这两个函数,虽然真正地改变了实际的 classpath,却不会对这个 property 本身产生任何影响。 

  在公开的 JavaDoc 中我们可以发现一个很有意思的事情,Sun 的设计师们告诉我们,这个功能事实上依赖于 ClassLoader 的 appendtoClassPathForInstrumentation 方法 -- 这是一个非公开的函数,因此我们不建议直接(使用反射等方式)使用它,事实上,instrument 包里的这两个函数已经可以很好的解决我们的问题了。 

  结语 

  从以上的介绍我们可以得出结论,在 Java SE 6 里面,instrumentation 包新增的功能 -- 虚拟机启动后的动态 instrument、本地代码(native code)instrumentation,以及动态添加 classpath 等等,使得 Java 具有了更强的动态控制、解释能力,从而让 Java 语言变得更加灵活多变。 

  这些能力,从某种意义上开始改变 Java 语言本身。在过去很长的一段时间内,动态 脚本语言的大量涌现和快速发展,对整个软件业和网络业提高生产率起到了非常重要的作用。在这种背景之下,Java 也正在慢慢地作出改变。而 Instrument 的新功能和 Script 平台(本系列的后面一篇中将介绍到这一点)的出现,则大大强化了语言的动态化和与动态语言融合,它是Java 的发展的值得考量的新趋势。

责编:罗莉

发表评论(共0条评论)
请自觉遵守互联网相关政策法规,评论内容只代表网友观点,发表审核后显示!

国家电网校园招聘考试直播课程通关班

  • 讲师:刘萍萍 / 谢楠
  • 课时:160h
  • 价格 4580

特色双名师解密新课程高频考点,送国家电网教材讲义,助力一次通关

配套通关班送国网在线题库一套

课程专业名称
讲师
课时
查看课程

国家电网招聘考试录播视频课程

  • 讲师:崔莹莹 / 刘萍萍
  • 课时:180h
  • 价格 3580

特色解密新课程高频考点,免费学习,助力一次通关

配套全套国网视频课程免费学习

课程专业名称
讲师
课时
查看课程
在线题库
面授课程更多>>
图书商城更多>>
在线报名
  • 报考专业:
    *(必填)
  • 姓名:
    *(必填)
  • 手机号码:
    *(必填)
返回顶部