Java虚拟机之搜索class文件
Posted beiluowuzheng
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Java虚拟机之搜索class文件相关的知识,希望对你有一定的参考价值。
Java命令
Java虚拟机的工作是运行Java应用程序。和其他类型的应用程序一样,Java应用程序也需要一个入口点,这个入口点就是我们熟知的main()方法。如果一个类包含main()方法,这个类就可以用来启动Java应用程序,我们把这个类叫作主类。最简单的Java程序是只有一个main()方法的类,如著名的HelloWorld程序。
public class HelloWorld { public static void main(String[] args) { System.out.println("Hello, world!"); } }
那么Java虚拟机如何知道我们要从哪个类启动应用程序呢?对此,Java虚拟机规范没有明确规定。也就是说,是由虚拟机实现自行决定的。比如Oracle的Java虚拟机实现是通过java命令来启动的,主类名由命令行参数指定。java命令有如下4种形式:
java [-options] class [args] java [-options] -jar jarfile [args] javaw [-options] class [args] javaw [-options] -jar jarfile [args]
可以向java命令传递三组参数:选项、主类名(或者JAR文件名)。
和main()方法参数。选项由减号“-”开头。通常,第一个非选项参数给出主类的完全限定名(fully qualified class name)。但是如果用户提供了–jar选项,则第一个非选项参数表示JAR文件名,java命令必须从这个JAR文件中寻找主类。javaw命令和java命令几乎一样,唯一的差别在于,javaw命令不显示命令行窗口,因此特别适合用于启动GUI(图形用户界面)应用程序。
选项可以分为两类:标准选项和非标准选项。标准选项比较稳定,不会轻易变动。非标准选项以-X开头。非标准选项中有一部分是高级选项,以-XX开头。表1-1列出了java命令常用的选项及其用途。
选项 | 用途 |
-version | 输出版本信息,然后退出 |
-?/-help | 输出帮助信息,然后退出 |
-cp/-classpath | 指定用户类路径 |
-Dproperty=value | 设置Java系统属性 |
-Xms<size> | 设置初始堆空间大小 |
-Xmx<size> | 设置最大堆空间大小 |
-Xss<size> | 设置线程栈空间大小 |
编写命令行工具
我们将以Go语言来阐述Java虚拟机,先定义一个结构体来表示命令行选项和参数。在ch01目录下创建cmd.go文件,用你喜欢的文本编辑器打开它,然后在其中定义Cmd结构体,代码如下:
package main import "flag" import "fmt" import "os" type Cmd struct { helpFlag bool versionFlag bool cpOption string class string args []string }
在Java语言中,API一般以类库的形式提供。在Go语言中,API则是以包(package)的形式提供。包可以向用户提供常量、变量、结构体以及函数等。Java内置了丰富的类库,Go也同样内置了功能强大的包,如:fmt、os和flag包。
os包定义了一个Args变量,其中存放传递给命令行的全部参数。如果直接处理os.Args变量,需要写很多代码。还好Go语言内置了flag包,这个包可以帮助我们处理命令行选项。有了flag包,我们的工作就简单了很多。继续编辑cmd.go文件,在其中定义parseCmd()函数 ,代码如下:
func parseCmd() *Cmd { cmd := &Cmd{} flag.Usage = printUsage flag.BoolVar(&cmd.helpFlag, "help", false, "print help message") flag.BoolVar(&cmd.helpFlag, "?", false, "print help message") flag.BoolVar(&cmd.versionFlag, "version", false, "print version and exit") flag.StringVar(&cmd.cpOption, "classpath", "", "classpath") flag.StringVar(&cmd.cpOption, "cp", "", "classpath") flag.Parse() args := flag.Args() if len(args) > 0 { cmd.class = args[0] cmd.args = args[1:] } return cmd }
首先设置flag.Usage变量,把printUsage()函数赋值给它;然后调用flag包提供的各种Var()函数设置需要解析的选项;接着调用Parse()函数解析选项。如果Parse()函数解析失败,它就调用printUsage()函数把命令的用法打印到控制台。printUsage()函数的代码如下:
func printUsage() { fmt.Printf("Usage: %s [-options] class [args...] ", os.Args[0]) }
如果解析成功,调用flag.Args()函数可以捕获其他没有被解析的参数。其中第一个参数就是主类名,剩下的是要传递给主类的参数。这样,用了不到40行代码,我们的命令行工具就编写完了。下面来测试它。
在ch01目录下创建main.go文件,然后输入下面的代码:
package main import "fmt" func main() { cmd := parseCmd() if cmd.versionFlag { fmt.Println("version 0.0.1") } else if cmd.helpFlag || cmd.class == "" { printUsage() } else { startJVM(cmd) } } func startJVM(cmd *Cmd) { fmt.Printf("classpath:%s class:%s args:%v ", cmd.cpOption, cmd.class, cmd.args) }
注意,与cmd.go文件一样,main.go文件的包名也是main。在Go语言中,main是一个特殊的包,这个包所在的目录(可以叫作任何名字)会被编译为可执行文件。Go程序的入口也是main()函数,但是不接收任何参数,也不能有返回值。main()函数先调用ParseCommand()函数解析命令行参数,如果一切正常,则调用startJVM()函数启动Java虚拟机。如果解析出现错误,或者用户输入了-help选项,则调用PrintUsage()函数打印出帮助信息。如果用户输入了-version选项,则输出版本信息。
打开命令行窗口,执行下面的命令:
go install jvmgoch01
打开命令行窗口,执行命令go install jvmgoch01命令执行完毕后,如果没有看到任何输出就证明编译成功了,此时在{GOPATH}in目录下会出现ch01.exe文件。现在,可以用各种参数进行测试:
D:go_spacein>ch01.exe
Usage: ch01.exe [-options] class [args...]
D:go_spacein>ch01.exe -version
version 0.0.1
D:go_spacein>ch01.exe -help
Usage: ch01.exe [-options] class [args...]
D:go_spacein>ch01.exe -version
version 0.0.1
D:go_spacein>ch01.exe -cp foo/bar MyApp arg1 arg2
classpath:foo/bar class:MyApp args:[arg1 arg2]
类路径
之前我们曾经介绍过HelloWorld类,加载HelloWorld类之前,首先要加载它的超类,也就是java.lang.Object。在调用main()方法之前,因为虚拟机需要准备好参数数组,所以需要加载java.lang.String和java.lang.String[]类。把字符串打印到控制台还需要加载java.lang.System类,等等。那么,Java虚拟机从哪里寻找这些类呢?
Java虚拟机规范并没有规定虚拟机应该从哪里寻找类,因此不同的虚拟机实现可以采用不同的方法。Oracle的Java虚拟机实现根据类路径(class path)来搜索类。按照搜索的先后顺序,类路径可以分为以下3个部分:
- 启动类路径(bootstrap classpath)
- 扩展类路径(extension classpath)
- 用户类路径(user classpath)
启动类路径默认对应jrelib目录,Java标准库(大部分在rt.jar里)位于该路径。扩展类路径默认对应jrelibext目录,使用Java扩展机制的类位于这个路径。我们自己实现的类,以及第三方类库则位于用户类路径。可以通过-Xbootclasspath选项修改启动类路径,不过通常并不需要这样做。
用户类路径的默认值是当前目录,也就是“.”。可以设置CLASSPATH环境变量来修改用户类路径,但是这样做不够灵活,所以不推荐使用。更好的办法是给java命令传递-classpath(或简写为-cp)选项。-classpath/-cp选项的优先级更高,可以覆盖CLASSPATH环境变量设置。-classpath/-cp选项既可以指定目录,也可以指定JAR文件或者ZIP文件,如下:
java -cp path oclasses ... java -cp path olib1.jar ... java -cp path olib2.zip ...
还可以同时指定多个目录或文件,用分隔符分开即可。分隔符因操作系统而异。在Windows系统下是分号,在类UNIX(包括Linux、Mac OS X等)系统下是冒号。例如在Windows下:
java -cp path oclasses;liba.jar;lib.jar;libc.zip ...
从Java 6开始,还可以使用通配符(*)指定某个目录下的所有JAR文件,格式如下:
java -cp classes;lib* ...
把ch01目录复制一份,然后改名为ch02。因为要创建的源文件都在classpath包中,所以在ch02目录中创建一个classpath子目录。现在目录结构看起来应该是这样:
${GOPATH}src |-jvmgo |-ch01 |-ch02 |-classpath |-cmd.go |-main.go
我们的Java虚拟机将使用JDK的启动类路径来寻找和加载Java标准库中的类,因此需要某种方式指定jre目录的位置。命令行选项是个不错的选择,所以增加一个非标准选项-Xjre。打开ch02cmd.go,修改Cmd结构体,添加XjreOption字段,代码如下:
type Cmd struct { helpFlag bool versionFlag bool cpOption string XjreOption string class string args []string }
parseCmd()函数也要相应修改,代码如下:
func parseCmd() *Cmd { cmd := &Cmd{} flag.Usage = printUsage flag.BoolVar(&cmd.helpFlag, "help", false, "print help message") flag.BoolVar(&cmd.helpFlag, "?", false, "print help message") flag.BoolVar(&cmd.versionFlag, "version", false, "print version and exit") flag.StringVar(&cmd.cpOption, "classpath", "", "classpath") flag.StringVar(&cmd.cpOption, "cp", "", "classpath") flag.StringVar(&cmd.XjreOption, "Xjre", "", "path to jre") flag.Parse() args := flag.Args() if len(args) > 0 { cmd.class = args[0] cmd.args = args[1:] } return cmd }
实现类路径
可以把类路径想象成一个大的整体,它由启动类路径、扩展类路径和用户类路径三个小路径构成。三个小路径又分别由更小的路径构成,这很像组合模式(composite pattern)。
Entry接口
先定义一个接口来表示类路径项。在ch02classpath目录下创建entry.go文件,在其中定义Entry接口,代码如下:
package classpath import "os" import "strings" const pathListSeparator = string(os.PathListSeparator) type Entry interface { readClass(className string) ([]byte, Entry, error) String() string } func newEntry(path string) Entry {……}
常量pathListSeparator是string类型,存放路径分隔符,后面会用到。Entry接口中有两个方法。readClass()方法负责寻找和加载class文件;String()方法的作用相当于Java中的toString(),用于返回变量的字符串表示。
readClass()方法的参数是class文件的相对路径,路径之间用斜线(/)分隔,文件名有.class后缀。比如要读取java.lang.Object类,传入的参数应该是java/lang/Object.class。返回值是读取到的字节数据、最终定位到class文件的Entry,以及错误信息。Go的函数或方法允许返回多个值,按照惯例,可以使用最后一个返回值作为错误信息。
newEntry()函数根据参数创建不同类型的Entry实例,代码如下:
func newEntry(path string) Entry { if strings.Contains(path, pathListSeparator) { return newCompositeEntry(path) } if strings.HasSuffix(path, "*") { return newWildcardEntry(path) } if strings.HasSuffix(path, ".jar") || strings.HasSuffix(path, ".JAR") || strings.HasSuffix(path, ".zip") || strings.HasSuffix(path, ".ZIP") { return newZipEntry(path) } return newDirEntry(path) }
Entry接口有4个实现,分别是DirEntry、ZipEntry、CompositeEntry和WildcardEntry。下面分别介绍每一种实现。
DirEntry
在4种实现中,DirEntry相对简单一些,表示目录形式的类路径。在ch02classpath目录下创建entry_dir.go文件,在其中定义DirEntry结构体,代码如下:
package classpath import "io/ioutil" import "path/filepath" type DirEntry struct { absDir string } func newDirEntry(path string) *DirEntry {……} func (self *DirEntry) readClass(className string) ([]byte, Entry, error) {……} func (self *DirEntry) String() string {……}
DirEntry只有一个字段,用于存放目录的绝对路径。和Java语言不同,Go结构体不需要显示实现接口,只要方法匹配即可。Go没有专门的构造函数,可以使用new开头的函数来创建结构体实例,并把这类函数称为构造函数。newDirEntry()函数的代码如下:
func newDirEntry(path string) *DirEntry { absDir, err := filepath.Abs(path) if err != nil { panic(err) } return &DirEntry{absDir} }
newDirEntry()先把参数转换成绝对路径,如果转换过程出现错误,则调用panic()函数终止程序执行,否则创建DirEntry实例并返回。
下面介绍readClass()方法:
func (self *DirEntry) readClass(className string) ([]byte, Entry, error) { fileName := filepath.Join(self.absDir, className) data, err := ioutil.ReadFile(fileName) return data, self, err }
readClass()先把目录和class文件名拼成一个完整的路径,然后调用ioutil包提供的ReadFile()函数读取class文件内容,最后返回。String()方法很简单,直接返回目录,代码如下:
func (self *DirEntry) String() string { return self.absDir }
ZipEntry
ZipEntry表示ZIP或JAR文件形式的类路径。在ch02classpath目录下创建entry_zip.go文件,在其中定义ZipEntry结构体,代码如下:
package classpath import "archive/zip" import "errors" import "io/ioutil" import "path/filepath" type ZipEntry struct { absPath string } func newZipEntry(path string) *ZipEntry {……} func (self *ZipEntry) readClass(className string) ([]byte, Entry, error) {……} func (self *ZipEntry) String() string {……}
absPath字段存放ZIP或JAR文件的绝对路径。构造函数和String()与DirEntry大同小异,代码如下:
func newZipEntry(path string) *ZipEntry { absPath, err := filepath.Abs(path) if err != nil { panic(err) } return &ZipEntry{absPath} }
下面重点介绍如何从ZIP文件中提取class文件,代码如下:
func (self *ZipEntry) readClass(className string) ([]byte, Entry, error) { r, err := zip.OpenReader(self.absPath) if err != nil { return nil, nil, err } defer r.Close() for _, f := range r.File { if f.Name == className { rc, err := f.Open() if err != nil { return nil, nil, err } defer rc.Close() data, err := ioutil.ReadAll(rc) if err != nil { return nil, nil, err } return data, self, nil } } return nil, nil, errors.New("class not found: " + className) }
CompositeEntry
在ch02classpath目录下创建entry_composite.go文件,在其中定义CompositeEntry结构体,代码如下:
package classpath import "errors" import "strings" type CompositeEntry []Entry func newCompositeEntry(pathList string) CompositeEntry {……} func (self CompositeEntry) readClass(className string) ([]byte, Entry, error) {……} func (self CompositeEntry) String() string {……}
如前所述,CompositeEntry由更小的Entry组成,正好可以表示成[]Entry。在Go语言中,数组属于比较低层的数据结构,很少直接使用。大部分情况下,使用更便利的slice类型。构造函数把参数(路径列表)按分隔符分成小路径,然后把每个小路径都转换成具体的Entry实例,代码如下:
func newCompositeEntry(pathList string) CompositeEntry { compositeEntry := []Entry{} for _, path := range strings.Split(pathList, pathListSeparator) { entry := newEntry(path) compositeEntry = append(compositeEntry, entry) } return compositeEntry }
相信读者已经想到readClass()方法的代码了:依次调用每一个子路径的readClass()方法,如果成功读取到class数据,返回数据即可;如果收到错误信息,则继续;如果遍历完所有的子路径还没有找到class文件,则返回错误。readClass()方法的代码如下:
func (self CompositeEntry) readClass(className string) ([]byte, Entry, error) { for _, entry := range self { data, from, err := entry.readClass(className) if err == nil { return data, from, nil } } return nil, nil, errors.New("class not found: " + className) }
String()方法也不复杂。调用每一个子路径的String()方法,然后把得到的字符串用路径分隔符拼接起来即可,代码如下:
func (self CompositeEntry) String() string { strs := make([]string, len(self)) for i, entry := range self { strs[i] = entry.String() } return strings.Join(strs, pathListSeparator) }
WildcardEntry
WildcardEntry实际上也是CompositeEntry,所以就不再定义新的类型了。在ch02classpath目录下创建entry_wildcard.go文件,在其中定义newWildcardEntry()函数,代码如下:
package classpath import "os" import "path/filepath" import "strings" func newWildcardEntry(path string) CompositeEntry { baseDir := path[:len(path)-1] // remove * compositeEntry := []Entry{} walkFn := func(path string, info os.FileInfo, err error) error {……} filepath.Walk(baseDir, walkFn) return compositeEntry }
首先把路径末尾的星号去掉,得到baseDir,然后调用filepath包的Walk()函数遍历baseDir创建ZipEntry。Walk()函数的第二个参数也是一个函数,walkFn变量的定义如下:
walkFn := func(path string, info os.FileInfo, err error) error { if err != nil { return err } if info.IsDir() && path != baseDir { return filepath.SkipDir } if strings.HasSuffix(path, ".jar") || strings.HasSuffix(path, ".JAR") { jarEntry := newZipEntry(path) compositeEntry = append(compositeEntry, jarEntry) } return nil }
在walkFn中,根据后缀名选出JAR文件,并且返回SkipDir跳过子目录(通配符类路径不能递归匹配子目录下的JAR文件)。
Classpath
Entry接口和4个实现介绍完了,接下来实现Classpath结构体。还是在ch02classpath目录下创建classpath.go文件,把下面的代码输入进去。
package classpath import "os" import "path/filepath" type Classpath struct { bootClasspath Entry extClasspath Entry userClasspath Entry } func Parse(jreOption, cpOption string) *Classpath {……} func (self *Classpath) ReadClass(className string) ([]byte, Entry, error) {……} func (self *Classpath) String() string {……}
Classpath结构体有三个字段,分别存放三种类路径。Parse()函数使用-Xjre选项解析启动类路径和扩展类路径,使用-classpath/-cp选项解析用户类路径,代码如下:
func Parse(jreOption, cpOption string) *Classpath { cp := &Classpath{} cp.parseBootAndExtClasspath(jreOption) cp.parseUserClasspath(cpOption) return cp }
parseBootAndExtClasspath()方法的代码如下:
func (self *Classpath) parseBootAndExtClasspath(jreOption string) { jreDir := getJreDir(jreOption) // jre/lib/* jreLibPath := filepath.Join(jreDir, "lib", "*") self.bootClasspath = newWildcardEntry(jreLibPath) // jre/lib/ext/* jreExtPath := filepath.Join(jreDir, "lib", "ext", "*") self.extClasspath = newWildcardEntry(jreExtPath) }
优先使用用户输入的-Xjre选项作为jre目录。如果没有输入该选项,则在当前目录下寻找jre目录。如果找不到,尝试使用JAVA_HOME环境变量。getJreDir()函数的代码如下:
func getJreDir(jreOption string) string { if jreOption != "" && exists(jreOption) { return jreOption } if exists("./jre") { return "./jre" } if jh := os.Getenv("JAVA_HOME"); jh != "" { return filepath.Join(jh, "jre") } panic("Can not find jre folder!") }
exists()函数用于判断目录是否存在,代码如下:
func exists(path string) bool { if _, err := os.Stat(path); err != nil { if os.IsNotExist(err) { return false } } return true }
parseUserClasspath()方法的代码相对简单一些,如下:
func (self *Classpath) parseUserClasspath(cpOption string) { if cpOption == "" { cpOption = "." } self.userClasspath = newEntry(cpOption) }
如果用户没有提供-classpath/-cp选项,则使用当前目录作为用户类路径。ReadClass()方法依次从启动类路径、扩展类路径和用户类路径中搜索class文件,代码如下:
func (self *Classpath) ReadClass(className string) ([]byte, Entry, error) { className = className + ".class" if data, entry, err := self.bootClasspath.readClass(className); err == nil { return data, entry, err } if data, entry, err := self.extClasspath.readClass(className); err == nil { return data, entry, err } return self.userClasspath.readClass(className) }
注意,传递给ReadClass()方法的类名不包含“.class”后缀。最后,String()方法返回用户类路径的字符串表示,代码如下:
func (self *Classpath) String() string { return self.userClasspath.String() }
现在,我们来测试一下ch02的代码,打开ch02/main.go文件,添加两条import语句,代码如下:
package main import "fmt" import "strings" import "jvmgo/ch02/classpath" func main() {……} func startJVM(cmd *Cmd) {……}
main()函数不用变,重写startJVM()函数,代码如下:
func startJVM(cmd *Cmd) { cp := classpath.Parse(cmd.XjreOption, cmd.cpOption) fmt.Printf("classpath:%v class:%v args:%v ", cp, cmd.class, cmd.args) className := strings.Replace(cmd.class, ".", "/", -1) classData, _, err := cp.ReadClass(className) if err != nil { fmt.Printf("Could not find or load main class %s ", cmd.class) return } fmt.Printf("class data:%v ", classData) }
startJVM()先打印出命令行参数,然后读取主类数据,并打印到控制台,虽然还是无法真正启动Java虚拟机。打开命令行窗口,执行下面的命令编译代码:
D:go_spacesrc>go install jvmgoch02
编译成功后,在{GOPATH}in目录下出现ch02.exe文件。执行ch02.exe,指定好-Xjre选项和类名,就可以把class文件的内容打印出来:
D:go_spacein>ch02.exe -Xjre "D:JDKjdk1.8.0_77jre" java.lang.Object classpath:D:go_spacein class:java.lang.Object args:[] class data:[202 254 186……2 0 77]
以上是关于Java虚拟机之搜索class文件的主要内容,如果未能解决你的问题,请参考以下文章