Skip to content

Latest commit

 

History

History

chap10

Folders and files

NameName
Last commit message
Last commit date

parent directory

..
 
 
 
 
 
 
 
 
 
 
 
 

第十章 包和工具

Go语言有超过100个的标准包,标准库为大多数的程序提供了必要的基础构件。

go list std 

10.1 包简介

任何包系统设计的目的都是为了简化大型程序的设计和维护工作,通过将一组相关的特性放进一个独立的单元以便于理解和更新,在每个单元更新的同时保持和程序中其它单元的相对独立性。这种模块化的特性允许每个包可以被其它的不同项目共享和重用,在项目范围内、甚至全球范围统一的分发和复用。

每个包一般都定义了一个不同的名字空间用于它内部的每个标识符的访问。每个名字空间关联到一个特定的包,让我们给类型、函数等选择简短明了的名字,这样可以在使用它们的时候减少和其它部分名字的冲突。

10.2 导入路径

每个包是由一个全局唯一的字符串所标识的导入路径定位。出现在import语句中的导入路径也是字符串。

import (
    "fmt"
    "math/rand"
    "encoding/json"

    "golang.org/x/net/html"

    "github.com/go-sql-driver/mysql"
)

如果你计划分享或发布包,那么导入路径最好是全球唯一的。为了避免冲突,所有非标准库包的导入路径建议以所在组织的互联网域名为前缀;而且这样也有利于包的检索。例如,上面的import语句导入了Go团队维护的HTML解析器和一个流行的第三方维护的MySQL驱动。

10.3 包声明

在每个Go语言源文件的开头都必须有包声明语句。包声明语句的主要目的是确定当前包被其它包导入时默认的标识符(也称为包名)。

例如,math/rand包的每个源文件的开头都包含package rand包声明语句,所以当你导入这个包,你就可以用rand.Int、rand.Float64类似的方式访问包的成员。

package main

import (
    "fmt"
    "math/rand"
)

func main() {
    fmt.Println(rand.Int())
}

10.4 导入声明

可以在一个Go语言源文件包声明语句之后,其它非导入声明语句之前,包含零到多个导入包声明语句。每个导入声明可以单独指定一个导入路径,也可以通过圆括号同时导入多个导入路径。下面两个导入形式是等价的,但是第二种形式更为常见。

import "fmt"
import "os"

import (
    "fmt"
    "os"
)

果我们想同时导入两个有着名字相同的包,例如math/rand包和crypto/rand包,那么导入声明必须至少为一个同名包指定一个新的包名以避免冲突。这叫做导入包的重命名

import (
    "crypto/rand"
    mrand "math/rand" // alternative name mrand avoids conflict
)

10. 5 包的匿名导入

如果只是导入一个包而并不使用导入的包将会导致一个编译错误。

但是有时候我们只是想利用导入包而产生的副作用:它会计算包级变量的初始化表达式和执行导入包的init初始化函数。这时候我们需要抑制“unused import”编译错误,我们可以用下划线_来重命名导入的包。像往常一样,下划线_为空白标识符,并不能被访问。

import _ "image/png" // register PNG decoder

10.6 包和命名

当创建一个包,一般要用短小的包名,但也不能太短导致难以理解。标准库中最常用的包有bufio、bytes、flag、fmt、http、io、json、os、sort、sync和time等包。

尽可能让命名有描述性且无歧义。

包名一般采用单数的形式。

10.7 工具

本章剩下的部分将讨论Go语言工具箱的具体功能,包括如何下载、格式化、构建、测试和安装Go语言编写的程序。

$ go
...
    build            compile packages and dependencies
    clean            remove object files
    doc              show documentation for package or symbol
    env              print Go environment information
    fmt              run gofmt on package sources
    get              download and install packages and dependencies
    install          compile and install packages and dependencies
    list             list packages
    run              compile and run Go program
    test             test packages
    version          print Go version
    vet              run go tool vet on packages

Use "go help [command]" for more information about a command.
...

10.8 包的下载安装

go程序编写过程中会用到第三方库,很多使用了github。在go build过程中会下载第三方库。默认的go proxy代理很慢,可以进行修改。参考链接

$ go env -w GO111MODULE=on
$ go env -w GOPROXY=https://goproxy.cn,direct

可以避免网络超时的情况。

通过 go env,查看相应的配置:

go_env环境

可以看到相应的包缓存路径。有些github包安装如下。

![包的位置]jpg/包的位置.png)

https://zhuanlan.zhihu.com/p/60703832

拜拜了,GOPATH君!新版本Golang的包管理入门教程

10.9包管理

(1)GOPATH使用

是GO开发环境所设置的一个变量。历史版本的 go 语言开发时,需要将代码放在 GOPATH 目录的 src 文件夹下。go get 命令获取依赖,也会自动下载到 GOPATH 的 src 下。GOPATH设置如下:

gopath设置

通过go get进行包下载:

goget

可以看到下载的数据包在GOPATH路径中:

goget_envpath

(2)存在的问题

GOPATH 模式下,go get 命令使用时,没有版本选择机制,拉下来的依赖代码都会默认当前最新版本,而且如果当项目 A 和项目 B 分别依赖项目 C 的两个不兼容版本时, GOPATH 路径下只有一个版本的 C 将无法同时满足 A 和 B 的依赖需求。这可以说是一个很大的缺陷了,因而 Go1.13 起,官方就不再推荐使用 GOPATH 的模式了。

(3) Go modules

基本思路是为每个项目单独维护一份对应版本依赖的拷贝。主要涉及到如下几个配置:

GO111MODULE="auto"
GOPROXY="https://goproxy.io,direct"
GONOPROXY=""
GOSUMDB="sum.golang.org"
GONOSUMDB=""
GOPRIVATE=""

是否开启go module的开关,可用参数值如下:

含义
auto 在 GOPATH/src 之外,将自动使用 Go Modules 模式。否则还是用 GOPATH 模式。目前在最新的 Go1.14 中是默认值。
on 启用 Go modules,将不使用 GOPATH,推荐设置,将会是未来版本中的默认值。
off 或者不设置 Go 将使用 GOPATH 和沿用老的 vendor 机制,禁用 Go modules。不推荐设置。

(4)go mod init命令

项目初始化:

go mod init github/kuangtu/groupcache_test

可以看到创建了文件go.mod:

goinit

文件内容如下:

module github/kuangtu/groupcache_test

go 1.16

它记录了当前项目的模块信息,每一行都以一个关键词开头。在该目录下执行go get,下载依赖包:

![go get pkg](jpg/go get pkg.png)

再次查看go.mod文件:

module github/kuangtu/groupcache_test

go 1.16

require (
	github.com/golang/groupcache v0.0.0-20200121045136-8c9f03a8e57e // indirect
	github.com/golang/protobuf v1.4.3 // indirect
)

go.sum文件:

下载依赖包有可能被恶意篡改,以及缓存在本地的依赖包也有被篡改的可能,单单一个 go.mod 文件并不能保证一致性构建,Go 开发团队在引入 go.mod 的同时也引入了 go.sum 文件,用于记录每个依赖包的哈希值(SHA-256 算法),在 build 时,如果本地的依赖包 hash 值与 go.sum 文件中记录得不一致,则会拒绝 build。

10.10 依赖管理

go module机制自动分析项目的依赖包,并选择最合适的版本。如果项目依赖的包有多个版本,Go Module是如何选出最合适的哪个版本?

语义导入版本 (Semantic Import Versioning)

在go.mod里面的reqiure段中依赖的版本号,都符合vX.Y.Z的格式。在Go Module构建模式下,符合要求的版本号,满足由前缀和一个满足语义版本规范的版本号组成。

语义版本

按照语义版本规范,主版本号不同的两个版本是相互不兼容的。而且,在主版本号相同的情况下,次版本号大都是向后兼容次版本号小的版本。补丁版本号也不影响兼容性。且Go Module规定:如果同一个包的新旧版本是兼容的,那么它们的包导入路径应该是相同的。比如:如果logrus有多个版本,V1.7.1和V1.8.1,新版本兼容老版本1.7.1,都可以使用:

import "github.com/sirupsen/logrus"

如果之后推出了V2.0.0版本,则不能按照上述的方式导入。Go Module给出了新的方法:将包主版本号引入到包导入路径中:

import "github.com/sirupsen/logrus/v2"

则可以使用多个不兼容版本的包:

import (
    "github.com/sirupsen/logrus"
    logv2 "github.com/sirupsen/logrus/v2"
)

最小版本选择原则

如果项目依赖的包之间没有共同的依赖关系,相对容易解决。如果依赖关系比较复杂,比如:

复杂依赖关系项目直接依赖的两个包A和B,又分别依赖包C的不同版本,且C有最新的版本。此时该如何选择。

通常会选择依赖包的**“最新最大 (Latest Greatest) 版本”**。

但是Go另辟蹊径,在诸多兼容性版本间,他们不光要考虑最新最大的稳定与安全,还要尊重各个 module 的诉求:A 明明说只要求 C v1.1.0,B 明明说只要求 C v1.3.0。所以 Go 会在该项目依赖项的所有版本中,选出符合项目整体要求的“最小版本”。

这个例子中,C v1.3.0 是符合项目整体要求的版本集合中的版本最小的那个,于是 Go 命令选择了 C v1.3.0,而不是最新最大的 C v1.7.0。并且,Go 团队认为“最小版本选择”为 Go 程序实现持久的和可重现的构建提供了最佳的方案。

10.11 构建模式

10.10 说明了Go Module管理、包依赖基本原理。在日常工作中,也是围绕Go Module进行维护。

10.11.1 为当前 module 添加一个依赖

在一个Module中添加一个依赖包:

package main

import (
  "github.com/google/uuid" 
  "github.com/sirupsen/logrus"
)

func main() {
  logrus.Println("hello, go module mode")
  logrus.Println(uuid.NewString())
}

如果go build编译,报错:

build错误

没有module提供github.com/google/uuid 包,可以通过 go get命令手动增加。

但是如果是复杂项目,依赖包很多,通过手动非常效率非常低下,可以通过go mod tidy自动分析和下载。

此时go.mod文件中也增加了新的依赖包。

module module-mode

go 1.16

require (
	github.com/google/uuid v1.3.0
	github.com/sirupsen/logrus v1.8.1
)

10.11.2 升级、降级依赖的版本

基于“语义导入版本”可以手动对依赖包信息升降级。Go 命令也可以根据版本兼容性,自动选择出合适的依赖版本了。

以上面提到过的 logrus 为例,通过go list查看有多个版本:

查询多个版本

如果需要降低至某个版本,可以执行带有版本号的go get命令:

![go get降级](jpg/go get降级.jpg)

从输出结果可以看到下载了V1.7.1版本,go.mod中依赖包信息也降低到V1.7.1版本。

也可以使用go mod edit命令告知要依赖V1.7.1版本,然后go mod tidy下载依赖包。

![go mod 降级](jpg/go mod 降级.jpg)

10.11.3 添加一个主版本号大于 1 的依赖

语义导入版本机制有一个原则:如果新旧版本的包使用相同的导入路径,那么新包与旧包是兼容的。

按照语义版本规范,如果我们要为项目引入主版本号大于 1 的依赖,比如 v2.0.0,那么由于这个版本与 v1、v0 开头的包版本都不兼容,我们在导入 v2.0.0 包时,不能再直接使用 github.com/user/repo,而要使用像下面代码中那样不同的包导入路径:

import github.com/user/repo/v2/xxx

如果我们要为 Go 项目添加主版本号大于 1 的依赖,在声明它的导入路径的基础上,加上版本号信息。比如:

package main

import (
  _ "github.com/go-redis/redis/v7"
  "github.com/google/uuid"
  "github.com/sirupsen/logrus"
)

func main() {
  logrus.Println("hello, go module mode")
  logrus.Println(uuid.NewString())
}

10.11.4 升级依赖版本到一个不兼容版本

不同主版本的包的导入路径是不同的,所以需要先将代码中 redis 包导入路径中的版本号改为 v8:

import (
  _ "github.com/go-redis/redis/v8"
  "github.com/google/uuid"
  "github.com/sirupsen/logrus"
)

然后通过 go get来获取v8版本的依赖包。

10.11.5 移除一个依赖

如果不在使用某个依赖包,直接从代码中删掉对redis空导入这一行,然后go build命令构建,但是没有启动作用。通过go list命令列出当前的module的所有依赖,发现redis/v8仍然出现在结果中:

$go list -m all
github.com/bigwhite/module-mode
github.com/cespare/xxhash/v2 v2.1.1
github.com/davecgh/go-spew v1.1.1
... ...
github.com/go-redis/redis/v8 v8.11.1
... ...
gopkg.in/yaml.v2 v2.3.0

这是因为如果源码满足成功构建的条件,go build 命令是不会“多管闲事”地清理 go.mod 中多余的依赖项的。

使用go mod tidy命令,将这个依赖项彻底从 Go Module 构建上下文中清除掉。

10.11.6 特殊情况,使用vendor

go mod vendor 命令在 vendor 目录下,创建了一份这个项目的依赖包的副本,并且通过 vendor/modules.txt 记录了 vendor 下的 module 以及版本。

如果我们要基于 vendor 构建,而不是基于本地缓存的 Go Module 构建,我们需要在 go build 后面加上 -mod=vendor 参数。

10.12 入口函数和包初始化

main.main 函数:Go 应用的入口函数。可执行的程序的main包中必须定义main函数,否则Go编译器会报错。

10.12.1 init 函数:Go 包的初始化函数

Go程序在包初始化时,自动调用它的init函数,因此这些 init 函数的执行就都会发生在 main 函数之前。

但是不能显式调用init。

package main
import "fmt"


func init() {
    fmt.Println("invoke init")
}

func main() { 
    init()
}

编译报错:

callinit_err

10.12.2 包的初始化顺序

Go 包是程序逻辑封装的基本单元,一个 Go 程序就是由一组包组成的,程序的初始化就是这些包的初始化。每个 Go 包还会有自己的依赖包、常量、变量、init 函数(其中 main 包有 main 函数)等。

  • 依赖包按“深度优先”的次序进行初始化;
  • 每个包内按以“常量 -> 变量 -> init 函数”的顺序进行初始化;
  • 包内的多个 init 函数按出现次序进行自动调用。

10.12.3 init函数用途

(1)重置包级变量值

init函数对包级数据进行初始状态检查。比如:flag包初始化时,由于 init 函数初始化次序在包级变量之后,因此包级变量 CommandLine 会在 init 函数之前被初始化了。

var CommandLine = NewFlagSet(os.Args[0], ExitOnError)

func NewFlagSet(name string, errorHandling ErrorHandling) *FlagSet {
    f := &FlagSet{
        name:          name,
        errorHandling: errorHandling,
    }
    f.Usage = f.defaultUsage
    return f
}

func (f *FlagSet) defaultUsage() {
    if f.name == "" {
        fmt.Fprintf(f.Output(), "Usage:\n")
    } else {
        fmt.Fprintf(f.Output(), "Usage of %s:\n", f.name)
    }
    f.PrintDefaults()
}

CommandLine变量通过NewFlagSet创建,usage字段被赋值为defaultUsage。

flag 包在 init 函数中重置了 CommandLine 的 Usage 字段:

func init() {
    CommandLine.Usage = commandLineUsage // 重置CommandLine的Usage字段
}

func commandLineUsage() {
    Usage()
}

var Usage = func() {
    fmt.Fprintf(CommandLine.Output(), "Usage of %s:\n", os.Args[0])
    PrintDefaults()
}

这个时候我们会发现,CommandLine 的 Usage 字段,设置为了一个 flag 包内的未导出函数 commandLineUsage,后者则直接使用了 flag 包的另外一个导出包变量 Usage。这样,就可以通过 init 函数,将 CommandLine 与包变量 Usage 关联在一起了。

(2)是实现对包级变量的复杂初始化

(3)在 init 函数中实现“注册模式”

参考文献

【1】语义版本规范

【2】https://www.infoq.cn/article/xyjhjja87y7pvu1iwhz3