版本 3 - 添加协程

19.6 用协程优化性能

如果有太多客户端同时尝试添加 URL,第 2 个版本依旧存在性能问题。得益于锁机制,我们的 map 可以在并发访问环境下安全地更新,但每条新产生的记录都要立即写入磁盘,这种机制成为了瓶颈。写入操作可能同时发生,根据不同操作系统的特性,可能会产生数据损坏。就算不产生写入冲突,每个客户端在 函数返回前,必须等待数据写入磁盘。因此,在一个 I/O 负载很高的系统中,客户端为了完成 Add 请求,将等待更长的不必要的时间。

为缓解该问题,必须对 Put 和存储进程解耦:我们将使用 Go 的并发机制。我们不再将记录直接写入磁盘,而是发送到一个通道中,它是某种形式的缓冲区,因而发送函数不必等待它完成。

保存进程会从该通道读取数据并写入磁盘。它是以 saveLoop 协程启动的独立线程。现在 mainsaveLoop 并行地执行,不会再发生阻塞。

URLStorefile 字段替换为 record 类型的通道:save chan record

  1. func (s *URLStore) Put(url string) string {
  2. for {
  3. key := genKey(s.Count())
  4. if s.Set(key, url) {
  5. s.save <- record{key, url}
  6. return key
  7. }
  8. panic("shouldn't get here")
  9. }

save 通道的另一端必须有一个接收者:新的 saveLoop 方法在独立的协程中运行,它接收 record 值并将它们写入到文件。saveLoop 是在 NewURLStore() 函数中用 go 关键字启动的。现在,可以移除不必要的打开文件的代码。以下是修改后的 NewURLStore()

以下是 saveLoop 方法的代码:

  1. f, err := os.Open(filename, os.O_WRONLY|os.O_CREATE|os.O_APPEND, 0644)
  2. if err != nil {
  3. log.Fatal("URLStore:", err)
  4. }
  5. defer f.Close()
  6. e := gob.NewEncoder(f)
  7. for {
  8. // taking a record from the channel and encoding it
  9. r := <-s.save
  10. if err := e.Encode(r); err != nil {
  11. log.Println("URLStore:", err)
  12. }

在无限循环中,记录从 save 通道读取,然后编码到文件中。

我们在 深入学习了协程和通道,但在这里我们见到了实用的案例,更好地管理程序的不同部分。注意现在 Encoder 对象只被创建一次,而不是每次保存时都创建,这也可以节省了一些内存和运算处理。

先创建一些全局变量来保存 flag 的值:

为了处理命令行参数,必须把 flag.Parse() 添加到 main 函数中,在 flag 解析后才能实例化 URLStore,一旦得知了 dataFile 的值(在代码中使用了 *dataFile,因为 flag 是指针类型必须解除引用来获取值,见 4.9 节):

  1. var store *URLStore
  2. func main() {
  3. flag.Parse()
  4. store = NewURLStore(*dataFile)
  5. http.HandleFunc("/", Redirect)
  6. http.HandleFunc("/add", Add)
  7. http.ListenAndServe(*listenAddr, nil)
  8. }

现在 Add 处理函数中须用 *hostname 替换 localhost:8080

编译或直接使用现有的可执行程序测试第 3 个版本。