(給 程序員的那些事 加星標(biāo) )
翻譯:伯樂在線/tsteho,英文:Nick Parsons
切換到新的編程語言始終是一件大事,尤其是在這種嚴(yán)峻的情況下:團(tuán)隊成員中僅有一人具備該種語言的使用經(jīng)驗。今年年初,我們將? Stream ?的主要編程語言從 Python 切換到了 Go。
這篇文章將給出一些理由以說明兩個問題:為什么我們決定舍棄 Python?又是為什么選擇了 Go?
為什么使用 Go?
原因 1 – 性能
Go 的運行速度非常快。性能類似于 Java 或者 C++。對于我們的使用情況來說,Go 一般比 Python 快 30 倍。這里有個小型的測試游戲? Go vs Java 。
原因 2 – 語言的性能很重要
對于很多應(yīng)用來說,編程語言只是應(yīng)用程序和數(shù)據(jù)庫之間的粘合劑。語言本身的性能通常無關(guān)緊要。
然而,Stream 是一家 API 提供商,其為 500 家公司和 2 億多終端用戶提供信息流基礎(chǔ)設(shè)施。我們一直在優(yōu)化 Cassandra、PostgreSQL 和 Redis 等工具。這持續(xù)了好幾年,但是最終,我們還是到達(dá)了所用語言的瓶頸。
Python 是一門很棒的語言,但是在諸如序列化/反序列化、排序以及聚合之類的場景上,它的性能相當(dāng)差。我們常常遇到性能上的問題:花 1ms 的時間拿到 Cassandra 中的數(shù)據(jù),Python 接下來還需要花 10ms 的時間將拿到的數(shù)據(jù)轉(zhuǎn)換成對象。
原因 3 – 開發(fā)人員的開發(fā)效率 & 拒絕太富有創(chuàng)造性
看看這些來自于? How I Start Go tutorial ?的 Go 的代碼片段。(這是一個很棒的教程,也是一個學(xué)習(xí) Go 語言的一個很好的起點。)
如果你是 Go 語言新手,在閱讀那些代碼片段時,沒有什么會讓你大吃一驚。這些代碼段僅僅演示了go語言的一些特性,例如賦值、數(shù)據(jù)結(jié)構(gòu)、指針、格式化和內(nèi)置的 HTTP 庫。
當(dāng)我第一次開始編程時,我總是喜歡用 Python 比較高級的特性。Python 允許你更有“創(chuàng)意”的寫代碼。比如,你能夠做如下的事:
-
在代碼初始化時使用元類自行注冊類
-
關(guān)鍵字 True 和 False 的值可以互換
-
編寫自己的函數(shù),并且使其成為內(nèi)建函數(shù)。
-
通過魔法方法重載運算符
這些特性很有趣,但是,正如大多數(shù)程序員都同意的那樣,在閱讀別人的代碼時,它們的存在使得代碼更難理解。
Go 迫使你回歸基礎(chǔ)。這決定了 Go 代碼是容易閱讀和理解的。
說明:當(dāng)然,“容易”的程度需要視情況而定。如果你想要創(chuàng)建一個基本的增刪改查接口,我仍然推薦你使用 Django +? DRF ,或者用 Rails。
原因 4 – 并發(fā) & 管道
作為一門編程語言,Go 試圖讓事情變得簡單。它沒有引入很多的新概念。重點是創(chuàng)造的這門編程語言的性能要難以置信的快,并且容易上手。goroutines 和管道是 Go 僅有的創(chuàng)新點。(準(zhǔn)確的講, CSP ?這個概念1977年就被提出了,因此這個創(chuàng)新更準(zhǔn)確的說法是——舊點子的新實現(xiàn))Goroutines 是 Go 對線程的輕量級實現(xiàn),而管道是讓 goroutines 之間相互通信的絕佳的方式。
Goroutines 占用的資源非常少,只需要幾 KBs 的額外內(nèi)存。因為 Goroutines 非常輕量,所以同時運行數(shù)百甚至數(shù)千個也不在話下。
你可以使用管道在 goroutines 之間通信。Go 運行時會處理所有的復(fù)雜事物。goroutines 的存在以及基于管道的并發(fā)方法,使得程序可以充分利用 CPU 資源、處理并發(fā) IO — 所有這些都沒有增加開發(fā)的復(fù)雜性。與 Python/Java 相比,在 goroutine 上運行一個函數(shù)只需要非常少的樣板代碼。您只需在函數(shù)調(diào)用前加上關(guān)鍵字“go”:
https://tour.golang.org/concurrency/1
和 Node 相比,Go 的并發(fā)處理更加容易。如果使用 Node 寫并發(fā)方法,開發(fā)者必須密切關(guān)注異步代碼的處理方式。
Go 自帶 競爭檢測器 ,這是用 Go 寫并發(fā)程序另一個好的方面。如果異步代碼中出現(xiàn)條件競爭的情況,檢測器能幫你輕松地找到問題。
如果要學(xué)習(xí) Go 和管道的話,下面是一些不錯的資料:
-
https://blog.golang.org/race-detector
-
https://tour.golang.org/concurrency/2
-
http://guzalexander.com/2013/12/06/golang-channels-tutorial.html
-
https://www.golang-book.com/books/intro/10
-
https://www.goinggo.net/2014/02/the-nature-of-channels-in-go.html
-
Goroutines vs Green threads
原因 5 – 編譯時間短
目前,我們使用 Go 編寫的最大微服務(wù)只需 6 秒鐘就能完成編譯。與 Java 和 C++ 這樣以低速編譯速度著稱的語言相比,Go 的快速編譯能力是一場生產(chǎn)力上的大勝。我也喜歡趁著代碼編譯的時間去放松一下,但是,如果能在我還記得代碼是做什么事情的時候就完成編譯,豈不更好?況且本來就應(yīng)該是這樣的才對。
原因 6 – 創(chuàng)建一個團(tuán)隊的能力
首先,讓我們認(rèn)清一個現(xiàn)實:與 C++ 和 Java 這樣的老牌編程語言相比,Go 開發(fā)人員的數(shù)量是不占上風(fēng)的。根據(jù)? StackOverflow ?的數(shù)據(jù),38% 的開發(fā)人員熟悉 Java,19.3% 的開發(fā)人員熟悉 C++,僅僅 4.6% 的開發(fā)人員熟悉 Go。 GitHub 上的數(shù)據(jù) 顯示一個 相似的趨勢 :Go 用得比 Erlang、Scala 以及 Elixir 廣泛,但是不及 Java 和 C++。
幸運的是,Go 很簡單,而且易于學(xué)習(xí)。它提供了你所需要的基本的特性,一點不多,一點不少。它引入了 2 個新的概念:“ defer ”聲明、“go routines” 和管道內(nèi)建的并發(fā)管理。(對于純粹主義者來說:Go 并不是第一種實現(xiàn)這些概念的語言,而是第一種使它們受歡迎的語言。)團(tuán)隊中任何地 Python、Elixir、C++、Scala 或 Java 開發(fā)人員都可以在一個月內(nèi)有效地掌握 Go,因為它非常簡單。
我們發(fā)現(xiàn),和很多其他的編程語言相比,創(chuàng)建一個 Go 開發(fā)團(tuán)隊更容易。如果你在競爭激烈的環(huán)境(如? Boulder、Amsterdam )雇傭人員,這是一大優(yōu)點。
原因 7 – 強大的生態(tài)系統(tǒng)
對于我們一個大約 20 個人的團(tuán)隊來說,生態(tài)系統(tǒng)很重要。如果你不得不重新發(fā)明每一部分的功能,你根本不可能為你的客戶創(chuàng)造價值。Go 對我們使用的工具提供了很大的支持。比如這些可靠的庫:Redis、RabbitMQ、PostgreSQL、模板解析、任務(wù)調(diào)度、表達(dá)式解析和 RocksDB。
與 Rust 或 Elixir 等其他新語言相比,Go 的生態(tài)系統(tǒng)是一項重大勝利。當(dāng)然,Go 并不像 Java、Python 或者 Node 那樣出色。但是它非常的可靠,并且對于一些基本的需求,你都可以找到高質(zhì)量的包。
原因 8 – Gofmt:強制代碼格式化
那么什么是 Gofmt 呢?注意,它并不是臟話。Gofmt 是一個極棒的命令行工具集,已集成到了 Go 編譯器,用于格式化代碼。從功能上來講,它有點像 Python 中的 autopep8。除非是在《硅谷》電視劇中,不然大多數(shù)人并不真的喜歡爭論該用 tabs 還是 spaces。格式的一致性是非常重要的,但是實際的格式標(biāo)準(zhǔn)并不是那么重要。Gofmt 提供官方的標(biāo)準(zhǔn)來格式化你的代碼,從而避免了不必要的爭論。
原因 9 – gRPC 與 Protocol Buffers
Go 對 protocol buffers 和 gRPC 有著一流的支持。在構(gòu)建需要通過 RPC 進(jìn)行通信的微服務(wù)時,這兩個工具可以很好地協(xié)同工作。你只需編寫一個說明文件,里面只需定義可以進(jìn)行的 RPC 調(diào)用以及它們采用的參數(shù)。根據(jù)這份說明文件,服務(wù)器和客戶端代碼就會自動生成。由此產(chǎn)生的代碼運行快速,網(wǎng)絡(luò)占用空間小,易于使用。
根據(jù)相同的說明文件,甚至可以生成很多不同編程語言的客戶端代碼,比如 C++、Java、Python 和 Ruby。因此,內(nèi)部流量不再有模糊的 REST 終端,因為你不必每次都寫一遍幾乎相同的客戶端和服務(wù)器端代碼。
使用 Golang 的缺點
缺點 1 – 缺少框架
Go 沒有一個具有代表性的框架,像 Ruby 有 Rails、Python 有 Django 或者 PHP 有 Laravel。在 Go 社區(qū)中,這是一個爭論激烈的話題,很多人提倡不應(yīng)該一開始就使用框架。某些使用案例,我完全同意這樣的觀點。然而,如果只是想要創(chuàng)建一個增刪改查的接口,使用 Django/DJRF、Rails Laravel 或者? Phoenix ?是一個更好的選擇。
缺點 2 – 錯誤處理機制
Go 處理錯誤的過程如下:簡單地從函數(shù)中返回錯誤,并且期望你調(diào)用代碼來處理該錯誤(或者將它返回到調(diào)用堆棧之上)。雖然這種方法有效,但很容易丟失出錯的范圍,導(dǎo)致無法為用戶提供有意義的錯誤。 ? errors? 包通過允許你為錯誤添加上下文和堆棧來跟蹤問題。
另一個問題是很容易忘記處理錯誤。像 errcheck 和 megacheck 這樣的靜態(tài)分析工具可以方便地規(guī)避這些錯誤。
雖然這些解決方法很有效,但總感覺哪里不太對勁。你肯定希望語言本身就支持一定的錯誤處理的功能。
缺點 3 – 包管理
Go 的包管理肯定不是完美的。默認(rèn)情況下,它沒有辦法指定依賴項的特定版本,也沒有辦法創(chuàng)建 可重現(xiàn)的構(gòu)建 。Python、Node 和 Ruby 都有更好的包管理系統(tǒng)。然而,通過合適的工具,Go 的包管理表現(xiàn)的很好。
你可以使用? Dep ?來管理依賴項以允許指定和固定版本。除此之外,我們還提供了一個叫做 VirtualGo ?的開源工具,它可以更輕松地處理用 Go 編寫的多個項目。
Python vs Go
我們之前做過一個有趣的實驗:選擇我們的? ranked feed ?功能,用 Go 語言將它重寫。簡單看下這個排名方法的例子:
為了使這個排名方法成立,Python 和 Go 都需要遵循下面的事:
-
解析表達(dá)式以便打分。在這種情況下,我們希望將“simple_gauss(time)* popular”這個字符串轉(zhuǎn)換成一個函數(shù):函數(shù)以一個活動作為輸入,然后返回一個分?jǐn)?shù)作為輸出。
-
基于 JSON 配置創(chuàng)建偏函數(shù)。比如:我們想要“simple_gauss”調(diào)用“decay_gauss”,并傳遞規(guī)模為 5 天,偏差為 1 天,衰減系數(shù)為 0.3 這些參數(shù)。
-
解析“默認(rèn)值”配置,以便在活動中出現(xiàn)未定義字段時可以進(jìn)行回退。
-
使用步驟 1 中的函數(shù)給流中的所有活動打分。
開發(fā) Python 版本的排名代碼大約需要 3 天。這包括編寫代碼、單元測試和文檔書寫。接下來,我們花了大約 2 周時間來優(yōu)化代碼。其中一個優(yōu)化是將評分表達(dá)式(simple_gauss(time)*popularity)轉(zhuǎn)換為抽象 語法樹 。我們還實現(xiàn)了緩存邏輯,該邏輯在將來的某些時間預(yù)先計算得分。
相比之下,開發(fā)該代碼的 Go 版本大約需要 4 天時間。性能不需要任何進(jìn)一步的優(yōu)化。因此,雖然 Python 初始的開發(fā)速度更快些,但如果基于 Go 的版本,最終,我們團(tuán)隊的工作量大大減少。作為額外的優(yōu)點,Go 代碼的執(zhí)行速度比我們高度優(yōu)化的 Python 代碼快大約 40 倍。
這只是一個簡單的說明性能提升的例子:僅僅用 Go 替換 Python。當(dāng)然,它們沒有可比性:
-
排名代碼是我第一個用 Go 寫的項目
-
Go 代碼是在 Python 代碼之后構(gòu)建的,因此我可以更好地理解用例
-
用于表達(dá)式解析的 Go 庫是非常高質(zhì)量的
具體細(xì)節(jié)需要視情況而定。和 Python 相比,用 Go 構(gòu)建一些我們系統(tǒng)中其他的組件,需要花費更多的時間。一般情況下,我們發(fā)現(xiàn)用 Go 開發(fā)代碼更費些勁。然而,在性能方面,我們花費更少的時間來優(yōu)化代碼。
Elixir vs Go
我們評估了另一種語言: Elixir 。Elixir 構(gòu)建于 Erlang 虛擬機之上。這是一種引人入勝的語言。我們考慮過它,因為我們團(tuán)隊成員中有一個人擁有大量的 Erlang 經(jīng)驗。
對于我們的用例,我們注意到 Go 的原始性能要好得多。Go 和 Elixir 都可以很好地為數(shù)千個并發(fā)請求提供服務(wù)。但是,如果你查看單個請求的性能,Go 對我們的用例來說要快得多。生態(tài)系統(tǒng)是另一個我們選擇 Go 而不選擇 Elixir 的原因。對于我們需要的組件,Go 有更多成熟的庫,而在許多情況下,Elixir 庫還沒有為生產(chǎn)使用做好準(zhǔn)備。培訓(xùn)/招聘用 Elixir 的開發(fā)人員也更難。
這些原因讓我們選擇了 Go。雖然 Elixir 的 Phoenix 框架看起來非常棒,并且也絕對值得一看。
總結(jié)
Go 是一種非常高效的語言,且對并發(fā)性有很大的支持。它的性能幾乎與 C++ 和 Java 等語言一樣快。雖然和 Python 或 Ruby 相比,使用 Go 構(gòu)建內(nèi)容需要花費更多時間,但你將節(jié)省大量時間來優(yōu)化代碼。
我們在? Stream ?有一個小型的開發(fā)團(tuán)隊,為超過2億的終端用戶提供信息流。擁有一個偉大的生態(tài)系統(tǒng)、新開發(fā)人員容易上手、快速的性能、對并發(fā)性的可靠支持以及高效的編程環(huán)境,使 Go 成為一個很好的選擇。
Stream 仍然利用 Python 為我們的控制面板、站點和機器學(xué)習(xí)提供 個性化的流 。我們不會很快告別 Python,但是所有性能密集型代碼都將用 Go 編寫。
如果你想要了解更多有關(guān) Go,查看下面列出的博客文章。
關(guān)于切換到 Golang 的更多閱讀
-
https://movio.co/en/blog/migrate-Scala-to-Go/
-
https://hackernoon.com/why-i-love-golang-90085898b4f7
-
https://sendgrid.com/blog/convince-company-go-golang/
-
https://dave.cheney.net/2017/03/20/why-go
?
學(xué)習(xí) Go
-
https://learnxinyminutes.com/docs/go/
-
https://tour.golang.org/
-
http://howistart.org/posts/go/1/
-
https://getstream.io/blog/building-a-performant-api-using-go-and-cassandra/
-
https://www.amazon.com/gp/product/0134190440
推薦閱讀
(點擊標(biāo)題可跳轉(zhuǎn)閱讀)
如何客觀評價 Go 語言?
Go 語言 10 歲了!這里有你不知道的 Go 的成長歷程
10 分鐘快速入門 Python3
關(guān)注「程序員的那些事」加星標(biāo),不錯過圈內(nèi)事
好文章,我 在看 ??
更多文章、技術(shù)交流、商務(wù)合作、聯(lián)系博主
微信掃碼或搜索:z360901061

微信掃一掃加我為好友
QQ號聯(lián)系: 360901061
您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧,狠狠點擊下面給點支持吧,站長非常感激您!手機微信長按不能支付解決辦法:請將微信支付二維碼保存到相冊,切換到微信,然后點擊微信右上角掃一掃功能,選擇支付二維碼完成支付。
【本文對您有幫助就好】元
