對話 CTO〡聽 GrowingIO CTO 葉玎玎講無埋點數據分析的業務理想

摘要

「對話 CTO」是極客公園的一檔最新專欄,以技術人的視角聊聊研發管理者的發展和成長。

我們特別邀請到了 ONES 的創始人&CEO 王穎奇作為特邀訪談者。王穎奇曾參與金山軟件 WPS、金山毒霸等大型軟件的核心開發工作;2011 年創立了正點科技,旗下產品正點鬧鐘、正點日歷在全球用戶過億;2014 年,王穎奇在知名美元基金晨興資本任 EIR,并以個人身份參與十余家公司的管理咨詢工作;2015 年,王穎奇創立 ONES,致力于提供企業級研發管理解決方案。


創立之初,GrowingIO 以無埋點技術切入市場。為了讓數據平臺可以幫助客戶做深度的用戶轉化、留存分析,GrowingIO 花了三年多時間去打磨產品。

正如 GrowingIO 聯合創始人&CTO 葉玎玎所說,真正去做一個 SDK 來采數據其實很容易,但是要做 SaaS 服務,要針對不同用戶的不同寫法去做通用型的開發,還要考慮應用開發本身的一些易變化特性等等,這些都需要很強的技術支持。

葉玎玎曾在網易杭州研究院從事工程數據庫相關工作,2009 年接觸 SaaS,2015 年到 GrowingIO 負責核心產品研發。

本期對話 CTO,我們請到了 GrowingIO 聯合創始人&CTO 葉玎玎。關于 GrowingIO 產品如何支持業務發展,以及數據分析產品的歷史演進,葉玎玎談了談自己的看法。


產品做給業務端

穎奇:很高興 GrowingIO 的 CTO 葉玎玎同學能接受我們的訪談,我覺得可以先大概講一下 GrowingIO 在技術方面的一些特長。

葉玎玎:OK,如果要研究 GrowingIO 的技術,一定要先了解它的形態。GrowingIO 是一家云的公司,做 SaaS 的公司,所以我們所有的客戶數據的采集都會在云上。

目前我們第一個技術特點就是外界所熟知的無埋點,自動去采集用戶從打開應用或者打開網站到離開的所有行為數據,這個行為數據通過可視化的定義方式去展現。其實這會涉及到你如何去理解客戶端的實現,無論是對瀏覽器本身的實現,還是對于 iOS 或者安卓操作系統的實現,這里都需要很多黑科技的東西。去了解它的實現后才能更好地在上層去研究怎么做無埋點的邏輯。所以這個是我們在過去三年花了很多時間去研究的東西。

真正去做一個 SDK 來采這些數據其實很容易,但是要做 SaaS 服務,如何針對不同用戶的不同寫法去做這個通用型的開發,并且是插件,包括這里面還要考慮如何去應對應用開發本身的一些易變化特性等等,這里需要做很多東西。

所以我們在這個過程中自己也用了很多方法,通過算法、模型、機器學習等方式,考慮怎么去讓前端采集到的數據跟后端用戶的數據邏輯之間更好的匹配,所以這個就是外界所熟知的 GrowingIO 的無埋點。但本質上另外一個挑戰在于,當有這么大數據量進來的時候,我怎么去處理數據?我相信 GrowingIO 數據量在國內應該算蠻大的。

穎奇:因為無埋點本身是沒有篩選的來進行數據采集,所以肯定會有很大的數據量。

葉玎玎:一方面是這個,另外一方面也在我們數據系統本身。舉個例子,我們每天可能有個兩三千億條的消息,我相信大部分公司都達不到這個量,這是第一點。第二點是,GrowingIO 有一些幾個億 DAU 的客戶,單體客戶幾個億,再加上云端有這么多其他的客戶,怎么更好地處理、存儲、查詢,都是一個很大的挑戰。

穎奇:那對比市場其他競品,在數據量這方面,GrowingIO 有沒有一些技術上的先進性?

葉玎玎:是有的。 GrowingIO 目前有一個很多客戶認為很方便的功能——指標維度的多維交叉,實現任意去拖拽指標維度,瞬間出圖。舉個例子,你要進行基于人的指標維度任意交叉的時候,GrowingIO 是可以快速出結果的。具備這些屬性的用戶,然后做過哪些事情的用戶,在歷史上的任何一個時間點,能立刻知道這群人,立刻計算出來他們有誰。這個東西在之前的數據系統里面相對來說是比較少的。大部分數據系統,無論是 T+1 還是實時,還是一個小時這種,它都是基于事件的處理。

穎奇:這就是說分析過程上你們應該是做了更多事情的。

葉玎玎:我覺得是在用戶畫像本身,就是我們如何去更好的找到一批用戶。然后這個過程包括,如果你找一個其他的用戶分析系統,你想要看留存,或者說要去做轉化路徑,要找到哪些優化點,那核心其實就在于對于用戶之間群體的對比。

對單一人群去做分析其實很容易,但是一旦要將用戶之間對比各種東西,然后又要達到非常快的響應效果,這個其實是其他競品很難做到的。這里最核心的差別是說,因為我們一直是做給業務端的,就是產品運營等等,所以我們的要求就是他們能非常簡單的從我們的分析工具里面去得到結果。

穎奇:所以 GrowingIO 在無埋點等技術上有哪些關鍵特點呢?

葉玎玎:無埋點肯定是我們一個關鍵特點,因為使用其他產品的話,你可能需要自己去梳理所有東西,我們是讓那個業務直接可以自己去做。然后第二點是基于這個能力上來說,本身我們會演變出來新的一層能力,我們能快速做實驗。比如我現在想要一個東西,這個時候我不是找研發去幫我做打點,而是直接可以看到結果。我當時自己為什么覺得 GrowingIO 很值得做,就是因為我之前用其他數據分析工具時,陷入到數據采集-使用、采集-使用的整個不停的輪回之中,這個過程中,大量時間其實被浪費在前端的采集和處理這一塊,真正進入到核心的產品邏輯的迭代和產品的改進的時間是比較少的,而 GrowingIO 就不會有這樣的問題。


高效能遠程工作

穎奇:我了解到您之前是有做過遠程團隊的工作,您覺得遠程工作這樣的方法在中國現在是不是真正能夠去很好的來實行?

葉玎玎:我個人判斷相對是比較難的,它必須變成兩種模式。遠程工作要么就是全員遠程,這個事情反而是可以做的。因為全員遠程意味著大家每個人都接受了,我必須要為了我們的效率提高付出額外的努力,然后為了降低我的溝通成本,我要做哪些事情。我覺得這個是非常關鍵的。但這里面如果存在大部分人不遠程,某一兩個人、兩三個人遠程的情況的話,這個就會變得非常尷尬。因為很多時候最高效的溝通肯定是面對面溝通,然后在面對面溝通過程中,有一個人如果在遠程的話,那很多時候他其實不知道其他人在聊什么,因為除了語音、視頻以外,還有一些肢體語言等等,然后聊著聊著很容易的一點就是大家把遠程的人忽略掉了。

所以我個人的建議是如果全員遠程,這個是 OK 的。但是這種模式是否能演變出來非常快地去響應變化,這是有一些潛在風險的。所以這個意味著整個團隊的認知需要達到一定的高度,然后整個團隊為了達到更高的效率,更好的溝通,愿意付出什么。如果你去評估這兩點之后,覺得這是自己可承受的風險,那可以選擇。如果對一個創業公司的話,我覺得這個可能是比較難的。但是如果對于一些看著需求做事的公司來講可能是沒有任何問題的,因為這個過程中無非是我怎么把項目管理做的更好。或者還有很多公司選擇了另外一種模式,其實不算遠程,就是一個多地的辦公室。

穎奇:前一兩年的時候,因為一些效率工具的出現,大家都說可能未來是遠程工作的時代,人會越來越依賴工具。但是現在我們越來越覺得,真正工具剛需的來源不是因為遠程工作,面對面的時候我們也是需要工具的。

葉玎玎:我覺得工具的核心不是為了解決遠程的問題,而是人是在流動的,是不一定都在一起的。比如風車到最后服務的團隊可能是在一個 office,但是因為大家都出去了,所以在這個過程中怎么去分配工作,怎么去溝通等等,(工具本身)還是解決類似這類問題。


圍繞用戶做分析

穎奇:您怎么看待中國數據分析行業的過去、現在、未來?包括過去一代二代的數據分析產品,現在的數據產品,可以來分享一下您的看法。

葉玎玎:我覺得最早的應該不叫分析工具,叫統計工具。像 CNZZ 也好,像百度統計也好,做流量的一些統計,核心是在流量層面。

然后再往下,大家會說光是統計還不行,要進入分析,要了解一下我的用戶整個情況是怎樣的,那這個時候會演變出來第二代的數據分析產品,就是基于事件的。因為每個事件都會對應到人,既有事件的模型又有用戶的模型,這個用戶到底做了哪些事情,然后去篩選用戶,這個是第二個階段。

目前大部分的工具應該也在這一層,包括在 2010 年左右出來的友盟、Talking Data 為代表的一系列工具,當時它們承載的很多可能就是流量統計的功能,但是它們也有事件模型。然后再到下一代,從事件本身到開始運營用戶的生命周期了,就是到用戶這一層。

穎奇:到用戶這一層了,就是會把它組合起來看。

葉玎玎:是的,我通過事件去更具體的去看一個用戶,核心圍繞著用戶來做分析,不是核心圍繞著事件來分析。所以我們所有的人的模型在整個數據分析里面就會成為第一個關注點,這個是很重要的。然后再往下的東西也跟這個時代相關,因為現在有很多機器學習,你要去做個性化,這個過程中,你怎么去更好的基于機器學習來做東西,無論是從各種推薦引擎,或者說各種的計算模型,這樣演變出來比如做 alert(提醒)、anomaly detection(異常檢測),那這些又會進入到下一個階段。但是這里的所有都是基于你的數據層是干凈的。數據這一層要有一個好的基礎,不然想著跳到下面步驟的話是很難的。

穎奇:在您剛才講的用戶精準個性化的一些業務上,我們現在看到的這些數據平臺更多是幫忙分析,你們會有一天能夠真正走到業務中去嗎?比如說可能會提供一些數據的接口,或者提供一些非常精準的畫像,每一個客戶最終都會跟真正業務端的服務對應起來。

葉玎玎:其實我們現在就在做了,我剛才提到,理論上我們的客戶主要打的還是業務端,比如產品、運營,他們用我們系統就在做這件事情,真正走到業務里面去,他們在我們系統上去定義各種東西。舉個例子,我們可以讓系統找出來,比如昨天注冊了,看了 Demo,但是沒有繼續去做創建項目的人。這群用戶篩出來以后,針對這些用戶可以去做觸達。然后比如在做哪些事情的過程中,你到底要給他一個什么樣的動作,這些東西是我們在幫我們客戶做的,所以它其實是非常業務化的。

穎奇:能否給大家介紹下您的個人職業經歷?

葉玎玎:我之前在網易杭州研究院工程數據庫相關的組里面工作了一年半,2015 年之后在做 GrowingIO。中間有幾個節點,第一個是我最早遠程是 Freelancer,那時候更多是幫美國的一些創業者去做 0 到 1。然后 09 年到 12 年,我從自己研發的這個點更加往外擴出去,負責產品研發,做企業社交這一塊。但是我是從 09 年開始真正去接觸 SaaS 這個行業,然后接觸 to B 這個方向。

09 年的時候,我們非常看重怎么去做實時 Web,因為它在 09 年的時候其實沒有太好的解決方案,但那個時候我們為了自己做的東西,就做了很多技術上的突破。然后到做協作工具也是,就是怎么把用戶體驗和當時實施的技術更好的打包成一個方案表給到用戶。然后到 14 年底開始做無埋點,也是在當時非常新的一個東西。

12 年底到 13 年又做了另外一個蠻好玩的事情,就是 Teahour,一個技術播客。我覺得當時 Teahour 對很多剛工作一兩年的或者在剛畢業要找工作的那群人給了很多方向性的指導。

穎奇:您之前一直在做程序員,也一直在做自己的項目,那最終變成一個這么大公司的 CTO,中間有什么特別重要的一些轉變,或者您覺得比較關鍵的時間點或者里程碑,經歷了之后就變成一個 CTO 

葉玎玎:因為我從 06 年畢業的時候就開始創業,無非是一開始創業相對來說團隊的人數可能比較少,然后會經歷一個團隊從小變大的過程。我會非常關心用戶到底是怎么想的,對我來說,為什么我對數據分析很感興趣的一點,在于我會嘗試通過這個去理解到底用戶在用我的產品的時候他心里的想法。所以我覺得很核心一點是,我自己是在思考到底這個業務和產品應該怎么來做的,所以我覺得我跟大部分的技術不太一樣,我會很容易在用這樣的視角去思考。

穎奇:非常棒。最后可不可以推薦一些您最近看的認為比較好的書給大家。

葉玎玎:我看的書會比較更加偏意識形態一點,更加偏管理一點。我最近一直在看《賦能》,《賦能》這本書核心講在現在這個時代,你到底應該有什么心態,應該怎么去更好的發展等等。

穎奇:好的,今天有很多收獲,非常感謝。


本文作者:王穎奇

聯系方式:[email protected]



最新文章

極客公園

用極客視角,追蹤你最不可錯過的科技圈。

極客之選

新鮮、有趣的硬件產品,第一時間為你呈現。

頂樓

關注前沿科技,發表最具科技的商業洞見。

彩票软件破解