今年,商家通過(guò)阿里媽媽推廣投放明顯感覺(jué)到各類(lèi)營(yíng)銷(xiāo)產(chǎn)品、營(yíng)銷(xiāo)工具變得自動(dòng)化,不但操作更簡(jiǎn)單,而且效果也有明顯提升。這背后的原理是什么,可能沒(méi)有太多人了解。但無(wú)疑,今年阿里媽媽智能化的戰略方向已開(kāi)始顯效。
人工智能究竟能給阿里媽媽的營(yíng)銷(xiāo)帶來(lái)怎樣的升級?人工智能又是如何讓推廣投放更有效的?阿里媽媽高級算法專(zhuān)家懷人將從算法和模型的角度介紹,人工智能的想象力在哪里?人工智能又是如何實(shí)現的?
以下為懷人分享,經(jīng)《天下網(wǎng)商》整理而成。
大規模稀疏結構化深度學(xué)習
阿里媽媽會(huì )捕捉用戶(hù)在全網(wǎng)的實(shí)時(shí)行為,比如在淘寶看過(guò)什么,收藏過(guò)什么,哪些東西看了很多次但猶豫不決沒(méi)有買(mǎi)等等?;谶@些信息,阿里媽媽會(huì )進(jìn)行建模,從而刻劃用戶(hù)的興趣,基于興趣再對每一次實(shí)時(shí)推廣投放進(jìn)行判斷,確定點(diǎn)擊率預估。
點(diǎn)擊率預估通俗來(lái)講就是推廣被用戶(hù)點(diǎn)擊的可能性,即CTR(Click-Through Rate Prediction),這對營(yíng)銷(xiāo)來(lái)講很重要,它不僅影響了每個(gè)商家每次投放推廣的計費,也影響平臺對流量的分配。
CTR預估越精確,推廣活動(dòng)更有針對性,用戶(hù)點(diǎn)擊推廣的可能性就越大。問(wèn)題來(lái)了,如何提高點(diǎn)擊率預估呢?這里面相當有講究。
在阿里媽媽的推廣投放后臺,每天接受的推廣預估請求超過(guò)千億次,目標用戶(hù)同樣是數以?xún)|計,這些數字背后反映出來(lái)的是超大規模+高度非線(xiàn)性的東西。人工肯定辦不到匹配,只有技術(shù)去解決。
阿里媽媽是怎么做的呢?從整個(gè)技術(shù)分析來(lái)看,阿里媽媽發(fā)現數據其實(shí)有兩個(gè)很重要的特點(diǎn),第一個(gè)特點(diǎn)叫稀疏性,第二個(gè)特點(diǎn)是結構化。這樣兩個(gè)特性,是推廣主所看不到的,但阿里媽媽在技術(shù)上需要解決的重要問(wèn)題。
于稀疏性而言,每天阿里媽媽要給數據的用戶(hù)實(shí)時(shí)預估每天看了推廣的點(diǎn)擊率,那怎么描述推廣點(diǎn)擊率呢?用特征來(lái)描述。如用戶(hù)是什么用戶(hù),推廣是什么推廣。實(shí)際的模型里,會(huì )有超過(guò)10億的特征,某些場(chǎng)景下甚至達到百億級量級的特征。同時(shí),阿里媽媽用來(lái)預測的樣本會(huì )達到千億量級。所以,稀疏性是這個(gè)一個(gè)問(wèn)題的最大特性。
結構化就非常好理解,因為每天每個(gè)用戶(hù)登陸淘寶的時(shí)候,會(huì )看到不止一條推廣,會(huì )看到很多條推廣。但是對于所謂模型看到用戶(hù)來(lái)說(shuō),用戶(hù)是同一個(gè)用戶(hù)。假設說(shuō)有兩個(gè)用戶(hù),用戶(hù)1和用戶(hù)2,用戶(hù)1可以看到三條推廣,用戶(hù)2看到兩條推廣。阿里媽媽把他們組織起來(lái)成為樣本,按照這個(gè)方式組織的時(shí)候,所有的樣本每天訓練一個(gè)模型,所需要的樣本需要高達100或者1000的TB,這是非??植赖牧考?。
通過(guò)結構化壓縮了之后可以做什么事情呢?知道用戶(hù)1是同個(gè)用戶(hù)每天看到三條推廣,只要記錄一次,說(shuō)用戶(hù)1以及后面看到的推廣是A1、A2、A3就可以了,這樣使得整個(gè)樣本的存儲量壓到1—2個(gè)數量級以下,現在的模型都可以在幾個(gè)TB到10個(gè)TB這個(gè)量級,輕松完成訓練。
智能營(yíng)銷(xiāo)最大的困難在模型
數據很容易理解,阿里媽媽有全域的數據,淘寶天貓購物數據、社交數據,位置數據等等。數據只是一個(gè)人的材料,把材料加工、分析出來(lái),才能形成用戶(hù)特征,這個(gè)加工過(guò)程要靠數據算法完成。
模型挑戰
在業(yè)界,如谷歌、臉譜、騰訊、百度等都會(huì )有一些解法,阿里媽媽稱(chēng)之為傳統解法,線(xiàn)性模型+人工智能工程。什么叫線(xiàn)性模型+人工特征工程呢?因為數據特別大,在技術(shù)有限的情況下只能用線(xiàn)性模型做預測,但用戶(hù)點(diǎn)不點(diǎn)推廣是高度非線(xiàn)性的,跟用戶(hù)看到的場(chǎng)景,看到推廣長(cháng)什么樣,跟當時(shí)的心情和天氣都很有關(guān)系,線(xiàn)性模型又無(wú)法做到。于是就把人得的經(jīng)驗放進(jìn)去,形成了人+機器做的解決方案。問(wèn)題是,這不僅費力,而且不可能把所有解決方案做出來(lái),結構也非常龐大,迭代起來(lái)比較慢。
阿里媽媽的解法更加優(yōu)雅和智能,在特征方面沒(méi)有引入人的規則去設計,而是把用戶(hù)的原始特征,如歷史上表現出來(lái)的行為和興趣,以及推廣主的推廣體系類(lèi)目是什么,兩者提取出來(lái)。然后把所有任務(wù)交給模型,讓模型從大量的數據里面去自動(dòng)挖掘出來(lái),什么樣的組合模式是最有效的,什么樣的組合模式是最有可能點(diǎn)擊。這是最重要一個(gè)部分,也是整個(gè)人工智能背后最核心、最難的一點(diǎn)。
同http://www.114px.com/course/524180.html
時(shí)整個(gè)數據也充分利用了結構化特點(diǎn),一方面大幅度降低存儲,同時(shí)使得整個(gè)計算可以每天完成一次模型更新,甚至幾小時(shí)完成一次模型更新。
人工智能的能力
在2012年,阿里媽媽就自主研發(fā),并且提出了一個(gè)全新的模型,叫分片線(xiàn)性模型。這個(gè)模型想要解決的事情很簡(jiǎn)單,既然有這么大量的數據,且數據背后的規律足夠非線(xiàn)性,那么有沒(méi)有方法解決得更好一點(diǎn)呢?
當然是可以的,舉一個(gè)直觀(guān)的例子,比如說(shuō)想去判定一下,一個(gè)登陸淘寶頁(yè)面的用戶(hù),比如我是男還是女,有人問(wèn),我明明是個(gè)男性用戶(hù),為什么要判定男性呢,很可能我最近一段時(shí)間是幫太太在買(mǎi)東西,或者我太太用了我的帳號登陸淘寶買(mǎi)東西,因此需要根據行為判斷是男性還是女性用戶(hù),或者購物意圖是男性還是女性。
從2014年以后,我們陸陸續續會(huì )有一些升級版本,第一個(gè)版本,當我們意識到這個(gè)數據越來(lái)越大的時(shí)候,剛才一直說(shuō)多結構化特性,做了第一步優(yōu)化,要看這個(gè)用戶(hù)的購買(mǎi)概率、轉化概率、購買(mǎi)概率。第一部分我去描述用戶(hù),第二部分描述推廣。先把用戶(hù)從10維空間投影到20維空間去,在這個(gè)空間里面我計算他們之間的所謂相關(guān)性和點(diǎn)擊率的概率,這是相當容易的事情。所以結構化這里面,除了大幅度降低整個(gè)計算,另一方面也是引入了人類(lèi)一部分專(zhuān)家知識概念在里面,幫助大家學(xué)習。這是第一個(gè),引入了所謂結構正則這樣一個(gè)概念。
第二點(diǎn)引入了模型級聯(lián)。一個(gè)模型可能不一定做得好,我們讓多個(gè)模型進(jìn)行工作協(xié)同。所謂模型級聯(lián),通過(guò)多個(gè)模型的結果匯總起來(lái)變得更好。如果關(guān)心技術(shù)發(fā)展的同學(xué),尤其是關(guān)心整個(gè)營(yíng)銷(xiāo)和推廣發(fā)展的同學(xué),可以知道,在今年年初的時(shí)候,谷歌大概提出了一套叫外聯(lián)的Deep Learing這樣一套方法,跟我們幾乎差不多,只不過(guò)我們是兩年以前就提出來(lái)了。
剛才是講了整個(gè)比較數學(xué)形式化的算法是什么樣子,在生態(tài)環(huán)境里面,實(shí)現一套非常大規模的實(shí)踐來(lái)支撐這樣的模型,達到每天甚至每幾個(gè)小時(shí)完成一次訓練的能力。以定向推廣主要的模型來(lái)看,我們用了幾億的特征,幾十億的參數,幾百億的樣本,在線(xiàn)一百多臺機服務(wù)器大概在幾個(gè)小時(shí)就完成模型更新,從而使得預測和迭代會(huì )更加準確。