一夜未拔H圆房~h_国产乱人对白_久久久久国色AV免费看_一二三四社区在线中文视频_丰满的熟妇岳中文字幕_97久久久亚洲综合久久_免费的很黄很污的视频_国产精品久久久久久人妻_人妻aⅴ中文字幕_

廣告智能定向的lookalike技術(shù)。不懂就懂。

當(dāng)前位置: 首頁 > 常見問題

百都網(wǎng)絡(luò)小編 發(fā)布于 年月日 評(píng)論() 閱讀()

什么叫長得像?

簡(jiǎn)單來說:廣告給定一個(gè)優(yōu)質(zhì)的種子用戶,系統(tǒng)需要自動(dòng)找到相似的人放進(jìn)去。以栗子為例。如果廣告提供的種子人群是有一定信用卡的客戶,那么相似人群在某些方面與種子人群相似。如果類似的人沒有卡,那么他們開卡的可能性很大。

為什么要長得像?

存在的問題:人群標(biāo)簽組合無法全面覆蓋,人群標(biāo)簽挖掘成本過高,無法支持人群分級(jí)定價(jià)等。lookalike可以簡(jiǎn)單、直接、漂亮的解決這些問題。

。怎么看起來?

().基于用戶特征的矩陣分解方法

通過分解用戶特征矩陣,我們可以得到用戶主題矩陣,如下圖所示:

用戶U與種子S的相似度定義如下(其中U為用戶的話題分布,Si為種子用戶I的話題分布):

種子用戶的平均話題分布在哪里。因此,遍歷所有人,計(jì)算每個(gè)用戶與種子集的相似度,取排名較高的一個(gè)作為擴(kuò)展種群。

().基于監(jiān)督LR模型

我們把種子用戶作為正例,隨機(jī)用戶作為下采樣后的負(fù)例,每個(gè)種子單獨(dú)訓(xùn)練一個(gè)LR模型。然后我們用這個(gè)模型來預(yù)測(cè)所有用戶。我們認(rèn)為預(yù)測(cè)值越大,與種子用戶越相似。用戶和種子S之間的相似度定義如下(其中U是用戶特征向量,W和B是LR模型的參數(shù)):

遍歷整個(gè)人群,計(jì)算所有用戶的相似度,取top n擴(kuò)大人群。在工程實(shí)現(xiàn)中,需要倒排索引。但隨著廣告 master的增多,系統(tǒng)的弊端也逐漸暴露出來:倒排索引占用的空間不斷上升,導(dǎo)致索引更新周期過長,每個(gè)用戶的lookalike ID都要根據(jù)相似度進(jìn)行截?cái)?,這將加劇馬太效應(yīng),對(duì)廣告 master拓展新用戶非常不利。與此同時(shí),用于離線模型訓(xùn)練和預(yù)測(cè)的機(jī)器數(shù)量也在增加。

().在線相似模型

在()的基礎(chǔ)上,摒棄了原來每個(gè)種子單一模型的思路,所有種子用戶聯(lián)合建模。具體網(wǎng)絡(luò)結(jié)構(gòu)如下:

廣告在線召回的過程是:首先從前排索引中獲取用戶嵌入,然后將用戶嵌入向量與looklike嵌入矩陣相乘得到用戶與每個(gè)廣告的相似度,然后根據(jù)每個(gè)廣告擴(kuò)展倍數(shù)的閾值截?cái)嗖㈦S機(jī)保留N個(gè)lookalike ID,將它們對(duì)應(yīng)的/[/k6]

摘要

本文主要給出了廣告智能定向中相似技術(shù)的定義、需要解決的問題以及具體的工程實(shí)現(xiàn)。

來源:計(jì)算廣告

微海報(bào)
免責(zé)聲明:本網(wǎng)站內(nèi)容來源網(wǎng)絡(luò),轉(zhuǎn)載是出于傳遞更多信息之目的,并不意味贊成其觀點(diǎn)或證實(shí)其內(nèi)容真實(shí)性。轉(zhuǎn)載稿涉及版權(quán)等問題,請(qǐng)立即聯(lián)系網(wǎng)站編輯,我們會(huì)予以更改或刪除相關(guān)文章,保證您的權(quán)利。

作者:徐州百都網(wǎng)絡(luò) | 來源: | 發(fā)布于:2022-03-22 11:05:30