隸屬于字節跳動公司,基于數據挖掘的推薦引擎產品,開放性內容創作與分發平臺,以個性化推薦著稱的聚合類資訊應用
今日(ri)頭(tou)條是北京字節(jie)跳(tiao)動科技有限(xian)公司(si)開發(fa)的(de)一款基于數據挖掘的(de)引擎產品(pin)(pin),為用戶信息(xi),提供連接(jie)人與信息(xi)的(de)服務(wu)的(de)產品(pin)(pin)。由張一鳴于2012年3月(yue)創(chuang)建,2012年8月(yue)發(fa)布版本。
基(ji)于個(ge)性化引擎技術,根據每個(ge)用戶(hu)的興趣、位置等多(duo)個(ge)維度進(jin)行個(ge)性化,內容不僅包括(kuo)狹義上的新聞,還包括(kuo)音樂(le)、電影、游(you)戲、購物等資訊。
根據其(qi)社交行(xing)(xing)為、閱讀行(xing)(xing)為、地理位(wei)置、職業、年齡等(deng)挖掘出興趣。通(tong)過社交行(xing)(xing)為分析,5秒(miao)鐘(zhong)計算出用(yong)戶興趣;通(tong)過用(yong)戶行(xing)(xing)為分析,用(yong)戶每次動作后,10秒(miao)內更新用(yong)戶模型。
對(dui)每(mei)條信(xin)息提取幾十個到幾百個高維(wei)特(te)征(zheng),并進(jin)(jin)行降維(wei)、相似計(ji)算、聚類等(deng)計(ji)算去除重復信(xin)息;對(dui)信(xin)息進(jin)(jin)行機器分類、摘要(yao)抽取,LDA主題分析、信(xin)息質量識別等(deng)處理(li)。
根據(ju)人的特(te)征(zheng)、環(huan)境特(te)征(zheng)、文章特(te)征(zheng)三者的匹配(pei)程度進行。0.1秒(miao)內計算結果,3秒(miao)完成文章提取(qu)、挖(wa)掘、消重、分類(lei),5秒(miao)計算出新用戶(hu)興趣分配(pei),10秒(miao)內更新用戶(hu)模型(xing)。