隸屬于字節跳動公司,基于數據挖掘的推薦引擎產品,開放性內容創作與分發平臺,以個性化推薦著稱的聚合類資訊應用
今日(ri)頭(tou)條是北京字節跳(tiao)動(dong)科技有限公(gong)司開發(fa)的(de)一(yi)(yi)款基于(yu)數據挖掘的(de)引擎產品,為(wei)用(yong)戶信(xin)(xin)息(xi),提供連接人與信(xin)(xin)息(xi)的(de)服(fu)務的(de)產品。由張(zhang)一(yi)(yi)鳴(ming)于(yu)2012年3月創建,2012年8月發(fa)布(bu)版本(ben)。
基于個(ge)性化引(yin)擎技術,根據每個(ge)用(yong)戶的興趣、位置等多個(ge)維度進行(xing)個(ge)性化,內容不僅包(bao)括狹義上的新聞,還包(bao)括音樂、電影、游戲、購物等資訊。
根據(ju)其社(she)交(jiao)行(xing)(xing)為(wei)、閱讀行(xing)(xing)為(wei)、地理位置(zhi)、職業(ye)、年(nian)齡等挖掘(jue)出興趣。通過(guo)社(she)交(jiao)行(xing)(xing)為(wei)分析,5秒鐘計算出用(yong)(yong)戶興趣;通過(guo)用(yong)(yong)戶行(xing)(xing)為(wei)分析,用(yong)(yong)戶每次動作后,10秒內(nei)更(geng)新(xin)用(yong)(yong)戶模型。
對(dui)每(mei)條信(xin)息提取幾(ji)十個到(dao)幾(ji)百個高(gao)維特(te)征(zheng),并進行降(jiang)維、相似計算、聚類(lei)等計算去(qu)除重復信(xin)息;對(dui)信(xin)息進行機器分類(lei)、摘(zhai)要(yao)抽取,LDA主題分析、信(xin)息質量(liang)識別等處理(li)。
根據(ju)人(ren)的(de)特征、環境特征、文(wen)章(zhang)(zhang)特征三(san)者(zhe)的(de)匹配(pei)程度進行。0.1秒(miao)內計算結果,3秒(miao)完成文(wen)章(zhang)(zhang)提(ti)取、挖(wa)掘、消重、分類,5秒(miao)計算出新(xin)用(yong)戶興趣分配(pei),10秒(miao)內更新(xin)用(yong)戶模型。