隸屬于字節跳動公司,基于數據挖掘的推薦引擎產品,開放性內容創作與分發平臺,以個性化推薦著稱的聚合類資訊應用
今日頭條(tiao)是北京字節跳動科(ke)技(ji)有限公(gong)司開(kai)發的(de)(de)一款基于數據挖掘的(de)(de)引擎(qing)產品(pin),為(wei)用戶(hu)信息(xi),提供(gong)連接人(ren)與信息(xi)的(de)(de)服務的(de)(de)產品(pin)。由張一鳴于2012年(nian)3月創建,2012年(nian)8月發布版本。
基于個(ge)性化引(yin)擎技(ji)術,根(gen)據每個(ge)用戶的興趣、位置等多個(ge)維度進(jin)行個(ge)性化,內容(rong)不僅包(bao)括狹義上的新聞,還包(bao)括音樂(le)、電(dian)影(ying)、游戲、購(gou)物等資訊(xun)。
根據(ju)其社交行為、閱(yue)讀行為、地理位置(zhi)、職業、年齡等挖(wa)掘(jue)出興(xing)趣(qu)。通(tong)過社交行為分析(xi),5秒(miao)鐘計算出用(yong)戶興(xing)趣(qu);通(tong)過用(yong)戶行為分析(xi),用(yong)戶每次動作后(hou),10秒(miao)內更新用(yong)戶模(mo)型。
對(dui)每條(tiao)信(xin)息(xi)提取幾(ji)十個到幾(ji)百個高維特征,并進(jin)行降維、相(xiang)似計(ji)(ji)算、聚類等(deng)計(ji)(ji)算去除重復信(xin)息(xi);對(dui)信(xin)息(xi)進(jin)行機器分(fen)類、摘要抽取,LDA主題分(fen)析、信(xin)息(xi)質(zhi)量(liang)識(shi)別等(deng)處理。
根(gen)據人的(de)特(te)征(zheng)(zheng)、環境(jing)特(te)征(zheng)(zheng)、文(wen)章特(te)征(zheng)(zheng)三者的(de)匹配程度進行。0.1秒內計算結果,3秒完(wan)成(cheng)文(wen)章提取、挖掘、消重、分類,5秒計算出新(xin)用(yong)戶興趣分配,10秒內更新(xin)用(yong)戶模型。