今日头条信息流推广详解

今日头条是国内领先的新闻客户端,最大的特点是个性化推荐,真正的千人千面。初步估计有3亿的积累用户,日活用户超过三千万。之前就这个问题跟今日头条的今日头条算法构架师曹欢欢交流,就“今日头条是怎么推荐内容的?”进行了简单交流。
 
举个简单的例子,头条在给用户找一篇你可能喜欢的新闻的时候,他会考虑三方面的因素:
 
1、第一,用户特征,比如兴趣,职业,年龄,短期的点击行为。
 
2、第二,环境的特征。推荐是一个情景化的事。比如我自己早上,会看一看科技新闻。周末晚上会看搞笑视频。还有网络环境,你要有wifi的话,给你多推视频。
 
3、另外就是文章自身的特征,它有哪些主题词,命中了哪些标签,还有它的热度,是不是很多家媒体都转载了。包括文章时效性和相似文章推荐。
今日头条信息流推广详解
 
今日头条的个性化推荐不靠人、靠技术推荐时会兼顾用户、环境和文章本身特征这点可以看做他很好的一个技术壁垒。在个性化推荐这块还是考虑得因素蛮多的。
 
今日头条开始逐步引入个性化推荐的策略。他们所采用的,是协同过滤(Collaborative Filtering)** + 基于内容推荐,直到今天依然构成今日头条推荐算法的基础。
 
关于协同过滤,参考 IBM developerWorks 中文社区的专业解释,“协同过滤一般是在海量的用户中发掘出一小部分和你品位比较类似的,在协同过滤中,这些用户成为邻居,然后根据他们喜欢的其他东西组织成一个排序的目录作为推荐给你。”

(协同过滤)是一个很好的方法,直到今天我们还一直使用。但缺点也很明显,对于没有行为(记录)的文章,没办法推荐,所以没办法用于文章的冷启动。所以我们引入了基于内容推荐的策略。比如计算文章的分类、文章的关键词,然后根据用户对文章的阅读、浏览等信息,细化用户的个人资料。——这样子,如果文章是和科技相关的,而用户的个人资料也显示科技相关,那么就算匹配。”
 
在之后的工作,是把特征、模型做得更加细化。比如,文章实体词的抽取。我们最近对文章的分析,已经做得很细,可以精确地提取实体词。我们近期引入了‘词嵌入’(word embedding)方法,做向量化的分析,还引入 LDA 的方法,进行 topic 分析等等。

更多疑问 全面解答

资深从业人员在线为您解答所有疑惑

免费咨询

留言咨询