推荐算法笔记

推荐系统分类(根据不同输入)

  1. 比较熟悉的、经常使用的协同过滤的技术,它使用的一方面是用户的信息,另一方面是和用户有相似行为的群体的信息,协同过滤技术就是根据这一群体的信息给用户做推荐。
  2. 基于内容的推荐,它用到的一方面是用户的信息,另一方面是商品的显性相关属性信息,基于内容的推荐就是向用户推荐他可能浏览或者购买过的相似产品的信息。
  3. 混合技术,会运用不同的输入和技术共同进行推荐。

传统推荐技术的优点和缺点。

基于内容的推荐,

  1. 优点
    • 简单直接;
    • 有可解释的结果
    • 可以比较不同产品之间的相似度
  2. 缺点
    • 对于从来没有过购买行为的用户会有一个冷启动的问题

协同过滤技术

  1. 优点:
    • 可以给用户推荐出一些新奇的、用户可能没有购买过的商品
  2. 缺点
    • 新用户的冷启动问题
    • 因为用户与商品之间的交互数据不够多,有数据稀疏的问题
    • 相对于基于内容的推荐技术,协同过滤技术对结果没有那么好的解释性

常用算法及名词解释

MCMC方法(蒙特卡罗方法)

核心问题

  1. 定义一个分布P(x),如何从这个分布上进行采样
  2. 利用马尔可夫链产生指定分布下的样本

结论

如果我们想在某个分布下进行采样,只要模拟以其为平稳分布的马尔可夫过程,经过足够多的转移之后,我们的样本分布就会充分接近于该平稳分布.

推荐算法特点

  1. 推荐系统的策略主要分为召回和排序两个过程,召回主要负责生成推荐的候选集,排序负责将多个算法策略的结果进行个性化排序。

推荐算法需要深度学习的原因

  1. 它可以学习出隐藏的特征
  2. 它可以学习出多层次的特征表示
  3. 深度学习可以对异质的或者跨域的内容信息进行学习,解决推荐系统常见的冷启动问题。