机器学习在产品分析中的应用

背景

利用机器学习如何更加精准的分析产品数据,以推动产品的成长.其中,原数据为:

  1. 用户在产品中产生的一些行为数据
  2. 直接反应到产品标准的一些数据, 如留存数据,用户活跃,用户新增,在线时长

预计可以使用两种不同的思路来得出一些数据:

  1. 通过用户行为数据预测留存影响
  2. 通过对行为数据与用户流失数据的分析,对不同的行为数据进行流失点进行分类

逻辑回归

  1. 本类问题可以抽象为多特征向量的逻辑回归问题

前期工作

  1. 确定数据矩阵内容: 即特征与结果值
    1. 特征: 当天新增用户的行为数据
    2. 结果值: 0/1区分留存数据
  2. 数据预处理
    1. 特征筛选: 利用python的特征选择工具确定采用特征
    2. 特征归一化/标准化
  3. 确定语言与工具
    1. python
    2. scikit-learn