机器学习在产品分析中的应用
背景
利用机器学习如何更加精准的分析产品数据,以推动产品的成长.其中,原数据为:
- 用户在产品中产生的一些行为数据
- 直接反应到产品标准的一些数据, 如留存数据,用户活跃,用户新增,在线时长
预计可以使用两种不同的思路来得出一些数据:
- 通过用户行为数据预测留存影响
- 通过对行为数据与用户流失数据的分析,对不同的行为数据进行流失点进行分类
逻辑回归
- 本类问题可以抽象为多特征向量的逻辑回归问题
前期工作
- 确定数据矩阵内容: 即特征与结果值
- 特征: 当天新增用户的行为数据
- 结果值: 0/1区分留存数据
- 数据预处理
- 特征筛选: 利用python的特征选择工具确定采用特征
- 特征归一化/标准化
- 确定语言与工具
- python
- scikit-learn