Back to home

Recommend System Conf 2012

时间: 2012-12-01

地点: 北京五道口 清华旁紫光会所

## 部分记录

### Recommendation anytime, anywhere in Hulu - Hulu 向量

- 不同产品的推荐任务定义清楚
- 推荐实际是缩短找东西的Click
- PM提供的排序Rule 不系统,不宏观,相互冲突
- 转化为Machine Leaning,但是难做trouble shooting
- Rule
- 简单
- 领域知识
- 精准
- Machine Learning
- 数据驱动
- "黑盒"(向量:如果你真的懂ML,那么就不是黑盒)
- Ad
- 数据驱动
- 解释
- 领域相关
- Hulu 主要用到的Machine Learning 方法
- Ranking (主要商业目标是提高CRT)
- ItemBase
- sensible
- 可视化
- 和一般Rule比较
- 让PM作为专家参与,加入领域知识
- 持续学习
- 编辑 - Content Base - Collaborative Filtering - …
- CTR
- 只是一个feature,不是一个目标
- 多人使用一个账户(家庭)
- CF失效
- Rules -> decision tree
- 为了增加位置权重,改变UI(增加feature)
- Tag 不能解决 Cool Start, 不热没Tag
- 数据量大,基于Hadoop
- 探索vs.解释 -> 长期目标vs.短期目标 #TODO
- 手持设备的用户日志
- 时间短
- 私密,更多个人相关信息
- 输入困难
- 场景不一(相较于PC)

### 购物党 王洪涛

- 十台服务器
- 分热门程度设置采集密度
- 基于用户评论的语义分析,得到商品特征
- 品类跨度大,难以复用同一模型

### 豌豆猜 彭跃辉

- “糙”,“快”,“猛”
- 一年时间,三个人
- 开源为主导
- 放弃“标准流程”,有想法,快实现,速上线。

### 微博寻人 梁斌

- 博士月收入2k+,而且还要算“意外所得”缴纳20%的稅
- 微博信息作为特征
- 微博是弱关系(相交于人人真实社会关系)