课程介绍

随着机器学习的不断发展,人工智能掀起了新一轮的热潮。这次人工智能的复兴,最大的特点就是AI能够走入业界的真实应用场景,与商业模式紧密结合,开始在产业界发挥出真正的价值。在业界的真实应用中,如何挖掘用户的隐式反馈数据?如何通过语义关联,建立深度学习的知识图谱?云脑机器学习实战训练营,硅谷大咖授课,中美导师深度辅导,三项挑战等你逐一击破!

课程大纲

1.亿级用户电商平台推荐系统挑战 —— 第1-2周(11.13 ~ 11.26)

主讲人:张本宇

学习目标:本课题主要目标是建立基于隐式反馈的电商产品推荐系统,数据集选自海外某电商的亿级用户千万级商品推荐一个月内的点击数据。课题通过进行数据探索,特征工程,特征构建,推荐算法选择,算法调参,结果分析等步骤来学习推荐系统的实战流程,让学员能够深入理解其工作原理。

学习要点:

大作业:电商推荐点击率预测

2.中文维基知识图谱构建挑战 —— 第3-4周(11.27 ~ 12.10)

主讲人:樊向军

学习目标:本项目中将所有的中文维基作为语料并将维基条目名作为字典进行向量化。词向量用于将词或短语映射到一个固定维度的向量上,将词汇和短语用离散的数字表示能够在一些任务(如寻找近似词)上相较于传统方法取得显著的优势。相较于英文语料,中文语料需要进行额外的分词和繁简转换步骤,经过预处理后,使用千万条级维基的正文来生成训练数据,并使用训练数据的一部分作为测试数据集。完成模型的训练后,可以得到了近15万个词向量,根据向量之间的距离可以构建基于词语关系的知识图谱,从而进行基于词汇的文本语义分析。例如通过寻找距离最近的向量可以找到特定词语的近似词,同时通过向量运算也能根据关系来寻找词语等。

学习要点:

大作业:中文维基条目向量化

3.真实业界数据的时间序列预测挑战 —— 第5-6周(12.11 ~ 12.24)

主讲人:徐昊

学习目标:本课题的目标是建立内部与外部特征结合的多时序协同预测系统。数据集采用来自业界多组相关时间序列(约40组)与外部特征时间序列(约5组)。课题通过进行数据探索,特征工程,传统时序模型探索,机器学习模型探索,深度学习模型探索(RNN,LSTM等),算法结合,结果分析等步骤来学习时序预测问题的分析方法与实战流程。

学习要点:

大作业:多组时间序列预测