邹博
睿客邦创始人、中科航天创新技术研究院副院长
青岛科技大学产业教授、天津大学创业导师
中科院计算机博士
创立的睿客邦与多所高校合作建立了Al教研实训基地,
完成和在研30多个人工智能工业项目,广泛应用于医疗、交
通、农业、气象、证券、银行、电信、化工、冶金等多个领
域,致力于人工智能新技术的实践和应用。
第十四课讲师:廖茂文
游戏AI研究员,中国人工智能学会高级会员,高级工程
师,人工智能布道师。研究兴趣:自然语言处理、生成对抗网
络、金融量化,参与过多项省市级人工智能项目,获得软件著
作权2项,预著有《GAN生成对抗网络实战:数学算法原理与
TensorFlow实现》。
课程目标
1.理解机器学习的思维方式和关键技术;
2.了解深度学习和机器学习在当前工业界的落地应用;
3.能够根据数据分布选择合适的算法模型并书写代码;
4.初步胜任使用Python进行数据挖掘、机器学习、深度
学习等工作。
课程特色
1.课程重视代码实践,使用金融、气象、农业、交通、安
防等工业界实际数据(数据已脱敏)进行机器学习模型
的落地应用。
2.在课程坚持推导公式的同时,更重视机器学习和深度学
习的原理与实操;
3.将实际工作中遇到的行业应用和痛点做最直观切实的展示;
4.重视算法模型的同时,更强调实际问题中应该如何模型选
择、特征选择和调参。
5.老师在中科院做科研,同时在多家企业任职首席或顾问,
有丰富的工业经验,能够保证听者尽快了解数据挖掘、
机器学习、深度学习的本质和实践应用。
课程大纲
第一节:Python基础1-Python及其数学库
1.解释器Python3.7与IDE:Anaconda/Pycharm
2.Python基础:列表/元组/字典/类/文件
3.Taylor展式的代码实现
4.numpy/scipy/matplotlib/pandas的介绍和典型使用
5.多元高斯分布
6.泊松分布、幂律分布
7.典型图像处理
8.蝴蝶效应
9.分形与可视化
第一节:Python基础1-Python及其数学库
1.解释器Python3.7与IDE:Anaconda/Pycharm
2.Python基础:列表/元组/字典/类/文件
3.Taylor展式的代码实现
4.numpy/scipy/matplotlib/pandas的介绍和典型使用
5.多元高斯分布
6.泊松分布、幂律分布
7.典型图像处理
8.蝴蝶效应
9.分形与可视化
第二节:Python基础2-机器学习库
1.scikit-learn的介绍和典型使用
2.损失函数的绘制
3.多种数学曲线
4.多项式拟合
5.快速傅里叶变换FFT
6.奇异值分解SVD
7.卷积与(指数)移动平均线
8.Soble/Prewitt/Laplacian算子与卷积神经网络
9.股票数据分析
第三节:Python基础3-数据清洗和特征选择
1.实际生产问题中算法和特征的关系
2.股票数据的特征提取和应用
3.一致性检验
4.缺失数据的处理
5.环境数据异常检测和分析
6.模糊数据查询和数据校正方法、算法、应用
7.鸢尾花数据与分类模型
8.朴素贝叶斯用于18000+篇/Sogou新闻文本的分类
1.scikit-learn的介绍和典型使用
2.损失函数的绘制
3.多种数学曲线
4.多项式拟合
5.快速傅里叶变换FFT
6.奇异值分解SVD
7.卷积与(指数)移动平均线
8.Soble/Prewitt/Laplacian算子与卷积神经网络
9.股票数据分析
第三节:Python基础3-数据清洗和特征选择
1.实际生产问题中算法和特征的关系
2.股票数据的特征提取和应用
3.一致性检验
4.缺失数据的处理
5.环境数据异常检测和分析
6.模糊数据查询和数据校正方法、算法、应用
7.鸢尾花数据与分类模型
8.朴素贝叶斯用于18000+篇/Sogou新闻文本的分类
第四节:多元回归和Logistic回归
1.线性回归
2.Logistic/Softmax回归
3.广义线性回归
4.L1/L2正则化
5.Ridge与LASSO
6.Elastic Net
7.梯度下降算法:BGD与SGD
8.特征选择与过拟合
9.Softmax回归的概念源头
10.最大熵模型
11.K-L散度
代码和案例实践(第四节):
1.机器学习sklearn库介绍
2.回归代码实现和调参
3.Ridge回归/LASSO/Elastic Net
4.Logistic/Softmax回归
5.广告投入与销售额回归分析
6.鸢尾花数据集的分类
7.回归代码实现和调参
8.交叉验证
9.数据可视化
1.线性回归
2.Logistic/Softmax回归
3.广义线性回归
4.L1/L2正则化
5.Ridge与LASSO
6.Elastic Net
7.梯度下降算法:BGD与SGD
8.特征选择与过拟合
9.Softmax回归的概念源头
10.最大熵模型
11.K-L散度
代码和案例实践(第四节):
1.机器学习sklearn库介绍
2.回归代码实现和调参
3.Ridge回归/LASSO/Elastic Net
4.Logistic/Softmax回归
5.广告投入与销售额回归分析
6.鸢尾花数据集的分类
7.回归代码实现和调参
8.交叉验证
9.数据可视化
第五节:决策树和随机森林
1.熵、联合熵、条件熵、KL散度、互信息
2.最大似然估计与最大熵模型
3.ID3、C4.5、CART详解
4.决策树的正则化
5.预剪枝和后剪枝
6.Bagging
7.随机森林
8.不平衡数据集的处理
9.利用随机森林做特征选择
10.使用随机森林计算样本相似度
11.异常值检测
代码和案例实践(第五节):
1.随机森林与特征选择
2.决策树应用于回归
3.多标记的决策树回归
4.决策树和随机森林的可视化
5.葡萄酒数据集的决策树/随机森林分类
6.泰坦尼克乘客存活率估计
第六节:SVM
1.线性可分支持向量机
2.软间隔
3.损失函数的理解
4.核函数的原理和选择
1.熵、联合熵、条件熵、KL散度、互信息
2.最大似然估计与最大熵模型
3.ID3、C4.5、CART详解
4.决策树的正则化
5.预剪枝和后剪枝
6.Bagging
7.随机森林
8.不平衡数据集的处理
9.利用随机森林做特征选择
10.使用随机森林计算样本相似度
11.异常值检测
代码和案例实践(第五节):
1.随机森林与特征选择
2.决策树应用于回归
3.多标记的决策树回归
4.决策树和随机森林的可视化
5.葡萄酒数据集的决策树/随机森林分类
6.泰坦尼克乘客存活率估计
第六节:SVM
1.线性可分支持向量机
2.软间隔
3.损失函数的理解
4.核函数的原理和选择
5.SMO算法
6.支持向量回归SVR
7.多分类SVM
代码和案例实践(第六节):
1.原始数据和特征提取
2.调用开源库函数完成SVM
4.葡萄酒数据分类
5.数字图像的手写体识别
5.MNIST手写体识别
6.SVR用于时间序列曲线预测
7.SVM、Logistic回归、随机森林三者的横向比较
第七节:聚类
1.各种相似度度量及其相互关系
2.Jaccard相似度和准确率、召回率
3.Pearson相关系数与余弦相似度
4.K-means与K-Medoids及变种
5.AP算法(Sci07)/LPA算法及其应用
6.密度聚类DBSCAN/DensityPeak(Sci14)
7.谱聚类SC
8.聚类评价和结果指标
6.支持向量回归SVR
7.多分类SVM
代码和案例实践(第六节):
1.原始数据和特征提取
2.调用开源库函数完成SVM
4.葡萄酒数据分类
5.数字图像的手写体识别
5.MNIST手写体识别
6.SVR用于时间序列曲线预测
7.SVM、Logistic回归、随机森林三者的横向比较
第七节:聚类
1.各种相似度度量及其相互关系
2.Jaccard相似度和准确率、召回率
3.Pearson相关系数与余弦相似度
4.K-means与K-Medoids及变种
5.AP算法(Sci07)/LPA算法及其应用
6.密度聚类DBSCAN/DensityPeak(Sci14)
7.谱聚类SC
8.聚类评价和结果指标
代码和案例实践(第七节):
1.K-Means++算法原理和实现
2.向量量化VQ及图像近似
3.并查集的实践应用
4.密度聚类的异常值检测
5.谱聚类用于图片分割
第八节:EM算法
1.最大似然估计
2.Jensen不等式
3.朴素理解EM算法
4.精确推导EM算法
5.EM算法的深入理解
6.混合高斯分布
7.主题模型pLSA
代码和案例实践(第八节):
1.多元高斯分布的EM实现
2.分类结果的数据可视化
3.EM与聚类的比较
4.Dirichlet过程EM
5.三维及等高线等图件的绘制
6.キ颙槿型DLSA与EM算法
1.K-Means++算法原理和实现
2.向量量化VQ及图像近似
3.并查集的实践应用
4.密度聚类的异常值检测
5.谱聚类用于图片分割
第八节:EM算法
1.最大似然估计
2.Jensen不等式
3.朴素理解EM算法
4.精确推导EM算法
5.EM算法的深入理解
6.混合高斯分布
7.主题模型pLSA
代码和案例实践(第八节):
1.多元高斯分布的EM实现
2.分类结果的数据可视化
3.EM与聚类的比较
4.Dirichlet过程EM
5.三维及等高线等图件的绘制
6.キ颙槿型DLSA与EM算法
第九节:隐马尔科夫模型HMM
1.主题模型LDA
2.词潜入和word2vec
3.前向/后向算法
4.HMM的参数学习
5.Baum-Welch算法详解
6.Viterbi算法详解
7.隐马尔科夫模型的应用优劣比较
8.共轭先验分布
9.Laplace平滑
10.Gibbs采样详解
11.Metropolis-Hastings算法
12.MCMC
代码和案例实践(第九节):
1.敏感话题分析
2.网络爬虫的原理和代码实现
3.LDA开源包的使用和过程分析
4.HMM用于中文分词
5.文件数据格式UFT-8、Unicode
6.发现新词和分词效果分析
7.高斯混合模型HMM
8.GMM-HMM用于股票数据特征提取
1.主题模型LDA
2.词潜入和word2vec
3.前向/后向算法
4.HMM的参数学习
5.Baum-Welch算法详解
6.Viterbi算法详解
7.隐马尔科夫模型的应用优劣比较
8.共轭先验分布
9.Laplace平滑
10.Gibbs采样详解
11.Metropolis-Hastings算法
12.MCMC
代码和案例实践(第九节):
1.敏感话题分析
2.网络爬虫的原理和代码实现
3.LDA开源包的使用和过程分析
4.HMM用于中文分词
5.文件数据格式UFT-8、Unicode
6.发现新词和分词效果分析
7.高斯混合模型HMM
8.GMM-HMM用于股票数据特征提取
第十节:主题模型LDA
1.贝叶斯学派的模型认识
2.Beta分布与二项分布
3.共轭先验分布
4.Dirichlet分布
5.Laplace平滑
6.Gibbs采样详解
代码和案例实践(第十节):
1.网络爬虫的原理
2.停止词和高频词
3.动手自己实现LDA
4.LDA开源包的使用和过程分析
5.Metropolis-Hastings算法
6.MCMC
7.LDA与word2vec的比较
8.网络爬虫代码实现
9.TextRank算法与实践
第十一节:卷积神经网络CNN
1.贝叶斯学派的模型认识
2.Beta分布与二项分布
3.共轭先验分布
4.Dirichlet分布
5.Laplace平滑
6.Gibbs采样详解
代码和案例实践(第十节):
1.网络爬虫的原理
2.停止词和高频词
3.动手自己实现LDA
4.LDA开源包的使用和过程分析
5.Metropolis-Hastings算法
6.MCMC
7.LDA与word2vec的比较
8.网络爬虫代码实现
9.TextRank算法与实践
第十一节:卷积神经网络CNN
1.神经网络结构,滤波器,卷积
2.池化,激活函数,反向传播
3.目标分类与识别、目标检测与追踪
4.AlexNet, VGGNet, GoogleLeNet
5.Inception-V3/V4
6.ResNet,DenseNet
代码和案例实践(第十一节):
1.数字图片分类
2.卷积核与特征提取
3.以图搜图
4.人证合一
5.卷积神经网络调参经验分享
第十二节:图像视频的定位与识别
1.视频关键帧处理
2.物体检测与定位
3.RCNN, Fast-RCNN, Faster-RCNN, MaskRCNN
4.YOLO
5.FaceNet
2.池化,激活函数,反向传播
3.目标分类与识别、目标检测与追踪
4.AlexNet, VGGNet, GoogleLeNet
5.Inception-V3/V4
6.ResNet,DenseNet
代码和案例实践(第十一节):
1.数字图片分类
2.卷积核与特征提取
3.以图搜图
4.人证合一
5.卷积神经网络调参经验分享
第十二节:图像视频的定位与识别
1.视频关键帧处理
2.物体检测与定位
3.RCNN, Fast-RCNN, Faster-RCNN, MaskRCNN
4.YOLO
5.FaceNet
代码和案例实践(第十二节):
1.迁移学习
2.人脸检测
3.OCR字体定位和识别
4.睿客识云
5.气象识别
第十三节:循环神经网络RNN
1.RNN基本原理
2.LSTM、 GRU
3.Attention
4.CNN+LSTM模型
5.Bi-LSTM双向循环神经网络结构
6.编码器与解码器结构
7.特征提取:word2vec
8.Seq2seq模型
代码和案例实践(第十三节):
1.看图说话
2.视频理解
3.藏头诗生成
4.问答对话系统
5.OCR
1.迁移学习
2.人脸检测
3.OCR字体定位和识别
4.睿客识云
5.气象识别
第十三节:循环神经网络RNN
1.RNN基本原理
2.LSTM、 GRU
3.Attention
4.CNN+LSTM模型
5.Bi-LSTM双向循环神经网络结构
6.编码器与解码器结构
7.特征提取:word2vec
8.Seq2seq模型
代码和案例实践(第十三节):
1.看图说话
2.视频理解
3.藏头诗生成
4.问答对话系统
5.OCR
6.循环神经网络调参经验分享
第十四节:自然语言处理
1.语言模型Bi-Gram/Tri-Gram/N-Gram
2.分词
3.词性标注
4依存句法分析
5.语义关系抽取
6.词向量
7.文本分类
8.机器翻译
9.文本摘要
10.阅读理解
11.问答系统
12.情感分析
代码和案例实践(第十四节):
1.输入法设计
2.HMM分词
3.文本摘要的生成
4.智能对话系统和SeqSeq模型
5.阅读理解的实现与Attention
第十四节:自然语言处理
1.语言模型Bi-Gram/Tri-Gram/N-Gram
2.分词
3.词性标注
4依存句法分析
5.语义关系抽取
6.词向量
7.文本分类
8.机器翻译
9.文本摘要
10.阅读理解
11.问答系统
12.情感分析
代码和案例实践(第十四节):
1.输入法设计
2.HMM分词
3.文本摘要的生成
4.智能对话系统和SeqSeq模型
5.阅读理解的实现与Attention
第十五节:生成对抗网络GAN
1.生成与判别
2.生成模型:贝叶斯、HMM到深度生成模型
3.GAN对抗生成神经网络
4.DCGAN
5.Conditional GAN
6.InfoGan
7.Wasserstein GAN
代码和案例实践(第十五节):
1.生成与判别
2.生成模型:贝叶斯、HMM到深度生成模型
3.GAN对抗生成神经网络
4.DCGAN
5.Conditional GAN
6.InfoGan
7.Wasserstein GAN
1.生成与判别
2.生成模型:贝叶斯、HMM到深度生成模型
3.GAN对抗生成神经网络
4.DCGAN
5.Conditional GAN
6.InfoGan
7.Wasserstein GAN
代码和案例实践(第十五节):
1.生成与判别
2.生成模型:贝叶斯、HMM到深度生成模型
3.GAN对抗生成神经网络
4.DCGAN
5.Conditional GAN
6.InfoGan
7.Wasserstein GAN
第十六节:强化学习RL
1.为何使用增强学习
2.马尔科夫决策过程
3.贝尔曼方程、最优策略
4.策略迭代、值迭代
5.Q Learning
6.SarsaLamda
7.DQN
8.A3C
9.ELF
代码和案例实践(第十六节):
1.OpenAl
2.飞翔的小鸟游戏
3.基于增强学习的游戏学习
4.DQN的实现
1.为何使用增强学习
2.马尔科夫决策过程
3.贝尔曼方程、最优策略
4.策略迭代、值迭代
5.Q Learning
6.SarsaLamda
7.DQN
8.A3C
9.ELF
代码和案例实践(第十六节):
1.OpenAl
2.飞翔的小鸟游戏
3.基于增强学习的游戏学习
4.DQN的实现
发表评论