机器学习之NBA赛季比赛预测

by erin 2021-05-25

项目背景

本项目展示了如何对nba官方网站的数据进行处理,并根据历史数据对新赛季的比赛进行预测的过程。

数据集数据来源:NBA 官方网站,数据集来源:NBA_scrapped_data。文件包含从1949到2019的NBA每场比赛的数据。

本介绍以视频的方式,向大家展示一个机器学习分类分析实例,包括数据采集、数据处理和数据分析这几个步骤:

  • URL文件导入本项目Demo数据集
  •  把数据集从HDFS导入到Hive
  • 通过机器学习JupyterLab步骤进行数据处理并导出到Hive
  • 通过机器学习JupyterLab步骤进行分类模型训练以及评估
  •  通过机器学习JupyterLab步骤进行LR模型调参

步骤0:克隆公共项目到个人/机构

克隆已准备好的完整项目到个人/机构进行体验。

步骤1:URL文件导入本项目Demo数据集

在BDOS Online大数据平台,用户可通过URL文件导入,导入到系统的HDFS。

步骤2:HDFS到Hive步骤

将HDFS表导入到目标Hive表。

步骤3:进入 JupyterLab

对于机器学习步骤,需要进入JupyterLab来进行操作。

步骤4:数据处理与导出

在Pysaprk程序步骤对NBA Demo数据进行处理并导出。

步骤5:分类模型

本步骤将用五种不同的classifer模型来对数据集进行初步训练,比较哪种模型在检测转账欺诈上更精准。

步骤6:LR模型调参

使用LR模型和参数调优找到最佳参数组合,并导出预测结果。

留言

评论

${{item['author_name']}} 回复 ${{idToContentMap[item.parent] !== undefined ? idToContentMap[item.parent]['author_name'] : ''}} · ${{item.date.slice(0, 10)}} 回复

暂时还没有一条评论.