标签: wps的官网最新的下载网址的方法

  • wps的官网最新的下载网站怎么找

      当前,篮球运动是最受欢迎的运动之一。在此万受瞩目的运动下,我打算针对篮球运动员个人的信息,技能水平等各项指标进行相关的分析与统计。例如,我们可能会关注如下的内容:

      哪些球员从2014年到2019年近6年连续在榜?对比各球员在2019年的各项数据如何?詹姆斯-哈登随年份数据如何变化?2019年球员数据分布如何?篮球运动员的失误与上场时长有什么联系?球员的各项数据之间的相关性如何?哪些数据会对球员的得分有什么影响?

      数据分析是指用适当的方法与工具,对收集来的大量数据进行分析,提取其中有意义的信息,从而形成有价值的结论的过程。

      在进行数据分析之前,需要清楚数据分析的基本流程。

      明确需求与目的

      分析篮球运动员,得出结论 数据收集

      爬取新浪体育网站数据 数据预处理

      特征筛选

      降维 数据清洗

      缺失值异常值重复值 数据分析

      数据建模数据可视化 编写报告总结

      导入相关库

      需要爬取的数据

      在这里插入图片描述

      爬虫思路分析:

      1.需求获取新浪体育网站的球员信息2.寻找网址(球员的不同赛季的信息在展示html页面找不到)

      可判断该信息是一个Ajax请求通过浏览器抓包,和多次尝试在Postman软件上发送request请求寻得球员分页信息的request发送相应url的规律,并循环遍历 3.获取request返回的内容4.使用正则表达式对request返回信息进行筛选5.将筛选的数据以csv格式储存在本地文件中

      3 rows × 29 columns

      特征筛选

      数据集中的列,并非都是我们分析所需要的可以有选择性的进行加载,只加载我们需要的信息列

      3 rows × 23 columns

      数据清洗

      缺失值处理

      通过info查看数据信息。可以通过isnull与sum结合,查看缺失值情况。

      ==2014年=

      rank 0

      player_name 0

      team_name 0

      score 0

      minutes 0

      field_goals_made 0

      field_goals_att 0

      field_goals_pct 0

      three_points_made 0

      three_points_att 0

      three_points_pct 0

      free_throws_made 0

      free_throws_att 0

      free_throws_pct 0

      offensive_rebounds 0

      defensive_rebounds 0
    wps的官网下载的网站在哪里
      rebounds 0

      assists 0

      turnovers 0

      assists_turnover_ratio 0
    wps的官网最新的下载网址的方法
      steals 0

      blocks 0

      personal_fouls 0

      dtype: int64

      2015年

      rank 0

      player_name 0

      team_name 0

      score 0

      minutes 0

      field_goals_made 0

      field_goals_att 0

      field_goals_pct 0

      three_points_made 0

      three_points_att 0

      three_points_pct 0

      free_throws_made 0

      free_throws_att 0

      free_throws_pct 0

      offensive_rebounds 0

      defensive_rebounds 0

      rebounds 0

      assists 0

      turnovers 0

      assists_turnover_ratio 0

      steals 0

      blocks 0

      personal_fouls 0

      dtype: int64

      2016年

      rank 0

      player_name 0

      team_name 0

      score 0

      minutes 0

      field_goals_made 0

      field_goals_att 0

      field_goals_pct 0

      three_points_made 0

      three_points_att 0

      three_points_pct 0

      free_throws_made 0

      free_throws_att 0

      free_throws_pct 0

      offensive_rebounds 0

      defensive_rebounds 0

      rebounds 0

      assists 0

      turnovers 0

      assists_turnover_ratio 0

      steals 0

      blocks 0

      personal_fouls 0

      dtype: int64

      2017年

      rank 0

      player_name 0

      team_name 0

      score 0

      minutes 0

      field_goals_made 0

      field_goals_att 0

      field_goals_pct 0

      three_points_made 0

      three_points_att 0

      three_points_pct 0

      free_throws_made 0

      free_throws_att 0

      free_throws_pct 0

      offensive_rebounds 0

      defensive_rebounds 0

      rebounds 0

      assists 0

      turnovers 0

      assists_turnover_ratio 0

      steals 0

      blocks 0

      personal_fouls 0

      dtype: int64

      2018年

      rank 0

      player_name 0

      team_name 0

      score 0

      minutes 0

      field_goals_made 0

      field_goals_att 0

      field_goals_pct 0

      three_points_made 0

      three_points_att 0

      three_points_pct 0

      free_throws_made 0

      free_throws_att 0

      free_throws_pct 0

      offensive_rebounds 0

      defensive_rebounds 0

      rebounds 0

      assists 0

      turnovers 0

      assists_turnover_ratio 0

      steals 0

      blocks 0

      personal_fouls 0

      dtype: int64

      异常值处理

      通过describe查看数值信息。可配合箱线图辅助。异常值可以删除,视为缺失值,或者不处理。

      8 rows × 21 columns

      {‘SCR’: ‘score’, ‘MIE’: ‘minutes’, ‘FID’: ‘field_goals_made’, ‘FIT’: ‘field_goals_att’, ‘FIC’: ‘field_goals_pct’, ‘THD’: ‘three_points_made’, ‘THT’: ‘three_points_att’, ‘THC’: ‘three_points_pct’, ‘FRD’: wps的电脑版下载的入口是什么 ‘free_throws_made’, ‘FRT’: ‘free_throws_att’, ‘FRC’: ‘free_throws_pct’, wps office 官方的下载网站在哪里(wps官网最新客服电话) ‘OFD’: ‘offensive_rebounds’, ‘DED’: ‘defensive_rebounds’, ‘RED’: ‘rebounds’, ‘AST’: ‘assists’, ‘TUR’: ‘turnovers’, ‘ASI’: ‘assists_turnover_ratio’, ‘STL’: ‘steals’, ‘BLK’: ‘blocks’, ‘PEL’: ‘personal_fouls’}

      在这里插入图片描述

      重复值处理

      使用duplicate检查重复值。可配合keep参数进行调整。使用drop_duplicate删除重复值。

      列名英文名词解释

      哪些球员近6年连续在榜

      19年球员各项数据对比

      在这里插入图片描述

      19年球员数据分布箱型图

      在这里插入图片描述

      詹姆斯-哈登随年份数据变化折线图

      在这里插入图片描述

      篮球运动员的失误与上场时长有什么联系?

      在这里插入图片描述

      0.13196323727585887

      各数据的相关性图

      在这里插入图片描述

      画决策树分析影响得分的因素

      (152, 24)

      {2014, 2015, 2016, 2017, 2018, 2019}

      Index([‘rank’, ‘player_name’, ‘team_name’, ‘score’, ‘minutes’,

      ‘field_goals_made’, ‘field_goals_att’, ‘field_goals_pct’,

      ‘three_points_made’, ‘three_points_att’, ‘three_points_pct’,

      ‘free_throws_made’, ‘free_throws_att’, ‘free_throws_pct’,

      ‘offensive_rebounds’, ‘defensive_rebounds’, ‘rebounds’, ‘assists’,

      ‘turnovers’, ‘assists_turnover_ratio’, ‘steals’, ‘blocks’,

      ‘personal_fouls’, ‘year’],

      dtype=‘object’)

      Index([‘score’, ‘minutes’, ‘field_goals_made’, ‘field_goals_att’,

      ‘field_goals_pct’, ‘three_points_made’, ‘three_points_att’,

      ‘three_points_pct’, ‘free_throws_made’, ‘free_throws_att’,

      ‘free_throws_pct’, ‘offensive_rebounds’, ‘defensive_rebounds’,

      ‘rebounds’, ‘assists’, ‘turnovers’, ‘assists_turnover_ratio’, ‘steals’,

      ‘blocks’, ‘personal_fouls’, ‘year’],

      dtype=‘object’)

      score float64

      minutes float64

      field_goals_made float64

      field_goals_att float64

      field_goals_pct float64

      three_points_made float64

      three_points_att float64

      three_points_pct float64

      free_throws_made float64

      free_throws_att float64

      free_throws_pct wps的官网最新下载的网站在哪里 float64

      offensive_rebounds float64

      defensive_rebounds float64

      rebounds float64

      assists float64

      turnovers float64

      assists_turnover_ratio float64

      steals float64

      blocks float64

      personal_fouls float64

      year float64

      dtype: object

      5 rows × 21 columns

      在这里插入图片描述

      拉塞尔-威斯布鲁克、詹姆斯-哈登、达米安-利拉德这三人连续6年从2014年到2020年都在榜上,可以说明这三人在当下球员竞技状态非常稳定

      对比2019年各球员各项数据,可知球员与球员之间相同数据项的差异

      针对詹姆斯-哈登,分析其六年的各项数据的变化,2016年其各项正数据普偏高,而负数据普偏低,所有该年是詹姆斯-哈登的巅峰期。从宏观上看,从2014年打篮球能力从2014年到2016年逐步提高,到2016年达到巅峰,之后下降,最后趋向与平稳

      可根据箱型图可视化所有球员各项数据分布

      篮球运动员的失误与上场时长成正相关

      分析球员的各项数据之间的相关性,可知得分与投球的数据关系非常大,其次是投球命中率

      根据决策树逐步分析各项因素决定得分情况,由此可以对球员各项训练计划表进行优化