使用PandasGUI进行探索性数据详解
发布时间:2021-06-04 15:56:35 所属栏目:大数据 来源:互联网
导读:在现代科技的推动下,大数据逐渐渗透到体育领域,大数据技术在足球这项世界第一大运动中更是被广泛应用。之前国足与马尔代夫的比赛之后,网上就曝出了赛前鲁能通过自己的大数据系统将执法主裁的资料分享给了国足团队以便球员了解该裁判的执法风格。当然大数
在现代科技的推动下,大数据逐渐渗透到体育领域,大数据技术在足球这项世界第一大运动中更是被广泛应用。之前国足与马尔代夫的比赛之后,网上就曝出了赛前鲁能通过自己的大数据系统将执法主裁的资料分享给了国足团队以便球员了解该裁判的执法风格。当然大数据的应用范围也不只是在了解裁判的执法风格,球员引进、战术布局、球员训练、技战术安排等各个领域和大数据的联系都越来越紧密。不过不同于一线队更关注于用大数据提高球员的临场发挥和比赛的结果,大数据应用在青训领域则更需要关注球员的长期发展,接下来就让我们通过几个方面了解鲁能足校大数据在青少年球员成长方面的作用。
上次为大家介绍了鲁能青训大数据后台与训练相关的内容,这次我们来为大家介绍大数据如何影响球员在赛场上的表现和备战比赛的状态。
不同于训练,比赛的相关数据和指标要多得多,专业程度上也不是日常训练可比拟的。想要获得一份完整的比赛报告,我们需要将比赛的录像交由专业的英国数据公司来完成更加细致的数据分析,一场比赛的处理时长大概在1-2天左右。当遇上“潍坊杯”这种比较重要的大型赛事,为了让球队在密集的赛程里对自身比赛中存在的问题和对手的特点有足够的了解并做出及时针对性的布置,这个过程就被大大缩短,上午比赛的数据一般在下午比赛之后就能获得,而下午场的比赛数据在第二天一早就能及时查看。
“比赛数据分析”
大数据比赛篇:当足球走进高科技时代 用“大数据”解读比赛
有不少球迷都对Whoscored、创冰等网站的各项球员数据有所涉猎,详尽的比赛数据更是让普通球迷大开眼界,数据的意义在于能让我们从数字的角度更直观地看出球员和球队的技术风格。因为青少年赛事关注度比较低,青训队伍想通过这些数据网站查询自己的比赛数据无异于痴人说梦,而且这些网站对于普通人来说异常详尽的数据,对于球队的教练员来说却是远远不够。
以2018年“潍坊杯”半决赛山东鲁能面对皇家西班牙人为例,球队主教练郭侃烽通过大数据系统获得了西班牙人过去三场比赛的各项数据,在此基础上制定了相当具有针对性的战术设计:西班牙人在小组赛中虽然取得3连胜,攻入5粒进球,但是他们的进球时间都相对靠后,在鲁能强劲的攻势下比赛第5分钟田玉达便接队友传中攻入一粒精彩进球,尽管在半场结束前西班牙人将比分扳平,下半场鲁能又是利用西班牙人整体阵型前压过大,反击时获得3打3的局面,替补上场的刘超阳接到季胜攀传球利用速度和体力优势再次将比分超出,接下来的时间鲁能站好防守阵型,没让西班牙人再次扳平比分,鲁能2-1爆冷击败更被看好的西班牙人闯进决赛。
传球矩阵也是大数据中极具特色的一点,它能让教练员清楚地看到对方阵中球员间的传球次数,从而推断出核心球员的传球意图,进而提前在战术上进行针对性的布置。以前两年巴萨为例,梅西后撤中场斜长传找到后插上的阿尔巴,阿尔巴低平传中或者倒三角助攻梅西的战术配合被称为经典的“巴西连线”,但是当阿尔巴这个接球点或者梅西的传球空间被限制,阿尔巴助攻上前留下的大片防守空间就屡次被拿来做文章。
大数据比赛篇:当足球走进高科技时代 用“大数据”解读比赛
“比赛录像分析”
在大数据后台我们能获得的当然不仅仅只有数据,还有比赛录像。不少球迷可能会说录像谁没见过,比赛集锦我还天天看呢。但是鲁能大数据后台被处理过的录像却没有那么简单。像球迷一样按时间顺序再看一次比赛录像对于球员和教练来说不仅意义不大还浪费时间。要成功地汲取经验,我们需要对视频内容进行简化与提取,确保每个人都能把握视频、数字以及数据表中的要点。大数据根据比赛中球员所贡献的数据,将比赛录像割裂成无数个可重合的片段,球员和教练可以通过点击关键的比赛时间,从录像中得悉导致关键节点发生的原因。换言之,球员和教练可以通过分析比赛中最重要的几个节点,并以此为依据在即将到来的后续比赛中克服球队的短板。
大数据比赛篇:当足球走进高科技时代 用“大数据”解读比赛
通过对比赛关键节点的分析,教练们可以提高球员的阅读比赛Pandasgui是一个开源的python模块,它为pandas创建了一个GUI界面,我们可以在其中使用pandas的功能分析数据和使用不同的功能,以便可视化和分析数据,并执行探索性数据分析。
探索性数据分析是最关键的部分,无论何时我们使用数据集时都要首先进行分析。它允许我们分析数据,探索数据的初始结果,比如有多少行和列,不同的列是什么,等等。EDA是一种方法,我们使用不同的方法,主要是可视化来总结数据的主要特征。
如果您正在处理数据,EDA是一个重要且最关键的步骤。在整个项目中,几乎有30%的时间是用来探索数据并找出它到底是关于什么的。EDA允许我们并告诉我们如何在建模之前对数据进行预处理。这就是为什么EDA是最重要的,但是我们可以通过自动化所有的EDA工作来节省时间,并且可以在建模中使用节省的时间。
在本文中,我们将探索Pandasgui,并了解如何使用它来自动化探索性数据分析过程,并节省我们的时间和精力。
安装Pandasgui
和其他库一样,我们可以使用pip安装pandasgui。
pip install pandasgui
加载数据集
pandasgui中预定义了大量的数据集,我们将使用pandasgui加载一个名为"IRIS"的数据集,这是一个非常著名的数据集,并将使用pandasgui的GUI界面来探索它。我们还将导入"show"函数,该函数将数据集加载到GUI中。
from pandasgui.datasets import iris
#importing the show function
from pandasgui import show
功能介绍
现在我们只需要通过传递数据集名称作为参数来调用show函数,它将启动一个GUI,在这里我们可以探索它的不同部分,并尝试探索数据集的不同属性。
show(iris)
使用PandasGUI进行探索性数据分析
在这里,您可以看到show函数启动GUI,我们可以清楚地看到包含不同功能的不同选项卡。
让我们分析一下这个接口的不同部分。
Dataframe
使用PandasGUI进行探索性数据分析
我们可以清楚地分析哪些是不同的属性以及它们包含哪些值。我们可以清楚地分析所有的值和属性。在左边,我们还可以看到dataframe的形状。
Filters
使用PandasGUI进行探索性数据分析
在本节中,我们可以应用不同的过滤器来分析数据。我们可以简单地输入想要运行的查询并应用过滤器。
Statistics
使用PandasGUI进行探索性数据分析
类似于pandas dataframe的describe功能。它帮助我们分析数据集的统计属性。
Grapher
使用PandasGUI进行探索性数据分析
这是最重要的部分,在这里我们可以清楚地看到不同类型的可视化,我们可以使用界面创建,并节省了为每个可视化编写代码的工作。在上面的图片中,我创建了sepallength和sepalwidth的散点图。类似地,您可以通过拖放x、y和其他参数中的列名来创建不同的可视化。能力和技战术分析能力,加强对足球运动更深层次的理解。在今年因为疫情球员不得不隔离在家时,鲁能青训教练组选取部分经典比赛,要求队员对比赛进行技战术分析。教练员利用线上教学,帮助球员逐一讲解问题,手把手地教队员如何分析比赛,让球员逐渐学会看顶级比赛如何发展,顶级运动员如何阅读比赛,不同位置在比赛中怎样做到平衡、保护、拉开,如何去从四个时刻看比赛和分析比赛。
这种针对性的辅导和教学,有效地提高了球员的独立思考能力,加强了球员分析问题的逻辑思维能力,让球员在个人技战术上有了进一步的提升。
大数据在运动训练中应用的核心就是预测,实质是从数据中寻找规律,提升认知能力,从而进行预测并指导决策。传统的人工记录球员训练表现,存在易受主观因素影响、工作量过大、统计不准以及资料保存不易等缺陷,我们现在使用的大数据系统更能够即时、全面地生成具有训练指导价值的、足够体量的数据。大数据的这种洞察与分析能力已经从根本上改变了足球这项运动的规则,我们也期待着未来足球在大数据的辅佐下能够出现更多激动人心的发展。
(编辑:上饶站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |