大数据分析求助

查看 76|回复 5
作者:jing99   
大佬们好,目前准备一个比赛。大学生身心健康的分析。目前打算利用大学生体测成绩和心理测试成绩进行大数据分析,找到身体健康与心理健康的关联,以及哪些指标的影响度。
不知道该如何下手,想问问大佬有没有大数据分析的项目或者资源,如果淘宝有店的,可以帮忙指条路,有经费

大数, 据分析

mfgcs   

有多少数据量?数据完整性如何?经费有多少?做到什么程度?
jing99
OP
  


mfgcs 发表于 2024-6-3 15:10
有多少数据量?数据完整性如何?经费有多少?做到什么程度?

大四学生,四年的数据跟踪,约 2w 余条。数据包含姓名性别学号,以及体测的各项成绩。心理测试的两个分数。
预算 3k-5k。分析的结果需要呈现整体变化趋势、体测成绩与心理水平的相关性。
如果可以的话,增加查询并呈现个体水平四年的变化趋势
mfgcs   

你这个需求其实不涉及到算法,简单来说就是一个数据可视化的过程。用常规的数据分析手段就可以实现。
第一:对你的数据进行预处理:主要是确保数据没有缺失值,0值或异常值。如果有,需要进行填补或剔除。
第二:数据合并:将体测成绩和心理测试成绩合并在一起,确保数据的一致性和完整性,直接按照姓名或者身份证号学号啥的合并就可以。
第三:描述性统计分析:了解合并后的数据基本分布情况,包括均值、中位数、标准差等。
第四:趋势分析:分析整体变化趋势,包括体测成绩和心理测试成绩的时间序列变化。
第五:相关性分析:计算体测成绩与心理测试成绩之间的相关系数,探讨身体健康与心理健康之间的关系。
第六:个体时间序列分析:对于每个学生,绘制其四年来体测成绩和心理测试成绩的变化趋势。
第七:数据可视化,这一块主要是你想看什么图就绘制什么图,举几个例子:
整体趋势图:展示所有学生的体测成绩和心理测试成绩的总体变化趋势。
相关性图:展示体测成绩和心理测试成绩之间的相关性。
个体变化图:展示每个学生的体测和心理测试成绩的四年变化情况。
最后:你可以先尝试按照上面的步骤试试,基本上懂python/pandas /matplotlib 都能做出来了,不会的话扔数据,我抽时间给你处理。
回复不容易,有帮助的话记得采纳~
jing99
OP
  


mfgcs 发表于 2024-6-3 15:50
你这个需求其实不涉及到算法,简单来说就是一个数据可视化的过程。用常规的数据分析手段就可以实现。
第一 ...

谢谢大佬,我研究研究。有需要再找您。
877   

厉害了老师,希望到时候能说个大概,大学生心理是成长了,其他方面有没有其他的提升之类的,包括就业方面,是送外卖的多还是安排好进企业的多,后期他们的心理状态才是很重要的,感觉不仅限于上学时期。
不管怎样的学生,上了大学了,都希望有个好的未来~~~
您需要登录后才可以回帖 登录 | 立即注册

返回顶部