赛题讲解培训实录!2025年(第18届)中国大学生计算机设计大赛大数据主题赛 ...

铁佛  论坛元老 | 2025-3-30 21:40:15 | 显示全部楼层 | 阅读模式
打印 上一主题 下一主题

主题 1828|帖子 1828|积分 5484

导读
2025 年(第 18 届)中国大学生计算机设计大赛大数据主题赛 “数据解读科技创新与社会变革” 赛题已于和鲸平台正式开赛。开赛以来,已吸引了来自全国各高校的 600+ 优秀本科生积极相应,完成报名工作。为资助参赛选手更好地理解赛题、顺遂参赛,和鲸共同赛道组织单位特为参赛选手提供两场线上培训。

首场培训“赛题破局·参赛启航专场”邀请了中国人民大学信息管理学院副传授黄科满老师进行赛题解读;同时,和鲸科技的竞赛专家韦琪也为各人详细先容了和鲸平台的操纵流程。现特发布本篇赛题解读与平台使用实录整理,以期为各位同学顺遂参赛提供支持。




分享嘉宾

黄科满,博士,现任中国人民大学信息学院副传授,中国人民大学吴玉章青年学者,麻省理工斯隆管理学院网络安全研究中心兼职研究员。恒久围绕数字创新生态、网络安全和数据治理开展多学科交织研究,现在已经在计算机、商科和政策等跨学科领域相干主流期刊、会媾和杂志发表论文 70 余篇,部门相干研究结果被国家部委和国内外企业所采纳,主持和参与国家级项目多项。

韦琪,和鲸科技数据科学竞赛专家。与浩繁高校、企业深度沟通,认识数据人才气力培养全流程。善于结合高校讲授内容策划数据创新类赛事,将学生置于真实行业问题锻炼实践能力。竞赛组织与评审工作多维、中肯,注重选手综合素质培养。


以下是实录整理内容。

01
赛题核心剖析:聚焦问题,驱动创新

中国人民大学信息学院副传授黄科满老师就本次大数据应用主题赛的赛题进行了深入解读。他强调,赛事旨在通过真实问题训练学生的数据思维,这也是本科人才培养的紧张内容。

01 赛题解读
大数据应用赛分为实践赛和主题赛,本次培训聚焦的主题赛有着独特的要求与特色。与盲目进行数据分析差别,主题赛要求学生围绕特定主题展开,每个主题都有相应的数据支持。

本届赛事大数据主题赛的赛题是 “数据解读科技创新与社会变革”,科技创新与社会变革精密相连,是国家发展的紧张战略,与数字期间的发展息息相干。在研究过程中,不能仅仅从数据到数据进行表面分析,而要深入思索,探求有效的、聚焦的维度,结合数据来回答核心问题。比方,在探讨国内独角兽企业数目少的缘故原由,以及中国大模型发展水平相干争议时,学生可以使用赛事提供的数据,深入挖掘数据背后的联系,用数据驱动分析过程,形成具有深度和说服力的主题分析陈诉。







02 数据说明
在数据使用方面,赛事提供了丰富多样的数据集,涵盖科技研发和创新数据、高新技能产业数据、各国经济发展数据等多个维度,这些数据从差别角度反映了科技发展与社会变革的关系。同时也鼓励选手在参赛过程中补充其他数据集以充实数据分析。但学生必要注意,要有效设计分析维度和视角,挑选符合的数据,避免将大量数据简单罗列成表格,却无法得出有价值的结论。





左右滑动查看更多

03 作品提交
对于作品的提交,学生必要预备两部门内容。一是主题分析陈诉,这要求学生围绕选定主题,清晰地阐述从哪些维度展开分析,每个维度对应的数据环境,以及这些数据所反映的现象和内涵联系,形成完备的叙事逻辑。二是数据处理源程序,学生要展示数据处理的代码,包括数据清洗、处理、分析的过程,以及终极得出的结论。若使用了额外数据,需注明数据来源,确保在和鲸平台上能够有效复现。




04 案例解读
黄科满老师还通过两个实际案例,进一步阐释了如何运用数据思维办理社会问题。

第一个案例展示了《Nature》一篇刊文在研究人工智能在天气变革场景中的作用时,先以专利数据为分析维度,围绕核心问题筛选相干数据,再通过对数坐标处理数据以更好地展现趋势,并深入分析差别领域使用人工智能的差别,层层递进,从而形成了完备的故事线。

另一个案例则是通太过析微博上关于天气变革的讨论数据,探究公众对碳中和话题的态度、人群分布及变革,以及影响共识形成的因素,同样展现了清晰的故事线和以问题为导向的数据处理思绪。

这两个案例都体现了数据、问题和结论之间的迭代循环关系。以此为例,黄老师鼓励学生在参赛过程中一定要充实发挥创造力,深入思索,培养与展现数据思维。


02
参赛平台与流程详解
和鲸平台助力赛事之旅

和鲸科技的竞赛经理韦琪为各人详细先容了参赛平台的使用方法和参赛流程。

下方重要列举了一些须要的、通例性的步调与平台使用方法,更多教程可在赛事页面查看和鲸平台的用户手册。






Step 1 在和鲸社区完成报名
作为赛道平台,选手首先必要在和鲸社区平台上完成报名。报名前必要注册和鲸平台账号,可通过微信扫码、短信登录、暗码登录等方式注册。报名时选手务必确保填写的信息真实有效,学生选择 “学生” 身份填写,若有多位指导老师参与,相干信息可用顿号分隔开提交。










Step 2 创建项目
报名完成后,选手必要在平台创建项目(作品)。



  • 在项目创建页面,选手可以填写项目名称、短形貌等基本信息,同时可选择挂载赛事提供的约十个数据集,以满意自己的研究需求。项目创建支持使用 python 或 R 语言,既可在平台的 notebook 中直接新建,也可上传本地代码文件。









  • 创建好项目后,则会进入项目运行界面。该界面提供了数据分析的常用功能,如查看本地文件存储与调用、挂载数据集及读取路径、调用和鲸平台提供的常用代码等。选手可以将项目生成版本,分享给队友或用于作品提交。每次代码修改后最好及时生成最新版本。







为保证比赛公平,和鲸平台统一提供了 2C8G 的算力资源,联网即可使用。环境方面,平台提供了涵盖数据分析和机器学习工具包的基础镜像环境,选手也可根据需求构建自己的环境,在基础镜像上再叠加所需工具包。编程过程中,界面右上角和左下角能及时观察到资源接入和镜像预备环境,下方检测区则可查看项目运行目录和及时环境,平台提供的磁盘空间支持文件读写。








Step 3 数据操纵
在数据相干操纵方面,赛事提供的数据集存储在共享空间内,学生可在编程页面查看并调用。韦经理还同时演示了新建数据集、在项目中添加数据集时、获取数据挂载路径等相干操纵。









左右滑动查看更多

和鲸平台也提供项目协作功能方便队友之间协作创作作品,选手们可根据协作需求为队友开放作品权限。队友收到共享内容后,可以在版本列表处申请提交归并。





左右滑动查看更多


Step 4 作品提交
作品提交环节必要上传两份材料。


  • 首先需在比赛详情页上传数据分析陈诉;
  • 其次选择数据处理源程序的终极版本 Notebook 提交,提交后会生成提交记录和作品链接。
提交时要注意检查 Notebook 是否为终极版本,多次提交时必要确保复制的链接是最新版本链接。










03
赛题讲解培训回放及
往届优秀选手履历分享直播预告
 此实录为精简部门,您可在赛事主页
https://www.heywhale.com/home/competition/6777adb2f55c510422ae637b?flag=stjd(点此链接报名参赛后方可查看,建议 pc 端访问)。





和鲸始终贯彻大赛“以赛促学、以赛促教、以赛促创”的精神与理念,为参赛师生提供多层面、多角度、全方位的工作支持,希望学生们能够充实使用这些信息,在比赛中发挥出自己的最佳水平,用数据驱动创新,在大赛中取得优异成绩。衷心等候本届中国大学生计算机设计大赛能够涌现出更多的优秀作品。

赛事相干咨询、答疑需求欢迎扫码参加赛事社群。

主办:中国大学生计算机设计大赛组委会
承办:华东理工大学、东华大学、华东师范大学
协办:中国人民大学
   上海和今信息科技有限公司

免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x
回复

使用道具 举报

0 个回复

倒序浏览

快速回复

您需要登录后才可以回帖 登录 or 立即注册

本版积分规则

铁佛

论坛元老
这个人很懒什么都没写!
快速回复 返回顶部 返回列表