高考志愿填报如何利用数据粗筛阶段
数据粗筛阶段:数据整合
数据整合的目的是便于后续高校筛选、专业选择等使用。但数据整合需要一定的软件技能:一方面,上述各类数据格式各异,有PDF、图片、网页等,需要通过格式转换和清洗形成同样格式的数据;另外一方面,需要将这些数据关联到一起便于使用。
对于不具备软件技能的家长,也没有什么大问题。采用“人工”方式关联查阅相关数据也是可以的,无非麻烦点。
对于具备一定软件技能的家长,笔者简单说一下数据整合的思路:1)使用各类小工具将上述数据转换为统一的CSV等格式;2)使用Excel或WPS等工具对数据进行关联(VLOOKUP函数)。
当然假设软件技能强悍,无需笔者多言:Python、SQL/NoSQL数据库均可以使用起来。
在进行数据关联时,需要确定“主数据”,建议按照如下方法选择“主数据”:
☞对于“原高考”模式省份:以“前一年高校最低录取分排位”作为主数据,关联高校质量数据(地域和高校评级);
☞对于“3+1+2高考”模式省份:以“普通高校本科专业选考科目要求”作为主数据,关联“前一年高校最低录取分排位”、高校质量数据(地域和高校评级)、专业质量数据(学科评估)。
在《迎接2021年高考:是时候做高考志愿填报的数据准备工作了(二)》一文中,说明了为何不在“数据粗筛”阶段整理选科要求数据,建议是在“数据细化阶段”再通过选科要求对本阶段选出的高校进一步筛选。而这里提出以选科要求作为“主数据”,原因是无论如何都是需要整合选科要求数据的,因此可在这里一并完成。
以广东省为例,可形成如下的整合后的数据(Excel格式):
基于整合后的数据,可以很容易完成高校的筛选、完成本阶段的任务。比如,如下视频演示了筛选出:最低录取分排位在2000~10000、地处一线城市、211及以上层次、可满足选科组合为物理+化学+生物的所有高校的过程:
数据粗筛阶段:筛选出满足要求的高校
无论是否进行了数据的整合,使用准备好的几类数据均能筛选出满足要求的高校。
流程如下:
步骤一:使用“预估高考总分排位”范围数据,在“前一年高校最低录取分排位数据”中筛选出录取排位在该范围内的高校列表。
请复习《迎接2021年高考:是时候做高考志愿填报的数据准备工作了(三)》一文中所列出的5类排位数据,需要根据个人的报考意愿按下表确定要从哪些数据中筛选高校。
除了军校外,同一个高校有可能在多个批次中均进行招生。各个数据筛选出的高校加以合并即可;
步骤二:按照个人对高校质量的要求,使用“高校质量数据”,从上述筛选出的高校中进一步过滤不满足要求的学校。
假设已有整合数据:
1)上述步骤可以使用Excel或WPS的筛选功能完成;
2)对于“3+1+2”高考模式省份,可以借助整合数据同时考虑选科要求筛选学校。
原创 爱聊天的老张
本站(www.100xue.net)部分图文转自网络,刊登本文仅为传播信息之用,绝不代表赞同其观点或担保其真实性。若有来源标注错误或侵犯了您的合法权益,请作者持权属证明与本网联系(底部邮箱),我们将及时更正、删除,谢谢