简体中文 | English

独家 | 与SSAT研发总监面对面,解读9个你最关心的问题

2020年08月04日

给你最专业的解读

SSAT(Secondary School Admission Test),即美国私立中学入学考试,是申请美国、加拿大私立中学所必须具备的一个考试成绩。

如今,除了美国,越来越多国内的国际学校也在陆续把 SSAT 作为入学考试。然而今年在疫情之下,SSAT 考试又迎来了许多新的变动。

融尚南希伙伴很荣幸地请到了 EMA 北美私校理事会旗下 SSAT 私立中学理事会的考试和研发总监刘惊华博士,由融尚南希伙伴管理合伙人 Nini 对她进行了采访。

融尚南希伙伴管理合伙人&申请项目负责人
美国独立教育顾问协会 IECA 认证专业会员
全球领导力培训公益组织 JUMP! 董事会会员
泰伯学院 Tabor Academy 现任校董
普利斯顿大学本科,香港大学新闻及传媒研究中心硕士


刘惊华博士和 Nini 向大家问好

我们将采访内容分为音频和文字两种版本发布,希望能给你带来帮助。

img1.jpg

SSAT历史

Nini:请向大家介绍一下您作为考试研发总监在 EMA 主要的工作内容和职责。

刘惊华博士(以下简称“Dr. 刘”):我本科毕业于北大心理系,后来就读于 University of Missouri,取得教育和心理测量硕士和博士学位。上班之后又读了 Rutgers University 的 MBA 学位。我加入 EMA 之前,在 ETS 工作,主要负责 SAT 即大学入学考试方面的工作。我在2013年的时候加入了 EMA,现在是考试和研发总监。

我和我的团队目前负责所有 SSAT 的考试事宜:建构 SSAT 的内容大纲、考试难度、试题研发、审评和试题预测、组卷、试题分析以及进行标准分转换和报成绩。

另外,我的工作也包括学术研究方面:我的研究兴趣是考试公平性(Test Fairness)。最近在做的是大学和私立学校录取方面的研究:比如说近十年美国大学的录取趋势、学校录取过程中看重的是哪些因素和哪些标准等等。另外,我还做 Test Optional 方面的研究。

Nini:SSAT 现在不仅仅是美国的中考,很多国内的国际学校也在陆续把 SSAT 作为入学考试,请分享一下 SSAT 的起源和发展历程。

Dr. 刘:SSAT 诞生之前,美国的私校没有一个统一的标准化考试。因为申请者之间的竞争比较激烈,如果学生想申请十校联盟这类顶尖的私立学校,需要参加不同的学校设定的入学考试。这给考生造成了很大的不便,比如我听说过当时的学生需要乘火车去不同的学校参加不同的入学考试。

在这种环境下,美国的十校联盟希望建立一个 standard testing:用一个标准化考试对所有的考生进行考察,这样也能方便考生。在这种情况下,SSAT 应运而生。

1957年,当时的私校理事会和 ETS 合作开发了 SSAT 的考试。作为 SSAT 考试的奠基人,十校联盟和理事会联系很紧密,这些学校在录取学生的时候也要求学生进行 SSAT 考试。由于疫情影响,明年有一些学校的入学申请政策可能会发生变化。但是一直以来,顶尖的私立学校都十分看重申请者的 SSAT 成绩。

img2.jpg

SSAT研发时关注的点

Nini:您在 EMA 的职位可以算是 SSAT 背后的大脑,非常重要。而且您有国际化和多元化的成长和教育背景,所以您的认知以及对这个考试的思考点肯定跟别人不一样。我非常好奇想问问您在带领团队做 SSAT 研发的时候,最关注的点是什么?

Dr. 刘:这个问题可以写一本书,我只能泛泛谈一下。SSAT 的评估关键是批判性思维还有解决问题的能力。大家都知道 SSAT 由四大部分组成,有词汇、数学、阅读和写作部分。通过评估数理逻辑、词汇关系、阅读分析(小说与非小说的文章),来对这些技能进行评估。

另外强调一下 SSAT 的写作。尽管 EMA 不对写作进行打分,但是会把作文直接扫描发给学校。学校招办对写作是非常看重的。写作会用来进一步评估学生批判性思维。学生会拿到两个作文题目,首先要确定主题,决定采用哪一个。把主题确定以后,要把论点和论据综合在一起,并且在约25分钟的有限时间内,合理地呈现出来。

例如作文题目是你觉得学校应不应该禁止学生用手机,如果你说是的话,为什么,你的论据是什么;如果不是的话又是为什么,要提出替代方案等等。所以说 SSAT 的各个部分就提供了多点数据,评估和衡量学生这些关键性的技能。

SSAT 跟学生平时在学校的期中期末考试都不太一样。它不是一个 achievement test,不是你把一本书背会了或弄明白了就能考好成绩,而更多是测量考生的综合能力,尤其像词汇、阅读都需要常年的不断的积累。

另外因为我自己的背景,我会比较注重考试对国际生、对不同文化背景考生的公平性。大家知道美国文化有一些比较独特的部分,比如说它的度量衡制度跟我们平时所习惯的是不一样的。我在美国这么多年,每次去看病医生问我身高是多少,我脱口而出的还是用厘米作单位,有时候还要想一想,或者把我的驾照拿出来看看身高用英寸是多少,所以就很不方便。

如果考试的时候一个中国考生遇到关于度量衡转换的问题,把 feet(英尺)换成 inch(英寸)之类,如果对这个不熟悉的话,那就会受到影响。因为你不是不懂,而是没有这方面的背景。我以前上大学的时候做过一个研究,同样一道考察概率的数学题,如果把题干中的背景从棒球击中了多少,换成打篮球,那么国际学生答对这道题的概率是不一样的。说明即使有数学方面的知识,但是背景知识也会对考题有影响。

所以我们做这方面的研究,在后来出题的时候就会非常非常注意。即使有时候出题人疏忽把美国独特文化题目加进去了,但在审题的时候,我们有一个 SSAT 委员会,由各个私立学校的老师组成,他们在这方面都经过训练。我们的考试研发员也会着重接受这方面的训练,他们会很注意这类问题,对这些题目进行修改或者直接抽除去掉。

Nini:其实就是您刚才介绍自己背景的时候说到的一个公平性,确保这个考试测量的是学生的综合能力,而不是本身与生俱来或成长经历赋予的背景知识。

img3.jpg

疫情下的变革

Nini:疫情对全球各个行业的影响是无处不在的,特别是像美国的学校,同时,学校也都在进行创新,看有什么线上和线下的混合教学模式,能够在保障所有学生和老师安全的情况下学术也有保障。

今年6月底7月初的时候,当时有个新闻大家讨论的也比较多,就是有300多所大学,包括非常顶尖藤校的招办,联合出了一个声明,指出了在疫情下今年以及未来学校对学生评估层面的调整。其中第一个学校之前很在意的是学术能力,现在改成了 Self Care,其它还有四点内容(今天不细讲),这个是从大学层面的调整。融尚南希伙伴美国资深教育顾问 Patricia 还就此写过一篇美国留学局势判断的文章,点击可跳转相关阅读。

Nini:因此我也比较好奇,想问一下您,从中学层面,您的团队,针对 SSAT 的研发以及今年以及未来申请者在申请层面会不会有评估层面的调整?

Dr. 刘:好的。我先大致补充一下你刚提到的声明的 background。这是由哈佛教育学院发起的,各个高校联合签署的一个研究项目叫 Making Caring Common。这个项目的基本宗旨是倡导大学在招生的时候正式纳入对申请人 character(品性)的评估。这项研究到目前为止可以分为三部曲。

第一部是 2016 年发表的报告 Turning the Tide: Inspiring Concern for Others and the Common Good through College Admissions。这份报告的主旨是大学录取的时候应该激发对他人的关心,鼓励学生参与有意义的,长期的社区服务。

第二份报告发表于2019年3月份,Turning the Tide II: How Parents and High Schools can Cultivate Ethical and Reduce Distress in the College Admissions Process,倡导父母和中学如何在大学录取中培养学生道德品性以及给学生减压。

第三部就是今年6月份的报告,Care Counts in Crisis: College Admissions Deans Respond to COVID-19,是在疫情下大学招生的一项举措。这份报告提倡在危机中对他人的关心至关重要,比如自理能力、照顾生病的家人、服务于他人等等,在大学招生中应该都纳入考虑。

虽然大学在2016年就开始发这方面的声明,但其实大学在招生方面并没有一个非常量化的标准来衡量申请者的 character 品性。而且大多数大学普遍是没有面试的,只能通过读申请者的文书、推荐信等来判断学生的品性。

EMA 在2017年推出了 Character Skills Snapshot,评估包括考生的毅力,团队精神等,是一个相对比较客观的量化的工具。所以我们在这个方面是走在了高等教育前面。

Nini:CSS 也是您的团队主导研发的,从研发的过程中,CSS 和 SSAT 的研发逻辑,您的团队的一个出发点是?

Dr. 刘:CSS 和 SSAT 是互补的关系。美国私立中学或者大学都会强调 Holistic review(全方位评估),学校在招生时会评估学生的各个方面,比如学业方面的能力,SSAT 成绩,平时的成绩(GPA);大学会看 SAT、AP、课程难易度等;另外就是通过面试、推荐信、课外活动以及对社区的看重等,对学生品性方面进行评估。所以我们希望 CSS 在品性方面的考量能对 SSAT 提供一个互补!

img4.jpg

对于test-optional的趋势解读

Nini:今年部分学校因为疫情原因,变成了 test-optional,您认为这会是大趋势吗?针对中国学生,有没有什么建议?

Dr. 刘:有一些大学很早就采用 test-optional。中学原来没有,只是今年疫情原因,少部分高中也变成了 test-optional。但对于高中来说,毕竟今年才刚刚开始 test-optional,相应的数据样本和研究很少,所以我把解读的重点放在大学申请这部分。

今年,加州大学宣布采用 test-optional,并且要在未来5年研究出加州大学自己的入学测试,这个测试要满足一系列的条件。他们说的是,如果这个考试开发不出来,他们就会走向 test-blind,就是学校不要考试成绩,即便学生提交,学校也不会采纳。比如说,今年加州理工就是 test-blind。

那么,test-optional 是什么?首先要强调,test-optional 和 test-blind 不一样。Test-optional 不是意味着不用考试,而是学校不强制要求提交标化考试成绩。学校把选择和决定权交给了学生和家长,由学生和家长来自行决定是否考 SAT、ACT,是否把这些成绩提交给学校。

标化成绩在学术测量方面的意义是什么?标化成绩在预测大学成绩尤其是大一的 GPA 时,精准度非常高。College Board 大学理事会、ETS 考试中心、大学研究人员等等,都在这方面做了无数研究。研究表明,标化成绩对大一的 GPA、大学四年 GPA、完成大学四年教育方面,有很强的 prediction power 预测准确度。

标化成绩 VS 高中 GPA,哪一个在学术预测方面更强?往常,大部分学校会综合考虑标化和高中 GPA,并且曾经高中 GPA 比标化成绩有稍胜一筹的预测准确度。

但是,近年来美国高中 GPA 越来越有 inflation(水分)。每个人的 GPA 都越来越高,学生之间的 GPA 也越来越均衡,大家都是4.0就没有区分度。加上不同高中之间的学术难度太不一样了,没办法横向比较。所以标化成绩的预测准确度开始超过高中 GPA。比如加州大学自己的研究委员会今年发布的数据清楚地显示:标化成绩 (e.g., SAT) 比高中 GPA 能更好地预测加州大学学生大一的 GPA 和四年的 GPA。

这样的话,如果只看 GPA 就会有很大的问题。那么,既然有大量数据证实,标化考试能够很好地预测学生在大学能否成功,为什么大学还要采用 test-optional 呢?截止到7月初,有1250所4年制大学至少在2021年变成了 test-optional。

在我看来,绝大部分学校,尤其是藤校,是把 test-optional 作为对疫情最直接的应对方式。大学理事会 College Board 在疫情之初,说会有 SAT at home。但是后来又发声明说不会有 SAT at home,还是会尽量安排线下考试。目前受现在疫情形势影响,也不确定是否可以线下。

因此,College Board 就请求各个大学在考试方面的招生政策尽可能灵活,截止日期也越晚越好。所以,越来越多大学,比如哈佛、普林斯顿就变成了 test-optional。既然藤校都变成test-optional,其他一大批学校就很自然地跟着变成 test-optional了。

另外有些大学希望采用 test-optional 以招徕更多的生源。

img5.jpg

大学未来招生条件发展趋势

Nini:受到疫情影响,很多美国大学今年都采取了 test-optional 招生政策 (即不强制要求提交标化考试成绩),但从长远来看,大学招生是否会持续采取 test-optional 政策呢?

Dr. 刘:每一年,美国大学招生咨询委员会(NACAC)都会公布美国大学上一申请季的招生情况报告,其中包括了招生官对新生申请的要求以及每年的申请情况变化等等。

我收集过去十年 NACAC 公布的信息做过一个统计,看到大学招生官在考量申请者学术能力时,最为看重的是以下四项:高中课程难度、大学级别课程分数(如 AP 考试),标化考试成绩(SAT/ACT 考试)、高中阶段在校 Overall GPA。

img6.jpg

虽然高中阶段在校 Overall GPA 和课程难度在招生考量过程中占比最重,但我们很难确定地说未来大学会一直采取 test-optional 招生政策,毕竟标化考试成绩还是能够从一定程度上帮助招生官一目了然地通过同一项考试,也可以说是同一个平台,来横向比较众多申请人的学术表现。

img7.jpg

另外有些学校的 test-optional 政策,是针对 general admission,并不排除一些竞争激烈的专业要求申请人额外提交标化考试成绩的。

归根结底,如果希望冲刺顶尖的大学并且有机会被录取,是没有捷径可走的,通过标化考试、高难度课程、高中阶段 GPA 展现出优异的学术能力,还是必要条件之一。

所以我建议大家:特殊疫情之下,安全第一!如果能在安全的环境下进行考试,还是要争取拿到标化考试成绩。

img8.jpg

SSAT失误扣分

Nini:SSAT 的一个扣分机制和其他考试设置不太一样,答题中一旦出现失误是会进行倒扣分的。这种扣分机制设计的出发点您能跟我们分享一下吗?

Dr. 刘:SSAT 最早的设计研发是跟 ETS 合作,而当时 ETS 所有的考试像 SAT、后来的 TOEFL、GRE 都是要倒扣分的。这个设计的原理是为了防止学生做随机的猜测。比如说学生遇到一个考试共有100道题,每道题是 ABCDE 五个选项,如果说没有倒扣分从理论上来说随机猜测能够拿20分。

我们不希望考生进行这种随机猜测,这样等于20%的考试内容就会被浪费掉。不过我们也在考虑如果要进行 SSAT 改革和更新,这个方面也会算作是一个考虑内容。

Nini:那您觉得这个改革的可能性高吗?因为毕竟有利有弊,但确实现在其他的很多考试都没有倒扣分了。

Dr.刘:是的,现在绝大多数标化考试都不倒扣分了,而且不倒扣分可能会和学生习惯的学校考试更加吻合一些。但是我现在不想把话说满了,因为最起码近期内这项改革还没有提上日程。

所以同学们还是要好好复习,不要盲目地猜测。我们都会提建议“educated guess”,即先把很明显错误的答案排除掉,这样即使要猜也会增加猜对的几率。

img9.jpg

SSAT在家考

Nini:针对疫情的情况各个考试机构也推出了灵活测试的方式,我们关注到 SSAT 也推出了 SSAT at home 的政策,请问这一政策是针对疫情的短期政策还是会长期推行的呢?

Dr.刘:是的,我们推出了 SSAT at home 的政策,并且在7月21号成功完成了一批考试,这个政策是会长期推行的。

注:SSAT at home 目前在美国和加拿大开放

网站说明:https://www.ssat.org/testing/home/overview?from=groupmessage&isappinstalled=0

img10.jpg

SSAT诗歌测试

Nini:最后一个问题是关于诗歌的,因为您讲到 SSAT 测试孩子的综合能力,其实诗歌也是一个挺重要的部分,然后诗歌部分,像我们的 SSAT 老师、很多学生都会讲,这部分非常难,甚至对成年人来说都比较难,所以也想听听您在研发这个 SSAT 的过程之中,加入诗歌它背后的一个逻辑是什么?然后对于它的考试题材的一个选择,您关注的点在哪里?

Dr. 刘:Good Question(好问题)。对我来说,诗歌也很难! 我的女儿这个暑假就是选一个 summer course,就是关于诗歌的. 那是两个星期的课程,每天三个小时,学写 Shakespeare 的十四行诗,什么 AABB,感觉很头晕。因为我没有在美国教育下长大,所以对诗歌这块儿我比较欠缺。

其实,美国中学开设的英文课程中,诗歌占有一个非常重要的地位。SSAT 需要评估学生理解和欣赏诗歌的能力,所以把它纳入到考试的范畴之内。因为诗歌比我们平时这种平铺直叙的表达更有说服力,所以学生需要去了解是如何运用语言传达感情,而并不仅仅是陈述事实,或所谓的 information 的这样一个交流。

一种方法是通过使用诸如明喻和隐喻之类的文学手段。学生需要理解,例如“暴风雨”这样的词在字面上可以指暴风雨,但可以比喻或象征性地指代情感爆发或令人困惑的情况。

诗歌的语法也可能是一个挑战。在散文中,句子通常以主语-动词-宾语的词序构成(“The bird is singing a pretty tune”)。而在诗歌中,句子则以主语-宾语-动词词序构成(“The bird a pretty tune is singing”),或宾语-主语-动词词序(“A pretty tune the bird is singing”,甚至宾语--动词-主语词序(“A pretty tune is singing the bird”)。学生需要熟悉诗歌的这些特殊体裁,才能取得好成绩。

Nini:所以它的点就像您讲的,第一点其实是一个语言的运用的更加深刻的能力,不仅仅是阐述事实而已,而是表达感情。然后一些隐含的底层意思,看他是否能理解,所以这也是考验孩子的一个语言掌控能力;第二点也就是语感和理解能力。打破逻辑、打破语法,也是句子能否理解清晰的一个点。所以诗歌会永远留在 SSAT 考试里面的。

img11.jpg

SSAT与托福的区别,为何词汇难度高

Nini:我经常在跟进学生的反馈的时候听到如下的问题,托福和 SSAT 有什么区别?为什么我考了托福还要考 SSAT?为什么 SSAT 的测试这么难,好像和托福考试内容有很大的不同?

Dr. 刘:托福考试和 SSAT 考试的目的是不同的:托福是英语语言测试,是对于英语非母语的学生进行的语言方面的能力测试,考察的是学生在北美学术环境里的语言能力。但是 SSAT 是一项能力测试。两者的目的是不一样的。

所以 TOEFL 的词汇可能是我们日常生活会用到的,尤其在在大学校园的学术环境中会经常用到。SSAT 的词汇是经常出现在经典的英文文学和复杂的学术文章中。SSAT 的学术性会更强,会有很多生僻词,所以 SSAT 测试的难度会更高。

Nini:这些生僻词连美国人都很少用到,未来在高中用到的机会也很少,为什么还要考呢?未来也会一直保持这种趋势吗?

Dr. 刘:因为我们需要用一些足够难的题来保证考试的区分度,去区别真正能力高的学生。现在考生普遍都很优秀,所以需要有些特别难的题来增加考试的区分度。

从考试设计的角度来说,像阅读部分是读完文章后回答问题,基本属于中等难度题,极少会有特别简单或特别难的题。但是词汇是独立的题,没有上下文,所以相对来说就可以设计得特别简单或者特别难。所以词汇的考题也是帮助增加区分度的。

Nini:所以考试除了测评孩子的学术能力,也是从考试设计层面要区分出不同水平的孩子。

Dr. 刘:对。词汇还要考逻辑能力,两个词的逻辑关系是什么。词汇之所以难,是因为它不光考词语本身的理解,更考逻辑关系分析能力。

在线营销
live chat
在线客服系统
web对话
web聊天
客服软件
live chat
web对话
live chat