アルカディア学報(教育学術新聞掲載コラム)
No.532
学修成果をどのように可視化していくのか
ルーブリックの可能性
第7期の中央教育審議会の審議がスタートした。教育再生実行会議の審議が先行する状況下で、中央教育審議会の議論がどのように展開していくのかが注目されるところであるが、本質的には“質保証”が中心的テーマであると言えよう。
産業界や政界からの大学への厳しい視線の背後には、日本の高等教育の学修成果が不十分であるという懐疑論がある。日本経済団体連合会の「新卒採用に関するアンケート調査」において、採用にあたっての重視点をみると、「コミュニケーション能力」(82.6%)や「主体性」(60.3%)が上位を占める中で、「学業成績」は7.6%となっており、23項目中16番目という低さで、ほとんど信頼されていないと言える。筆者が大学関係者を対象にしたあるワークショップで質問したところでは、自分の成績の付け方に自信がないと答えた参加者が六割以上に達していた。教員自身が学業成績に自信を持てないのならば、大学の成績評価への信頼の低さはやむを得ない側面がある。
欧米先進国では、学業成績とインターンシップの結果が採用を左右するのと比べ、日本では大学の成績は軽視されている。学業成績が産業界や社会から信頼され、評価されるようにすることは、質保証にとって必要条件の一つであると考えるが、これは一朝一夕に実現できることではない。
学修成果や質保証について、日本と同様に産業界や政府からの圧力が強い国の一つがアメリカである。近年、高い大学中退率を背景に、連邦政府は奨学金が中退によって“無駄”になることを財政的観点から問題視し、アクレディテーション団体を通じて、質保証が不十分な大学を奨学金支給対象から外すという圧力を強めている。中退率や卒業率といった定量的な指標もさることながら、各大学は自らの学修成果(Learning Outcome)を実証することを一層求められている。
学修成果の証明については、@直接的に標準化された外部テストなど定量化しやすい尺度を活用する方法A定性的で尺度化しにくいパフォーマンスを、観点・尺度を設定し可視化する方法B間接的に学生の経験などから評価する方法、以上の大きく三つの方法が考えられる。@については、CLA(Collegiate Learning Assessment)やETSPP(Educational Testing Service Proficiency Profile)などの外部テストがあり、州政府やアクレディテーション団体がこれらの方法を進めているケースも少なくない。Aの代表例がルーブリックである。AAC&U(Association of American Colleges and Universities)が作成した教養教育の内容16分野について、評価の観点・基準をまとめたVALUE RUBRICによって代表されるパフォーマンス評価の方法である。Bとしては、NSSE(National Survey of Student Engagement)、BCSSE(Beginning College Survey of Student Engagement)、WNS(Wabash National Survey)といった学修行動調査が知られており、これらの調査は山田礼子氏によって紹介され、日本でも既に北海道大学等を中心にコンソーシアムが形成され、活用され始めている。
Bについては、2013年度からアメリカのNSSEの調査項目が大幅に変更されたことが話題を呼んでいる。過去のデータとの比較ができないほどの大幅な変化は、大学関係者を驚かせたという。学生生活の中での様々な経験の有無を聞く部分が減少し、ハイ・インパクト・プラクティス(以下では「HIP」と呼ぶ)と呼ばれる教室外学修プログラムについて焦点をあてた項目が導入された。
HIPは、前述のAAC&Uがその効果を主唱していた、教室外での体験型教育プログラムの総称で、海外へのスタディ・アブロード、インターンシップ、地域社会の現実課題に取り組むサービスラーニングなどを指す。こうした教育プログラムが、コンピテンシーやジェネリック・スキルといった汎用的能力の育成に効果が高いことの認識が定着し、その結果、それまで定着していた学修行動調査の調査項目の見直しにつながったのであろう。こうした知見については、本年来日したAAC&U副会長のT・ローズ博士や、ワバシュ大学のC・ブライチ博士も指摘していた。
それ以上に筆者が驚いているのは、Aのルーブリック活用の広がりである。筆者は今年、アメリカでルーブリック評価を導入する大学を数カ所訪問したが、それらの大学がルーブリックを活用するようになった契機は、アクレディテーション団体からの評価についての改善勧告である。これらの大学の多くは、WEB上にアセスメント・プランをアップし、(@)大学レベル、(A)学科・科目レベル、(B)学生レベルなど対象レベルごとに、どのようなデータ(テスト、調査、ルーブリック等)を活用するのかを明確にし、どの時期にデータを収集して評価をまとめていくかというロードマップまで公表している。(@)や(A)の評価にあたっては、必ずしも全数調査での評価プランにはしていないが、(B)については全数調査で質保証を行うなどの方法をとっている。大学によっては、学生個人を特定してデータを保存し活用しているケースもあり、目的に応じた評価方法を戦略的に策定し、実施していると言えるだろう。
昨年8月に出された中央教育審議会の質的転換答申にある、「その(学修の)成果をプログラム共通の考え方や尺度(「アセスメント・ポリシー」)に則って評価し、その結果をプログラムの改善・進化につなげる」と書かれた方式が、実際に取り入れられ、機能している大学がアメリカには存在する。
ルーブリックは、(@)(A)(B)のすべてのレベルで活用可能な評価方法である。例えば、学士課程の総括的評価としてのレポートを複数名の教員チームで構成し、全卒業生についてルーブリックを用いて評価を行っているカールトン大学(ミネソタ州)や、大学としての到達目標8項目について、卒業までに全項目で最低水準以上のルーブリック評価を達成することを卒業要件のひとつとしているクレムソン大学(サウスカロライナ州)は、ルーブリックを用いた評価をすべての学生を対象に行っている。
ルーブリックは個別科目のための採点ルーブリックや科目評価の一部(ライティングやプレゼンテーションなど)として活用することも可能である。個々の学生の評価に用いるのみならず、サンプリングした受講生のレポートから科目やプログラム、さらには大学全体の教育を評価することにも活用されている。
筆者が紹介したこれらのケースを、アメリカの大学の典型例というつもりはなく、むしろ少数派であると言えるかもしれない。しかし、高等教育の質保証について、社会から可視化することが求められている中で、ルーブリックを活用し、定性的で見えにくかった成果を可視化する可能性は大きいのではないだろうか。
筆者の勤務する関西国際大学では、大学としてのディプロマポリシーの検証、学部・学科のプログラムの達成度の測定、さらには個別科目の評価や学生の成長のあり様について、共通ルーブリックを活用して評価し、記録しつつある。作成したルーブリックを実際に使ってみて、修正や専門分野や科目の性格を加味したカスタマイズも必要になってくる。手間はかかるかもしれないが、高等教育の質保証の信頼性を高める方法として、ルーブリックの可能性は大きいと考えられるのではないだろうか。