項目応答理論ソフト(BIGSTEPS v. 2.82) の使い方  2001.1.28

         筑波大学修士課程教育研究科英語教育コース 斉田智里

・ BIGSTEPSは、Item Response Theory (項目応答理論)のモデルのうち、
  One-Parameter Logistic Model、いわゆるRasch modelに対応するコン
  ピュータ・プログラムです。シカゴ大学のWright 氏とLinacre氏によって
  作られ、以前は有料で販売されていましたが、1998年からはfree software
  になりました。

・ http;//www.winsteps.com/bigsteps.htmから無料でダウンロードできます。
  マニュアルも無料で手に入ります。でもDOS版です。Windows 版でなければ
  イヤという方は、WINSTEPS($495)か別のソフトを購入して下さい。

・ BIGSTEPSを動かすために、data fileとcontrol fileを作成します。Equating
  (等化)をしたい場合には、さらにanchor fileを作成します。以下それぞれの
  作成方法について、修士論文で作成した実例で、簡単にご説明させていただきます。


1. Data Fileの作成

ITEMAN用に作成したdata fileが使えます。1行目から4行目までを削除して下さい。
5行目以降がBIGSTEPSのdata fileとなります。ITEMAN用data fileの作成については、
このHPの『項目分析ソフトの使い方』を参照して下さい。

Data fileの例;
10001A12141412314323134134243313243213143133431422324
10002A14141432244123334242343334431233143112431324323
10003A12414112324123332422342413231233131132411413234
10004A12343112344113324212242414124233143112431332334
10005A1234143232414313143424431324422X341132434121322

テキスト形式で保存して下さい。保存の際には、ファイル名のあとに,.datとつけて下さい。

2. Control Fileの作成

必須なものは黒、defaultのままは、赤にしています。"⇒"のあとに、少し説明を加えました。
はじめと終わり以外、中のコマンドの順序は自由です。

&inst ⇒始まりの記号
;USCALE=45.5

;UMEAN=500

UDECIM=3

STBIAS=Y


TABLES=1111111111111111111111 ⇒BIGSTEPSでは全部で22の表が出力されます。
                               必要な表に1、必要のない表に0を記入 
                               面倒なときには全部1

DISTRT=Y

IDELQU=N ⇒項目を削除しなければN, 削除する時はY


PFILE= 1999a.pf ⇒受験者能力推定値がこのファイルに書き込まれます。

;TARGET=Y

;LOCAL=Y


INUMB=Y

ASCII=Y

CSV= Y

IFILE=1999a.IF ⇒項目困難度推定値がこのファイルに書き込まれます。

TITLE="Ibaraki Test 1999 A" ⇒出力表に記載されるタイトル名

NAME1=1 ⇒受験者番号が1列目から始まる

NAMLEN=7 ⇒受験者番号の桁数は7

NI=46     ⇒全項目数は46

ITEM1=8 ⇒解答が始まるのは8桁目

DATA=1999a.dat  ⇒data file名

CODES=1234X ⇒解答は1,2,3,4か無答Xのいずれかである。

KEY1=2141412324123144231441313241233142134431424321 ⇒正答の選択肢

&end    ⇒終わりの記号

等化をする場合には、以下(例)をどこかに加えてください。

IAFILE=testab.anc ⇒anchor file 名

保存の際には、ファイル名のあとに、.cflとつけて下さい。


3. Anchor Fileの作成

Anchor Test Design (Hambleton, et al., 1990:128) によって作成された2つのテストを
等化する場合には、共通項目の番号と項目困難度推定値(事前の推定値)を入力します。

Anchor File の例

1 0.382

2 -0.435

8 0.296

9 -0.436

10 0.769

11 1.042

17 -0.208

18 0.833

19 -0.604

保存の際には、ファイル名のあとに、.ancとつけて下さい。


4. BIGSTEPSを起動

(1) 1〜3で作成したファイルは、BIGSTEPSと同じディレクトリーに入れておいて下さい。
(2) BIGSTEPSを起動すると、まずPlease enter name of BIGSTEPS control file⇒と
    聞かれますので、2で作成したcontrol file名を入力して下さい。.cflを忘れないように。
(3) 次にPlease enter name of report output file⇒と聞かれますので、output file名を
    入力して下さい。.outを忘れないように。
(4) 最後にExtra-specification?と聞かれますので、enterを押してください。
    データ処理が始まります。


5. OUTPUT FILEの読み方

BIGSTEPSでは、全部で22の表を作成してくれます。必要ないものも多いのですが、
ここではそのうち、大事な3つの表を取り上げます。

(1) Table 1.1 Distribution map(受験者能力推定値と項目困難度推定値の分布図)

・ 左が受験者能力推定値の分布図で、右が項目困難度推定値の分布図です。
  どちらも同じ尺度上で推定されています。これが、項目応答理論の強みです。

・ 左側の受験者能力推定値は、上にいくほど能力が高くなり、下にいくほど能力
  が低くなります。右側の項目困難度推定値は、上にいくほど、難しい項目になり、
  下にいくほど易しい項目になります。

・ 単位はlogitといわれているものです(詳しくはUser's Guideの115ページを参照して下さい。)

・ 項目困難度推定値の平均値を0にあわせて、個々人の受験者能力と個々の項目困難度が
  推定されています。ある受験者の能力推定値が、ある項目の困難度推定値と等しい時、
  その受験者は、その項目に50%の確率で正解することができます。

・ 以下のテストは、受験者能力の分布と項目困難度の分布とがきれいに一致している
  よいテストの例です。



(2) Table 3 Summaries of persons and items
  (受験者能力推定値と項目困難度推定値の総括表)

・ 上が受験者情報のまとめ、下が項目情報のまとめです。

・ SCOREは素点で、平均、標準偏差、最大値、最小値が計算されています。

・ MEASUREは、Rasch Modelに基づく受験者能力推定値、及び、項目困難度推定値です。

・I NFITとOUTFITは、モデルとデータの適合度を示す指標です。INFITは受験者能力推定値
  に近い項目の、OUTFITは遠い項目の、予測できない解答パターンに影響を受けやすい
  といわれています (User's manual, p99-100)。それぞれMNSQとZSTDの2種類の統計値が
  示されています。MNSQの値が、0.7〜1.3の間にあれば、またZSTDの値が,-2〜+2の間に
  あれば、データはモデルに合っていると考えられます(McNamara,1996: 173)。受験者数や
  項目数が多いときは、ZSTDの値は大きくなりすぎることがあるので、MNSQの値の方が
  安全です。

・ 受験者信頼性(person reliability)と項目信頼性(item reliability)の2つが推定されています。
  MODELは、信頼性係数の上限、REALは下限を示しています。Person reliabilityはKR-20
  やCronbach Alphaと同じ値です。
 
・ 最尤推定法では、満点と0点の受験者を除かなくては計算できず、ベイズ推定法では、
  除かなくても計算できます。この表では、その両方の推定法で計算された値が報告
  されています。


   
(3) TABLE 10 ITEM STATISTICS(項目困難度推定値一覧)

・ BIGSTEPSでは項目困難度推定値を、@難しい順、Aモデルとの適合度が悪い順、
  B通し番号順の3通りに出力してくれます。
・ 以下の例は適合度の悪い順に項目を並べた表です。INFITとOUTFITのMNSQの欄を見て、
  1.3以上は適合度が悪く、0.7以下は良すぎる項目と判断します。はじめから8項目ほどが
  モデルへの適合度が悪いことがわかります


5. その他留意点

・ BIGSTEPSに限らず、項目応答理論のモデルにデータを当てはめる前に、テストの1次元性の
  確認が必要です。テストの1次元性とは、テストが測ろうとしている能力は1つであるということ
  です。項目応答理論を適用する前提の1つです。もう1つの前提は、局所独立の前提です。
  ある項目の出来不出来が他の項目の出来不出来に影響を与えないということです。

・ 1次元性の確認のためには、様々な方法が提案されていますが (Hattie, 1985)、よく用いられる
  基準は、解答が○か×の10データの場合、各項目の「四分相関係数」(tetrachoric correlations)
  行列を因子分析し、第1因子が全体の分散の20%以上を説明しているというものです (Reckase, 1979)。
  そのためのコンピュータ・プログラムにはMicroFACT 1.0(Waller, 1995: ASSESSMENT SYSTEMS
  CORPORATION)などがあります。

6. 参考文献

 (1) 項目応答(or反応)理論について、以下の著書が参考になります。

「項目応答理論入門―言語テスト・データの新しい分析法―」大友賢二 1996.大修館書店

「Fundamentals of Item Response Theory」Hambleton, R.K., Swaminathan, H., & Rogers,
 H.J. 1990. SAGE.

「項目応答理論の基礎と応用」Hambleton, R.K. 野口裕之訳 Linn, R.(Eds.)教育測定学
 第3版.第4章 (pp. 211-281). 1989. American Council on Education.

「MEASURING SECOND LANGUAGE PERFORMANCE」McNamara, T.F. (1996). Longman.

「項目反応理論―基礎と応用―」芝 祐順編 1990. 東京大学出版会

「現代テスト理論」池田 央 1994. 朝倉書店

「組織心理測定論―項目反応理論のフロンティアー」渡辺直登・野口裕之編著 1999.
 白桃書房

 (2) BIGSTEPSv2.82を使って、茨城県高教研英語部作問委員会
  「茨城県高等学校英語学力テスト」のデータを分析しました。分析結果
  に基づき、ITEM BANKを作り、もともとのテスト項目を使って新たに4つのテ
  ストを作り、テストの等化を行いました。詳しくは、筑波大学教育研究科英語
  教育コース修士論文斉田智里(2002)をご覧いただけましたら幸いです。