Mục lục
MỞ ĐẦU
1. Lý do chọn đề tài .8
2. Mục đích nghiên cứu .9
3. Giới hạn nghiên cứu 9
4. Phương pháp nghiên cứu .9
Chương 1. CƠ SỞ LÝ LUẬN VÀ TỔNG QUAN
1.1. Các khái niệm về chất lượng bộ đề thi trắc nghiệm .11
1.1.1. Các công cụ đo lường đánh giá kết quả học tập .11
1.1.2. Trắc nghiệm và những vấn đề liên quan 13
1.1.3. Độ tin cậy của bộ câu hỏi trắc nghiệm .19
1.1.4. Độ giá trị (hiệu lực) của bộ câu hỏi trắc nghiệm 24
1.2. Quy trình xây dựng bộ đề thi trắc nghiệm khách quan 26
1.2.1. Các quy tắc viết câu hỏi trắc nghiệm nhiều lựa chọn 26
1.2.2. Xây dựng bảng trọng số của môn học .31
1.2.3. Xây dựng ngân hàng đề thi trắc nghiệm môn học .32
Chương 2. PHƯƠNG PHÁP NGHIÊN CỨU
2.1. Những định hướng, trọng tâm nghiên cứu 34
2.1.1. Chuyên đề nghiên cứu thứ nhất 34
2.1.2. Chuyên đề nghiên cứu thứ hai 34
2.1.3. Chuyên đề nghiên cứu thứ ba .35
2.2. Thiết kế mẫu phiếu điều tra đối với giáo viên 35
Chương 3. XỬ LÝ SỐ LIỆU KẾT QUẢ THI TRẮC NGHIỆM
3.1. Xử lý số liệu kết quả thi TNKQ .39
3.1.1. Phân tích độ khó của item 39
3.1.2. Phân tích độ phân biệt của item .40
3.1.3. Đánh giá độ tin cậy của bài trắc nghiệm 42
3.1.4. Xử lý số liệu đề thi trên mô hình QUEST .48
3.1.5. Kết luận về độ giá trị của các bộ đề .52
3.2. Xử lý số liệu mẫu phiếu hỏi trong giảng viên 52
3.2.1. Đánh giá độ tin cậy của công cụ đo (mẫu phiếu hỏi) .52
3.2.2. Đánh giá về độ giá trị của công cụ đo và sự phù hợp
của mô hình các yếu tố ảnh hưởng đến chất lượng
bộ đề thi TNKQ qua xử lý phiếu hỏi .62
3.3. Kết luận về các yếu tố ảnh hưởng đến việc xây dựng
bộ đề TNKQ .62
KẾT LUẬN, ĐỀ XUẤT GIẢI PHÁP, KIẾN NGHỊ
4.1. Kết luận .71
4.2. Đề xuất giải pháp 73
TÀI LIỆU THAM KHẢO 74
PHỤ LUC
Phụ lục 1. File dữ liệu mon01.Itn 75
Phụ lục 2. File dữ liệu mon01.map 77
Phụ lục 3. Mẫu phiếu hỏi khảo sát giảng viên .81
81 trang |
Chia sẻ: lvcdongnoi | Lượt xem: 4152 | Lượt tải: 5
Bạn đang xem trước 20 trang tài liệu Đánh giá các yếu tố ảnh hưởng đến chất lượng các bộ đề thi trắc nghiệm khách quan tại Khoa Công Nghệ Thông tin - Đại học Thái Nguyên, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
.351
35.362
35.035
38.178
37.078
35.328
34.381
32.680
34.822
35.020
34.568
33.504
32.785
33.087
33.304
.234
.284
.159
.066
.160
.134
.328
.063
.386
.168
.030
.144
.263
.084
.269
.069
.438
.107
.178
.380
.201
.099
.300
.575
.546
.320
.416
.403
.668
.488
.604
.756
.778
.759
.760
.759
.759
.778
.761
.750
.759
.763
.772
.776
.763
.755
.760
.751
.761
.758
.781
.774
.761
.753
.741
.752
.755
.752
.748
.740
.745
.743
44
Tên
biến
Varia
ble
Điểm trung bình
của thang đo nếu
item bị xoá
Scale Mean if
Item Deleted
Phương sai của
thang đo nếu
item bị xoá
Scale Variance
if Item Deleted
Hệ số tương quan
của item với các
item còn lại
Corrected Item-
Total Correlation
Hệ số alpha
nếu item bị
xoá
Cronbach's
Alpha if Item
Deleted
c33
c34
c35
c36
c37
c38
v39
c40
c41
c42
c43
c44
c45
c46
c47
c48
c49
c50
c51
c52
c53
c54
c55
c56
c57
c58
c59
c60
42.00
42.31
42.23
42.62
41.98
42.08
42.38
42.12
42.00
42.12
42.62
42.54
42.02
42.00
42.62
42.25
42.25
42.12
42.02
42.48
42.15
42.04
41.98
42.15
42.04
42.15
41.98
41.98
35.412
33.982
33.710
37.457
35.156
33.680
34.908
33.241
35.020
33.712
32.908
34.998
33.862
34.196
33.849
33.407
33.407
35.398
35.353
34.372
34.172
36.038
35.862
35.388
35.763
36.015
35.862
36.015
.196
.330
.404
.274
.322
.544
.160
.591
.320
.485
.559
.150
.624
.586
.377
.453
.453
.117
.189
.253
.354
.008
.069
.107
.063
.017
.069
.063
.758
.752
.749
.776
.755
.746
.759
.743
.755
.747
.742
.759
.746
.748
.750
.747
.747
.760
.758
.755
.751
.763
.760
.761
.761
.765
.760
.761
45
Các thông tin về độ tin cậy của toàn bài trắc nghiệm được cho trong bảng sau
Bảng 3.2: Các thông số về độ tin cậy (Reliability Statistics)
Hệ số tin cậy
Cronbach's Alpha
Hệ số tin cậy trên các item chuẩn
Cronbach's Alpha Based on
Standardized Items
Số lượng item
N of Items
.805 .819 60
Qua phân tích số liệu trên bảng Output ta thấy đề thi trên dù còn có một
số câu hỏi (item) chưa được tốt song độ tin cậy của toàn bộ trắc nghiệm là
khá cao. Kết quả phân tích cho hệ số tin cậy của toàn trắc nghiệm α = 0,805
có nghĩa là 80,5% phương sai của điểm trắc nghiệm là phương sai của điểm
số thực và chỉ có 15,5% phương sai của điểm là do sai số ngẫu nhiên của
phép đo. Cũng bằng phép phân tích này, nhìn vào bảng 1 ta thấy, những item
có tương quan với các item còn lại là thấp (αi < 0.30) thì cần phải xem lại,
những item có tương quan qúa thấp (αi < 0) thì nên loại bỏ.
Bằng cách tương tự ta có kết quả tổng hợp về độ tin cậy của 50 đề thi
trong bảng dưới đây.
Bảng 3.3: Hệ số tin cậy Alpha Cronbach’s của 50 đề trắc nghiệm
Đề thi
Hệ số tin cậy
Cronbach's
Alpha
Hệ số tin cậy trên các item
chuẩn
Cronbach's Alpha Based on
Standardized Items
Số lượng item
N of Items
Đề số 1 .80 .819 60
Đề số 2 .78 .794 60
Đề số 3 .75 .760 60
Đề số 4 .60 .621 60
Đề số 5 .54 .554 60
Đề số 6 .35 .360 60
Đề số 7 .33 .345 60
Đề số 8 .84 .850 60
46
Đề số 9 .86 .872 60
Đề số 10 .65 .661 60
Đề số 11 .65 .655 60
Đề số 12 .58 .591 60
Đề số 13 .48 .492 60
Đề số 14 .47 .485 60
Đề số 15 .50 .512 60
Đề số 16 .73 .743 60
Đề số 17 .74 .750 60
Đề số 18 .70 .712 60
Đề số 19 .69 .700 60
Đề số 20 .47 .485 60
Đề số 21 .50 .512 60
Đề số 22 .73 .743 60
Đề số 23 .74 .750 60
Đề số 24 .70 .712 60
Đề số 25 .69 .700 60
Đề số 26 .35 .360 60
Đề số 27 .33 .345 60
Đề số 28 .35 .360 60
Đề số 29 .33 .345 60
Đề số 30 .84 .850 60
Đề số 31 .86 .872 60
Đề số 32 .65 .661 60
Đề số 33 .65 .655 60
Đề số 34 .58 .591 60
Đề số 35 .80 .812 60
Đề số 36 .81 .821 60
Đề số 37 .65 .661 60
Đề số 38 .65 .655 60
Đề số 39 .58 .591 60
Đề số 40 .80 .812 60
Đề số 41 .81 .821 60
Đề số 42 .54 .554 60
Đề số 43 .35 .360 60
Đề số 44 .33 .345 60
Đề số 45 .84 .850 60
Đề số 46 .86 .872 60
Đề số 47 .65 .661 60
Đề số 48 .65 .655 60
Đề số 49 .70 .712 60
Đề số 50 .69 .700 60
47
3.1.4. Xử lý số liệu đề thi trên mô hình QUEST
Phần trên chúng tôi đã dùng phần mềm SPSS để xử lý số liệu kết quả thi,
tương tự ta cũng có thể sử dụng mô hình RASCH trên phần mềm chuyên
dụng QUEST để phân tích, đánh giá kết quả các bài thi trắc nghiệm.
Ví dụ xử lý số liệu cho đề thi của môn Thông tin quang (ký hiệu Môn 1).
Để chạy được phần mềm QUEST, ta nhất định phải có file PFE.EXE và
file QUEST.EXE, file SPSS.sav chứa dữ liệu bằng số của kết quả thi.
Tạo file MON1.dat
- Từ cửa sổ file MON1.sav, dùng menu file, chọn Save as, xuất hiện cửa
sổ lệnh Save Data As.
- Tại cửa sổ Save Data As, Chọn mục Save as type.
- Chọn FixedASCII(*.dat). Gõ vào tên MON1. sau đó chọn Save.
- Trong PFE.EXE, mở open ta thấy file MON1.DAT.
Tạo file mon1.ctl
- Từ file PFE.EXE, mở cửa sổ mới, nhập vào đoạn lệnh sau:
set width=132!page
DATA_FILE MON01.DAT
CODES 01
FORMAT NAME 1 ITEMS 9-68
SCALE 1-60! MON01
ESTIMATE !iter=50; SCALE=MON01 >-MON01.out
SHOW ! SCALE=MON01 >-MON01.map
SHOW ITEMS ! SCALE=MON01 >-MON01.itm
SHOW CASES ! SCALE=MON01; form=export;delimiter=tab >-
MON01.cas
ITANAL ! scale=MON01 >-MON01.ITn
Quit
48
Thực hiện ghi lại (chọn nút ghi) ta có file điều khiển mon1.ctl
Vào file PFE.EXE, chọn Open, mở file MON1.map, ta có bảng sau
Bảng 3.4: Phân bố tương quan giữa độ khó của đề và năng lực học sinh.
QUEST: The Interactive Test Analysis System
-------------------------------------------------------------------------------------------
Item Estimates (Thresholds)
all on mon01 (N = 54 L = 60 Probability Level= .50)
3.0 |
|
|
|
NăNG LỰC CAO | ĐỘ KHó CAO
X |
|
XX |
XX | 44
2.0 | 15 37 48
XXXX | 8
XX | 45
X | 23
XXXXXX |
X |
|
|
XXXXXXXXX | 30 53
1.0 XXX |
XXX | 3 32 40
X |
XXX | 14 22 26 35
XXXXXX | 24
XXX | 6
| 21 50 54
| 49 57
| 20 36
.0 X | 4 11 25 31 39 55 59
X | 13
|
XX | 17 43
| 51 58
| 33 41
| 5 52 56
| 9 16 19 46 60
|
X | 7
-1.0 |
| 18 28 29 34 38 47
|
| 1 12 42
|
| 27
|
|
| 10
-2.0 |
|
|
| 2
|
NăNG LỰC THấP | Độ KHó THấP
|
|
-3.0 |
-----------------------------------------
Each X represents 1 students
Ta cũng thấy đây là một đề có độ khó thấp (đề tương đối dễ). Phân bố
kết quả thi gần với phân bố chuẩn. Các item có độ khó cao nhất (item 15, 27,
44, 48) cũng chưa vượt quá năng lực cao nhất của sinh viên tham gia trắc
nghiệm. Các item có độ khó quá thấp (item 2, 10, 27) nên loại bỏ vì không
phân biệt được năng lực của sinh viên.
49
Để thấy rõ phân bố của các item, ta xem xét bảng sau:
Bảng 3.5: Phân bố các item trong khoảng cho phép (infit mean square)
----------------------------------------------------------------------------------------------------------------
all on mon01 (N = 54 L = 60 Probability Level= .50)
----------------------------------------------------------------------------------------------------------------
MNSQ .63 .67 .71 .77 .83 .91 1.00 1.10 1.20 1.30 1.40
----------+---------+---------+---------+---------+---------+---------+---------+---------+---------+---------+-
1 item 1 . | * .
2 item 2 . | * .
3 item 3 . | * .
4 item 4 . | * .
5 item 5 . * | .
6 item 6 . | * .
7 item 7 . * | .
8 item 8 . | . *
9 item 9 . | * .
10 item 10 . * | .
11 item 11 . * | .
12 item 12 . * | .
13 item 13 . * | .
14 item 14 . | . *
15 item 15 . | * .
16 item 16 . |* .
17 item 17 . * | .
18 item 18 . * | .
19 item 19 . * | .
20 item 20 . * | .
21 item 21 . |* .
22 item 22 . | . *
23 item 23 . | * .
24 item 24 . *| .
25 item 25 . *| .
26 item 26 * | .
27 item 27 . * | .
28 item 28 . |* .
29 item 29 . * .
30 item 30 . * | .
31 item 31 . * | .
32 item 32 . * | .
33 item 33 . * | .
34 item 34 . | * .
35 item 35 . * | .
36 item 36 . * | .
37 item 37 . | . *
38 item 38 . * | .
39 item 39 . * | .
40 item 40 . | * .
41 item 41 . * | .
42 item 42 . * | .
43 item 43 . * | .
44 item 44 . * | .
45 item 45 . | * .
46 item 46 . * | .
47 item 47 . * | .
48 item 48 . * | .
49 item 49 . * | .
50 item 50 . * | .
51 item 51 . | * .
52 item 52 . * | .
53 item 53 . * | .
54 item 54 . * | .
55 item 55 . * | .
56 item 56 . *| .
57 item 57 . | * .
58 item 58 . |* .
59 item 59 . | * .
60 item 60 . *| .
Nhìn vào Bảng 3.5 ta thấy, các item 8, 14, 22, 37 mặc dù có độ khó hợp
lý nhưng lại nằm ngoài khoảng cho phép (infit mean square) hay có thể nói
không tương thích với toàn thang đo nên cần xem xét lại.
Để thấy rõ hơn các thông số đo lường của từng item, ta phân tích bảng
Results for Observed Responses trong file mon1.itn
50
Bảng 3.6: Các thông số đo lường của từng item trong file mon1.itn
QUEST: The Interactive Test Analysis System
...........................................................................................
Item 6: item 6 Infit MNSQ = 1.05
Disc = .22
Categories 0 1 missing
Count 19 33 0
Percent (%) 36.5 63.5
Pt-Biserial -.22 .22
p-value .058 .058
Mean Ability .85 1.24 NA
Step Labels 1
Thresholds .49
Error .30
...........................................................................................
Item 7: item 7 Infit MNSQ = .97
Disc = .31
Categories 0 1 missing
Count 7 45 0
Percent (%) 13.5 86.5
Pt-Biserial -.31 .31
p-value .013 .013
Mean Ability .54 1.18 NA
Step Labels 1
Thresholds -.92
Error .42
...........................................................................................
Item 8: item 8 Infit MNSQ = 1.40
Disc = -.28
Categories 0 1 missing
Count 35 17 0
Percent (%) 67.3 32.7
Pt-Biserial .28 -.28
p-value .023 .023
Mean Ability 1.24 .79 NA
Step Labels 1
Thresholds 1.88
Error .31
...........................................................................................
Trong Bảng 3.6 (minh hoạ các tham số của 3 item: 6; 7; 8), ta thấy các
item 6; 7 có độ phân biệt tương ứng là Disc = 0,22; 0,31 đều nằm trong
khoảng cho phép. Riêng item 8 có độ phân biệt Disc = - 0,8 (D < 0), chứng tỏ
đây là câu có vấn đề, cần loại bỏ.
51
3.1.5. Kết luận về độ giá trị của các bộ đề
Việc đánh giá độ giá trị của các bộ đề trên cả bốn góc độ: “Độ giá trị nội
dung”; “Độ giá trị cấu trúc”; “Độ giá trị tiêu chuẩn” và “Độ giá trị dự báo” là
một bài toán quá phức tạp. Trong phạm vi nghiên cứu của luận văn, chúng tôi
chỉ đề cập đến yếu tố “Độ giá trị nội dung” và “Độ giá trị cấu trúc”.
- Có thể nói nội dung và cấu trúc của các bộ đề đã được đánh giá sơ bộ
(một cách định tính) bằng phương pháp chuyên gia qua sự thẩm định của
chính người ra đề cũng như nhóm môn học.
- Bằng các kỹ thuật phân tích trên phần mềm SPSS hay QUEST, chúng
tôi đã chỉ ra các yếu tố (mang tính định lượng) quyết định đến độ giá trị của
bộ đề, đó là:
+ “Độ tin cậy” của bộ đề qua hệ số Cronbach’s alpha.
+ Hệ số tương quan của mỗi item đối với toàn bộ các item còn lại.
+ Ma trận tương quan giữa các item trong cùng một trắc nghiệm.
+ Sự phù hợp giữa độ khó của trắc nghiệm đối với năng lực của sinh
viên tham gia làm trắc nghiệm.
+ Tính đồng nhất của các item trong cùng một trắc nghiệm.
Cả 5 thông số trên đều phản ánh độ giá trị của trắc nghiệm, trong đó hệ số
tin cậy Cronbach’s coefficent alpha có thể coi là trội hơn cả và dễ được định
lượng nhất (càng lớn càng tốt). Do đó trong tính toán, phân tích kỹ thuật, chúng
tôi cũng lấy đây là thông số chính để đánh giá chất lượng của trắc nghiệm.
3.2. Xử lý số liệu mẫu phiếu phỏng vấn (phiếu hỏi) trong giảng viên
3.2.1. Đánh giá độ tin cậy của công cụ đo (mẫu phiếu hỏi)
Trên cơ sở mẫu phiếu đánh giá các yếu tố ảnh hưởng đến chất lượng các
bộ đề thi TNKQ đã nêu ở trên, chúng tôi đã tiến hành phỏng vấn và lấy phiếu
đối với 50 giáo viên trực tiếp soạn thảo 50 bộ đề của 50 môn học áp dụng thi
TNKQ hết học phần. Kết quả cụ thể như sau.
52
Nếu ta quy đổi thang bậc các mức đồng ý của các phiếu hỏi thành điểm
số tương ứng với 5 mức điểm từ 0 đến 4 (chú ý các item với phát biểu ngược
chiều lấy giá trị điểm ngược lại), ta sẽ có bảng các điểm số của phiếu hỏi. Về
mặt ý nghĩa đo lường, các phiếu hỏi cho điểm số tổng cộng cao sẽ tương ứng
với các cá nhân có các yếu tố thuận lợi cho việc xây dựng đề trắc nghiệm,
ngược lại các phiếu hỏi có điểm số tổng cộng thấp sẽ tương ứng với các cá
nhân có các yếu tố kém thuận lợi cho việc xây dựng đề trắc nghiệm. Các
phiếu có phân bố điểm tổng cộng từ 43 đến 94 điểm (điểm tối đa có thể là
120 điểm) cho thấy phân bố điểm rất rộng chứng tỏ các cá nhân tham gia xây
dựng đề trắc nghiệm trong các điều kiện rất khác nhau và nhận thức quan
điểm cũng rất khác nhau.
Tiến hành xử lý số liệu trên phần mềm SPSS ta nhận thấy:
Đánh giá độ tin cậy của trắc nghiệm bằng phương pháp đánh giá độ phù
hợp của từng item (internal consistency methods) sử dụng mô hình
Cronbach’s Coefficent Alpha. Mô hình này đánh giá độ tin cậy của phép đo
dựa trên sự tính toán phương sai của từng item trong toàn phép đo và tính
tương quan điểm của từng item với với điểm tổng của các item còn lại của
phép đo. Phương pháp này thích hợp cho việc xác định độ tin cậy của các loại
trắc nghiệm có các item nhiều mức độ tính theo điểm số (kiểu thang định
khoảng hay thang định tỷ lệ).
Công thức tính như sau:
Rxx = )1(1 2
2
x
i
K
K
σ
σα ∑−−= . Trong đó
Rxx : Hệ số tương quan
K : Số các item của trắc nghiệm
σ2i : Giá trị phương sai của từng item cụ thể của trắc nghiệm
σ2x : Giá trị phương sai của toàn trắc nghiệm
53
∑ σ2i : Tổng các giá trị phương sai của tất cả các item của trắc nghiệm
Thực hiện: Sử dụng mô hình Cronbach’s Coefficent Alpha đánh giá độ
tin cậy của phép đo các yếu tố ảnh hưởng đến chất lượng bộ đề trắc nghiệm
khách quan. Mô hình này đòi hỏi phép đo phải có phân bố chuẩn (hoặc gần
chuẩn), có các item được tính theo thang định khoảng.
Sử dụng mô hình đo với 30 biến, gồm ba biến trong nhóm thời gian (từ
tg1 đến tg3), ba biến trong nhóm động cơ (từ đc1 đến đc3), 16 biến trong
nhóm kỹ thuật (từ kt1 đến kt16), 3 biến trong nhóm quan tânm (từ qt1 đến
qt3) và 3 biến trong nhóm môn học (từ mh1 đến mh3). Số mẫu sử dụng là 50
(50 cá thể giáo viên được hỏi ý kiến)
Chọn Analyze \ Scale \ Reliability như hình vẽ.
Hình 1: Các thao tác trong thủ tục Reliability trong SPSS
Kết quả tại Out put ta có bảng:
Hình 3.1: Thủ tục Analyze \ Scale \ Reliability trong file SPSS.sav
54
Kết quả qua xử lý số liệu, ta có bảng hệ số tin cậy.
Bảng 3.7: Hệ số tin cậy của từng item trên mẫu 50 giáo viên (N = 50).
Tên biến
Variable
Điểm trung bình
của thang đo nếu
item bị xoá
Scale Mean if
Item Deleted
Phương sai của
thang đo nếu item
bị xoá
Scale Variance if
Item Deleted
Hệ số tương quan
của item với các
item còn lại
Corrected Item-
Total Correlation
Hệ số alpha nếu
item bị xoá
Cronbach's
Alpha if Item
Deleted
tg1
tg2
tg3
dc1
dc2
dc3
dc4
dc5
kt1
kt2
kt3
kt4
kt5
kt6
kt7
kt8
kt9
kt10
kt11
kt12
kt13
kt14
kt15
kt16
qt1
qt2
qt3
mh1
mh2
mh3
diemtong
142.68
142.38
143.20
142.10
141.84
141.94
146.22
144.60
142.24
142.10
142.52
142.52
142.00
142.26
142.36
142.68
143.14
143.14
142.82
142.46
146.50
146.14
144.78
144.78
142.84
142.52
143.08
143.00
142.34
142.84
72.78
1108.834
1093.424
1072.531
1102.827
1117.239
1122.262
1079.644
1023.388
1119.002
1102.827
1085.357
1127.479
1107.633
1114.033
1085.990
1117.651
1123.837
1150.204
1100.967
1090.131
1064.867
1054.694
1017.644
986.624
1108.096
1094.500
1128.687
1126.571
1123.494
1108.096
283.032
.521
.521
.839
.521
.484
.293
.879
.814
.409
.869
.897
.122
.726
.390
.804
.655
.241
.542
.639
.854
.958
.868
.905
.909
.789
.716
.094
.158
.200
.789
.760
.746
.742
.737
.744
.748
.749
.738
.725
.748
.744
.740
.750
.745
.747
.740
.748
.750
.756
.744
.741
.735
.732
.723
.716
.745
.742
.751
.750
.750
.745
.937
55
56
Nhận xét:
Từ bảng 3.7 ta nhận thấy, hầu hết các item từ tg1 đến mh3 đều có tương
quan khá chặt với các item còn lại của thang đo (R ≥ 0.30 được coi là thích
hợp). Như vậy hầu hết các item đều phù hợp, tức là điểm của các item có
tương quan đáng kể với tổng điểm của các item còn lại. Điều này có nghĩa là
các item của từng phép đo có tính đồng nhất và đều đóng góp cho độ tin cậy
của toàn phép đo (phép đo Tổng điểm).
Ta còn có thể phân tích độ tin cậy của phép đo dựa trên phiếu trả lời trắc
nghiệm qua một đánh giá khác. Đó là dựa vào bảng ma trận tương quan giữa
các yếu tố (item) trong thang đo với nhau.
Sử dụng thủ tục phân tích Data Reduction trong phần mềm SPSS
Chọn Analyze \ Data Reduction \ Facter
Tại Output ta có bảng sau.
57
tg1
tg2 .84
tg3 0.7 .6
dc1 .1 52 .6
Tg1 Tg2 Tg3 dc1 Dc2 Dc3 Dc4 Dc5 Kt1 Kt2 Kt3 Kt4 Kt5 Kt6 Kt7 Kt8 Kt9 Kt10 Kt11 Kt12 Kt13 Kt14 Kt15 Kt16 Qt1 Qt2 Qt3 Mh1 Mh2 Mh3
1
0 1
0 1
0 7 0. 0 1
dc2 0.48 0.14 0.48 0.32 1
dc3 0.65 0.26 0.74 0.06 0.66 1
dc4 0.76 0.83 0.77 0.62 0.31 0.46 1
dc5 0.64 0.64 0.58 0.36 0.29 0.42 0.78 1
kt1 0.65 0.26 0.74 0.06 0.66 0.55 0.46 0.42 1
kt2 0.17 0.52 0.6 0.45 0.34 0.06 0.62 0.36 0.06 1
kt3 0.56 0.67 0.91 0.78 0.26 0.41 0.78 0.53 0.41 0.78 1
kt4 0.21 0.22 0.36 0.29 0.29 0.08 0.26 0.12 0.08 0.29 0.44 1
kt5 0.21 0.48 0.53 0.82 0.09 -0.1 0.56 0.3 0.43 0.82 0.78 0.5 1
kt6 0.72 0.68 0.47 0.07 0.25 0.2 0.53 0.44 0.2 0.07 0.52 0.25 0.28 1
kt7 0.84 0.79 0.95 0.54 0.4 0.65 0.84 0.64 0.65 0.54 0.9 0.33 0.49 0.67 1
kt8 0.5 0.52 0.48 0.34 0.34 0.25 0.52 0.41 0.25 0.34 0.5 0.19 0.42 0.72 0.52 1
kt9 0.65 0.2 0.63 -0.1 0.76 0.81 0.38 0.34 0.81 -0.1 0.38 0.28 0.1 0.4 0.56 0.31 1
kt10 0.35 0.24 0.46 0.15 0.39 0.26 0.29 0.13 0.26 0.15 0.48 0.78 0.38 0.38 0.46 0.2 0.47 1
kt11 0.53 0.31 0.92 0.39 0.56 0.73 0.56 0.41 0.73 0.39 0.81 0.4 0.47 0.41 0.81 0.38 0.76 0.55 1
kt12 0.28 0.43 0.74 0.76 0.09 0.38 0.57 0.4 0.38 0.76 0.77 0.14 0.45 0.31 0.68 0.56 0.05 0.15 0.59 1
kt13 0.6 0.78 0.78 0.83 0.25 0.29 0.83 0.57 0.29 0.83 0.89 0.38 0.82 0.54 0.8 0.73 0.26 0.33 0.58 0.73 1
kt14 0.29 0.39 0.53 0.53 0.05 0.29 0.47 0.34 0.29 0.53 0.54 0.13 0.38 0.32 0.5 0.59 0.11 0.14 0.4 0.69 0.62 1
kt15 0.35 0.24 0.46 0.15 0.39 0.26 0.29 0.13 0.26 0.15 0.48 0.78 0.38 0.38 0.46 0.2 0.47 0.36 0.55 0.15 0.33 0.14 1
kt16 0.65 0.26 0.74 0.06 0.66 0.34 0.46 0.42 0.35 0.06 0.41 0.08 0.44 0.2 0.65 0.25 0.81 0.26 0.73 0.38 0.29 0.29 0.26 1
qt1 0.84 0.87 0.8 0.58 0.4 0.43 0.86 0.63 0.43 0.58 0.84 0.43 0.7 0.68 0.88 0.59 0.53 0.46 0.64 0.45 0.89 0.42 0.46 0.43 1
qt2 -0.1 0.17 0.52 0.78 0.33 0.35 0.36 0.16 0.36 0.78 0.73 0.34 0.78 0.21 0.41 0.5 0.32 0.27 0.52 0.77 0.69 0.54 0.27 0.32 0.38 1
qt3 0.5 0.11 0.44 0.45 0.89 0.66 0.28 0.37 0.66 0.35 0.2 0.27 0.04 0.31 0.37 0.38 0.82 0.37 0.55 0.02 0.21 0.02 0.37 0.66 0.38 0.42 1
mh1 0.84 0.87 0.8 0.58 0.4 0.43 0.86 0.63 0.43 0.58 0.84 0.43 0.7 0.68 0.88 0.59 0.53 0.46 0.64 0.45 0.89 0.42 0.46 0.43 0.60 0.38 0.38 1
mh2 0.65 0.2 0.63 0.43 0.76 0.81 0.38 0.34 0.81 0.35 0.38 0.28 0.1 0.4 0.56 0.31 0.43 0.47 0.76 0.05 0.26 0.11 0.47 0.81 0.53 0.37 0.82 0.53 1
mh3 0.84 0.87 0.8 0.58 0.4 0.43 0.86 0.63 0.43 0.58 0.84 0.43 0.7 0.68 0.88 0.59 0.53 0.46 0.64 0.45 0.89 0.42 0.46 0.43 0.52 0.38 0.38 0.52 0.53
Bảng 3.8: Ma trận tương quan của các item qua xử lý phiếu hỏi
Nhìn vào Bảng 3.8, ta nhận thấy:
Hầu hết tương quan giữa các item (30 item từ tg1 đến mh3) đều có trị số lớn
hơn 30%. Điều đó chứng tỏ các item trong phiếu trắc nghiệm có tương quan chặt
với nhau và đây là một công cụ đo có độ tin cậy đảm bảo cho phép đánh giá các
điều kiện thuận lợi cho một giáo viên khi xây dựng bộ đề thi trắc nghiệm.
Có thể đánh giá độ tin cậy và phân tích mẫu các phiếu hỏi bằng mô hình
RASCH trên phần mềm QUEST. Trong phạm vi này chúng tôi chỉ nghiên cứu
trên nhóm các item trong thang đo hẹp, cụ thể là phân tích các item trong thang
đo thứ ba: “Mức độ nắm vững kỹ thuật ra đề trắc nghiệm của giảng viên”.
- Tạo file dữ liệu. dat
+ Từ file dữ liệu PHIEU.sav, vào file chọn save as. Xuất hiện cửa sổ
lệnh Save as
+ Trong mục Save as type, chọn FixedASCII(*.dat), gõ vào PHEU
+ Save.
- Trong PFE.EXE, mở open ta thấy file PHIEU.DAT
- Tạo file ctl
+ Trong PFE.EXE, mở file mới.
+ Gõ vào cửa sổ đoạn lệnh.
set width=132!page
DATA_FILE PHIEU.DAT
CODES 01234
FORMAT NAME 1-2 ITEMS 3-18
58
SCALE 1-16! PHIEU
ESTIMATE !iter=50; SCALE=PHIEU >-PHIEU.out
SHOW ! SCALE=PHIEU >-PHIEU.map
SHOW ITEMS ! SCALE=PHIEU >-PHIEU.itm
SHOW CASES ! SCALE=PHIEU; form=export;delimiter=tab >-
PHIEU.cas
ITANAL ! scale=PHIEU >-PHIEU.ITn
Quit
+ Chọn nút ghi, ta có file phieu.ctl
- Trong PFE.EXE, mở open ta thấy có file phieu.ctl
- Từ cửa sổ Quest.exe, ta gõ lệnh
Submit phieu.ctl ENTER
- Trong PFE.EXE, mở open ta thấy có file phieu.map
- Chạy file PHIEU.map để phân tích câu hỏi.
59
Bảng 3.9: Ma trận phân bố của các item phiếu hỏi trong file Phieu.map
QUEST: The Interactive Test Analysis System
------------------------------------------------------------------------------------------------------------
------------------------
Item Estimates (Thresholds)
28/12/ 9 10:22
all on phieu (N = 52 L = 16 Probability Level= .50)
------------------------------------------------------------------------------------------------------------
5.0 |
|
|
|
| 11.4
4.0 |
|
| 3.4
|
|
|
3.0 |
X |
|
XXXX |
|
2.0 |
X |
|
XX |
XXXXXXX | 1.4 16.2
| 12.4
1.0 XX |
XXXX | 9.3
XXXXXXXX | 2.4 4.4 11.3 15.4
| 6.4
XXX | 13.4 14.3
.0 X | 3.3 5.4 7.4 8.3 10.4
|
XX |
XX |
|
X |
-1.0 |
XXXXX | 12.3
|
XXXX |
|
-2.0 X |
|
|
|
X |
|
-3.0 |
X |
|
|
|
-4.0 |
| 4.3 7.3 10.3 13.3 15.3
|
|
|
|
-5.0 |
------------------------------------------------------------------------------------------------------------
------------------------
Each X represents 1 students
60
Sự phân bố giữa mức độ đồng ý của giáo viên được hỏi so với mức độ yêu
cầu của item trong phiếu hỏi là tương đối phù hợp. Phân bố có hình chuông gần
đối xứng qua trục của bảng phân bố.
Để thấy rõ hơn, ta phân tích Bảng 3.10.
Bảng 3.10: Phân bố của các item trong phiếu hỏi
trong khoảng cho phép (infit mean square)
QUEST: The Interactive Test Analysis System
----------------------------------------------------------------------------------------------------------------------------------
Item Fit 28/12/ 9 10:22
all on phieu (N = 52 L = 16 Probability Level= .50)
----------------------------------------------------------------------------------------------------------------------------------
INFIT
MNSQ .63 .67 .71 .77 .83 .91 1.00 1.10 1.20 1.30 1.40 1.50 1.60
----------+---------+---------+---------+---------+---------+---------+---------+---------+---------+---------+---------+
1 item 1 . * | .
2 item 2 . * | .
3 item 3 . * .
4 item 4 . * | .
5 item 5 . * | .
6 item 6 . | .*
7 item 7 . * | .
8 item 8 . | * .
9 item 9 . * | .
10 item 10 . * .
11 item 11 . *| .
12 item 12 . | * .
13 item 13 . | * .
14 item 14 . | . *
15 item 15 . * | .
16 item 16 . * | .
=============================================================================
Nhìn vào bảng ta thấy, hầu hết các item trong tiểu thang đo “Mức độ được
trang bị kỹ thuật ra đề TN” đều nằm trong khoảng cho phép (infit mean square).
Duy chỉ có hai item 6 và 14 là nằm ở ngoài khoảng (chứng tỏ có vấn đề). Theo
chúng tôi, đây là hai câu hỏi có đề cập đến các khái niệm kỹ thuật cao nên một
số người được hỏi chưa nắm được bản chất vấn đề được hỏi.
61
3.2.2. Đánh giá về độ giá trị của công cụ đo và sự phù hợp của mô hình
các yếu tố ảnh hưởng đến chất lượng bộ đề thi TNKQ qua xử lý phiếu hỏi
Tương tự như xem xét độ giá trị của các bộ đề trắc nghiệm [trong phần
3.1.5], độ giá trị của mẫu phiếu hỏi cũng được đánh giá qua các yếu tố:
+ “Độ tin cậy” của phiếu hỏi qua hệ số Cronbach’s Alpha.
+ Hệ số tương quan của mỗi item đối với toàn bộ các item còn lại trong
phiếu hỏi.
+ Ma trận tương quan giữa các item trong cùng một phiếu hỏi.
+ Sự phù hợp giữa mức độ đánh giá cao của trắc nghiệm đối với sự nhất trí
của giáo viên tham gia làm trắc nghiệm.
+ Tính đồng nhất của các item trong cùng một phiếu hỏi.
Với những kết quả đã phân tích trong mục [3.2.1], có thể kết luận mẫu
phiếu hỏi sử dụng trong nghiên cứu có độ giá trị tốt (độ tin cậy cao và phù hợp
với mô hình đo là các yếu tố ảnh hưởng đến chất lượng bộ đề thi TNKQ).
3.3. Kết luận về các yếu tố ảnh hưởng đến chất lượng bộ đề thi TNKQ
Để thấy rõ hơn ảnh hưởng của các yếu tố tác động đến chất lượng bộ đề
TNKQ như thế nào ta tiến hành phân tích hai mẫu “Chất lượng đề thi phản ánh
qua hệ số tin cậy Alpha Cronbach’s” và “Điều kiện thuận lợi phản ánh qua tổng
điểm trên phiếu điều tra”. Để thực hiện được, ta tiến hành
- Nhập số liệu của “Chất lượng đề thi” vào cột biến “chl.đe” - Chất lượng đề thi.
- Nhập số liệu của “Tổng điểm trên phiếu điều tra” vào cột biến “diem.ptn” -
Điểm phiếu trắc nghiệm.
- Chú ý mối quan hệ 1-1 giữa các mẫu trên cùng một giáo viên.
62
Dùng thủ tục Bảng chéo (Crosstabulation) để phân tích mối quan hệ giữa
hai biến “chl.de” và “diem.ptn”.
- Recode lại các biến thành ba nhóm có độ lớn của biến là thấp, vừa và cao.
+ Chia biến “chl.de” thành ba nhóm “Chất lượng đề kém”, “Chất lượng
đề trung bình” và “Chất lượng đề tốt”.
+ Chia biến “diem.ptn” thành ba nhóm “Điểm phiếu hỏi thấp”, “Điểm
phiếu hỏi trung bình” và “Điểm phiếu hỏi cao”.
- Để chia biến (Recode) “chl.de” ta phải xác định các yếu tố: Độ trung bình
(mean); Độ lệch chuẩn (σ = devian standar). Từ đó xác định các mức:
+ Mức thấp là giá trị của biến ≤ mean - 1σ
+ Mức trung bình từ giá trị “ mean - 1σ ” đến giá trị “ mean + 1σ ”
+ Mức cao là giá trị của biến ≥ mean + 1σ
- Áp dụng thủ tục Transform \ Recode \ Into Same Variable cho biến
“chl.de”
63
100.0090.0080.0070.0060.0050.00
diem.ptn
10
8
6
4
2
0
Fr
eq
ue
nc
y
Mean = 76.28
Std. Dev. = 13.22187
N = 50
diem.ptn
Hình 3.2: Phân bố thống kê của biến “diem.ptn”
- Lấy giá trị trung bình (mean) là 76.
- Lấy độ lệch chuẩn Std. Dev là 13
- Mức thấp sẽ là các biến có giá trị nhỏ hơn hoặc bằng 76 - 13 = 63
- Mức cao sẽ là các biến có giá trị lớn hơn hoặc băng 76 + 13 = 89
- Mức trung bình nằm giữa hai giá trị 63 và 89
Sau khi Recode lại biến “ diem.ptn” ta sẽ có biến mới “ diem.ptn.nhom” –
(Biến điểm phiếu trắc nghiệm theo nhóm) nhận các giá trị 1,2,3 ứng với các mức
64
điểm phiếu trắc nghiệm thấp, điểm phiếu trắc nghiệm trung bình và điểm phiếu
trắc nghiệm cao.
Hình 3.3: Biểu đồ phân chia mức khi Recode biến “diem.ptn”
Hình 3.4: Thủ tục Transform \ Recode \ Into Same Variables
65
Hình 3.5: Thủ tục Transform \ Recode \ Into Same Variables khi nhóm biến
Sau khi đã Recode biến, ta quay lại bảng số liệu SPSS để khai báo lại biến
- Trong Sheet Variable chọn Variable view. Chọn biến “diem.ptn.nhom”
- Trong mục giá trị (cột Values), kích vào nút bên phải, xuất hiện bảng
Values Labels. Khai báo thuộc tính nhãn
- Ô value: Nhập 1, ô Value Label nhập nhãn: “Nhóm điểm thấp” \ Add
- Ô value: Nhập 2, ô Value Label nhập nhãn: “Nhóm điểm trung bình” \
Add
- Ô value: Nhập 1, ô Value Label nhập nhãn: “Nhóm điểm cao” \ Ok.
Tiếp tục thực hiện Recode biến đối với biến “chl.de”.
Sử dụng thủ tục Analyze \ Descriptive Statistic \ Frequencities.
66
Ta có được biểu đồ phân bố biến “chl.de” với các thông số “mean”, “
Std.dev” như hình vẽ.
1.000.900.800.700.600.500.400.30
chl.de
12
10
8
6
4
2
0
Fr
eq
ue
nc
y
Mean = 0.642
Std. Dev. = 0.16596
N = 50
chl.de
Hình 3.6: Biểu đồ phân bố biến “chl.de” trên mẫu kết quả thi
của 50 bộ đề TNKQ
Từ đồ thị phân bố biến “chl.de” ta có thể nhận được các thông số
- Giá trị trung bình (mean) = 0.642 lấy tròn là 0.64
- Độ lệch chuẩn (Standar Devian) = 0.165 lấy tròn là 0.16
- Mức thấp sẽ là các biến có giá trị nhỏ hơn hoặc bằng 0.64 – 0.16 = 0.48
- Mức cao sẽ là các biến có giá trị lớn hơn hoặc bằng 0.64 + 0.16 = 0.80
67
- Mức trung bình nằm giữa hai giá trị 0.48 và 0.80
Như vậy ta sẽ có phân bố mức khi Recode lại biến “chl.de” theo hình sau
Hình 3.7: Phân bố mức của biến “chl.de” sau khi Recode
Sau khi dùng thủ tục Transform \ Recode \ Into Same Variables khi nhóm
biến. Ta có được biến mới là “chl.de.nhom” - Chất lượng đề nhóm
Sau khi đã Recode biến, ta quay lại bảng số liệu SPSS để khai báo lại biến
- Trong Sheet Variable chọn Variable view. Chọn biến “chl.de.nhom”
- Trong mục giá trị (cột Values), kích vào nút bên phải, xuất hiện bảng
Values Labels. Khai báo thuộc tính nhãn.
- Ô value: Nhập 1, ô Value Label nhập nhãn: “Nhóm đề chất lượng kém ” \ Add.
- Ô value: Nhập 2, ô Value Label nhập nhãn: “Nhóm đề chất lượng trung
bình” \ Add.
- Ô value: Nhập 1, ô Value Label nhập nhãn: “Nhóm đề chất lượng cao” \ Ok.
68
Bằng cách phân nhóm và khai báo lại nhãn cho các biến mới ta đã có hai
biến mới mang đặc trưng của hai biến ban đầu nhưng được phân bố theo nhóm
điểm số của thang đo. Vấn đề đặt ra là tìm mối quan hệ giãư hai biến này theo
phân bố nhóm.
Áp dụng thủ tục Bảng chéo (Crosstabulation) trong SPSS ta sẽ có kết luận
về mối tương quan này.
Từ thanh menu chọn Statistics \ Summaries \ Crosstabs . Sau đó nhấn nút
reset để phục hồi mặc định của hộp thoại rồi chọn:
Row : “diem.ptn.nhom”
Colum : “chl.de.nhom”
Statistic…
Tích vào hộp Chi – square và hộp Crrelations
Cell..
Counts tích vào hộp Observed và hộp Total
Hình 3.8: Thủ tục Bảng chéo (Statistics \ Summaries \ Crosstabs)
69
Trong Output của thủ tục này ta sẽ có bảng chéo Crosstabs
Hình 3.9: Kết quả bảng chéo Crosstabs giữa hai biến
“diem.ptn.nhom” và “chl.de.nhom”
Nhìn vào bảng ta có thể kết luận:
- Trong 50 mẫu phiếu hỏi có 10 mẫu phiếu cho điểm số thấp, chiếm 20%,
trong đó:
+ 03 phiếu ứng với người có đề chất lương kém, chiếm 30% của nhóm.
+ 03 phiếu ứng với người có đề chất lượng vừa, chiếm 30% của nhóm.
+ 04 phiếu ứng với người có chất lượng đề cao, chiếm 40% của nhóm.
- Trong 50 mẫu phiếu có 30 mẫu cho điểm số trung bình, chiếm 60% tổng
số mẫu, trong đó:
70
+ 05 phiếu ứng với người có chất lượng đề kém, chiếm 16,7% của nhóm
+ 21 phiếu ứng với người có chất lượng đề trung bình, chiếm 70% của nhóm
+ 04 phiếu ứng với người có chất lượng đề cao, chiếm 13,3% của nhóm
- Trong 50 mẫu phiếu hỏi có 10 mẫu cho điểm số cao, chiếm 20% của nhóm
mẫu, trong đó:
+ 07 phiếu ứng với người có chất lượng đề trung bình, chiếm 70% của nhóm.
+ 03 phiếu ứng với người có chất lượng đề tốt, chiếm 30% của nhóm.
Kết luận:
- Bảng chéo Crosstabs cho ta thấy mối quan hệ tương đối giữa các nhóm của
hai mẫu biến “chl.de.nhom” và “diem.ptn.nhom”.
- Các phân tích trên chỉ ra rằng về cơ bản thì đây là tương quan thuận giữa
hai biến “chl.de” và “diem.ptn”.
- Một số phân bố không theo quy luật như “điểm phiếu trắc nghiệm thấp lại
là của người có đề chất lượng cao”. Điều này có thể giải thích là do số lượng
mẫu nghiên cứu là chưa đủ lớn (50 mẫu), hoặc có những người trả lời phiếu trắc
nghiệm không trung thực (điều này có thể xảy ra trong thực tế) do những yếu tố
chủ quan hoặc khách quan.
71
KẾT LUẬN VÀ ĐỀ NGHỊ
A. KẾT LUẬN
Với những nghiên cứu và phân tích ở trên, chúng tôi có thể kết luận.
- Chất lượng của một đề thi TNKQ được đánh giá trên nhiều yếu tố và theo
nhiều góc độ xem xét khác nhau. Tuy nhiên, yếu tố mang tính định lượng và có ý
nghĩa đặc trưng nhất có thể dùng để đánh giá chất lượng của trắc nghiệm là “độ
tin cậy” được tính bằng hệ số Cronbach’s Alpha. Các trắc nghiệm cho hệ số tin
cậy Cronbach’s Alpha lớn thì có chất lượng tốt và ngược lại.
- Mô hình các yếu tố ảnh hưởng đến chất lượng các bộ đề trắc nghiệm mà
luận văn đưa ra trong mẫu phiếu hỏi đối với giáo viên là phù hợp. Trắc nghiệm
cho độ tin cậy chung khá cao và tương quan giữa các item trong phiếu hỏi cũng
ở mức đáng tin cậy.
- Điểm lượng hoá của phiếu hỏi (sau khi đã Recode biến) đặc trưng cho sự
thuận lợi của các yếu tố ảnh hưởng đến người ra đề. Qua phân tích, ta thấy điểm
phiếu hỏi cao tương ứng với giáo viên có các yếu tố thuận lợi cho việc ra đề thi
TNKQ và ngược lại, điểm phiếu hỏi thấp ứng với giáo viên có các yếu tố kém
thuận lợi cho việc ra đề.
- Có sự tương quan chặt chẽ giữa điểm số của phiếu hỏi với chất lượng đề
thi của chính nghiệm thể đó (trừ số ít trường hợp ngoại lệ). Điều đó cho thấy qua
phân tích phiếu hỏi có thể dự đoán khá chính xác chất lượng đề thi mà cá nhân
đó chịu trách nhiệm biên soạn.
- Qua đánh giá các yếu tố ảnh hưởng đến chất lượng đề thi TNKQ, có thể
thấy yếu tố ảnh hưởng lớn nhất đến chất lượng đề thi là việc trang bị kỹ thuật ra
đề thi TNKQ cho giáo viên (16 item / tổng số 30 item của phiếu hỏi).
72
B. ĐỀ NGHỊ
Từ các nghiên cứu và phân tích ở trên chúng tôi mạnh dạn đề xuất một số
giải pháp nhằm nâng cao chất lượng các bộ đề thi TNKQ như sau.
- Đầu tư thời gian, kinh phí tập huấn cho đội ngũ giáo viên tại các Bộ môn
lý thuyết về đo lường, đánh giá kết quả học tập, trong đó chú trọng đến các kỹ
thuật soạn thảo câu hỏi TNKQ.
- Triển khai xây dựng ngân hàng câu hỏi TNKQ theo đúng quy trình đã được
thống nhất trong toàn trường, có sự quản lý giám sát của bộ phận chuyên trách.
- Tăng cường công tác khảo thí, xây dựng đội ngũ cán bộ khảo thí có
chuyên môn vững làm nhiệm vụ tư vấn trong xây dựng cũng như đánh giá trực
tiếp chất lượng ngân hàng đề thi TNKQ của nhà trường.
- Nhanh chóng áp dụng các phần mềm ra đề thi tự động, phần mềm thi
TNKQ trực tiếp trên máy tính. Áp dụng các kỹ thuật xử lý số liệu có trợ giúp của
máy tính trong phân tích, đánh giá chất lượng đề thi.
- Xây dựng một môi trường tương tác làm việc (trên mạmg internet) giữa bộ
phận khảo thí với các giáo viên bộ môn sao cho giáo viên có thể dễ dàng đánh
giá đề thi của mình cũng như cập nhật sửa đổi ngân hàng câu hỏi thi TNKQ có
sự quản lý của trung tâm khảo thí.
- Nhà trường cần có sự quan tâm thích đáng về vật chất và tinh thần đối với
giáo viên có áp dụng thi TNKQ, coi việc đổi mới phương pháp kiểm tra đánh giá
là một trong những khâu nhằm đổi mới phương pháp giảng dạy, nâng cao chất
lượng đào tạo.
73
TÀI LIỆU THAM KHẢO
Tiếng Việt
1- Nguyễn Phụng Hoàng (2003), Phương pháp trắc nghiệm trong kiểm tra
và đánh giá thành quả học tập. NXB Giáo dục.
2- Phạm Viết Vượng (2006), Giáo dục học. NXB ĐHQGHN.
3- Nguyễn Công Khanh (2004), Đánh giá và đo lường trong khoa học xã
hội. NXB Chính trị quốc gia.
4- Nguyễn Công Khanh (2001), Ứng dụng SPSS FOR WINDOWS: Xử lý và
phân tích dữ liệu. NXB ĐHQGHN.
5- Lê Đức Ngọc (2003), Bài giảng đo lường và đánh giá thành quả học tập
trong giáo dục. Đại học Quốc gia Hà Nội.
6- Phạm Minh Hạc, Trần Kiều, Đặng Bá Lãm, Nghiêm Đình Vỹ (2002),
Giáo dục thế giới đi vào thế kỉ XXI, NXB Chính trị Quốc gia.
7 - Dương Thiệu Tống (2004), Phương pháp nghiên cứu trong khoa học
giáo dục và tâm lí, NXB Giáo dục.
Tiếng Anh
8- Taylo & Francis Grup (2003), Quality in Higher Education.
9- Jemes H.McMillan (2001), Classroom assessment, Virginia
Commonwealth University.
10- Norman E. Grounlund (2003), Constructing Achivement Tets.
11- Peggy O’Neill (2009), Guide to College Writing Assessment, Utah State
University Press.
12- Claire Wyatt – Smith (2009), Assessment in the 21st century, Griffith
University Australia.
74
PHỤ LỤC
Phụ lục 1: File dữ liệu mon01.Itn
QUEST: The Interactive Test Analysis System
.............................................................................................................................................................................................................
Item Analysis Results for Observed Responses 21/12/ 9 14:30
all on mon01 (N = 52 L = 60 Probability Level= .50)
.............................................................................................................................................................................................................
Item 1: item 1 Infit MNSQ = 1.06
Disc = .19
Categories 0 1 missing
Count 5 47 0
Percent (%) 9.6 90.4
Pt-Biserial -.18 .18
p-value .097 .097
Mean Ability .66 1.14 NA
Step Labels 1
Thresholds -1.32
Error .48
.............................................................................................................................................................................................................
Item 2: item 2 Infit MNSQ = 1.02
Disc = .14
Categories 0 1 missing
Count 2 50 0
Percent (%) 3.8 96.2
Pt-Biserial -.14 .14
p-value .161 .161
Mean Ability .59 1.12 NA
Step Labels 1
Thresholds -2.32
Error .73
.............................................................................................................................................................................................................
Item 3: item 3 Infit MNSQ = 1.22
Disc = .00
Categories 0 1 missing
Count 24 28 0
Percent (%) 46.2 53.8
Pt-Biserial .00 .00
p-value .499 .499
Mean Ability 1.08 1.11 NA
Step Labels 1
Thresholds .92
Error .29
.............................................................................................................................................................................................................
Item 4: item 4 Infit MNSQ = 1.07
Disc = .19
Categories 0 1 missing
Count 15 37 0
Percent (%) 28.8 71.2
Pt-Biserial -.19 .19
p-value .086 .086
Mean Ability .90 1.18 NA
Step Labels 1
Thresholds .10
Error .32
.............................................................................................................................................................................................................
Item 5: item 5 Infit MNSQ = .95
Disc = .36
Categories 0 1 missing
Count 9 43 0
Percent (%) 17.3 82.7
Pt-Biserial -.36 .36
p-value .005 .005
75
Mean Ability .54 1.21 NA
Step Labels 1
Thresholds -.61
Error .38
.............................................................................................................................................................................................................
Item 6: item 6 Infit MNSQ = 1.05
Disc = .22
Categories 0 1 missing
Count 19 33 0
Percent (%) 36.5 63.5
Pt-Biserial -.22 .22
p-value .058 .058
Mean Ability .85 1.24 NA
Step Labels 1
Thresholds .49
Error .30
.............................................................................................................................................................................................................
Item 7: item 7 Infit MNSQ = .97
Disc = .31
Categories 0 1 missing
Count 7 45 0
Percent (%) 13.5 86.5
Pt-Biserial -.31 .31
p-value .013 .013
Mean Ability .54 1.18 NA
Step Labels 1
Thresholds -.92
Error .42
.............................................................................................................................................................................................................
Item 8: item 8 Infit MNSQ = 1.40
Disc = -.28
Categories 0 1 missing
Count 35 17 0
Percent (%) 67.3 32.7
Pt-Biserial .28 -.28
p-value .023 .023
Mean Ability 1.24 .79 NA
Step Labels 1
Thresholds 1.88
Error .31
.............................................................................................................................................................................................................
Item 9: item 9 Infit MNSQ = 1.11
Disc = .12
Categories 0 1 missing
Count 8 44 0
Percent (%) 15.4 84.6
Pt-Biserial -.12 .12
p-value .196 .196
Mean Ability .85 1.14 NA
Step Labels 1
Thresholds -.76
Error .40
.................................................................................................................................................................................................
............
76
Phụ lục 2: File dữ liệu mon01.map
QUEST: The Interactive Test Analysis System
----------------------------------------------------------------------------------------------
21/12/ 9 14:30
all on mon01 (N = 54 L = 60 Probability Level= .50)
----------------------------------------------------------------------------------------------
Data File = MON01.DAT
Data Format = NAME 1 ITEMS 9-68
Log file = LOG not on
Page Width = 132
Page Length = 65
Screen Width = 78
Screen Length = 24
Probability level = .50
Maximum number of cases set at 60000
VALID DATA CODES 0 1
GROUPS
1 all ( 54 cases ) : All cases
SCALES
1 all ( 60 items ) : All items
2 mon01 ( 60 items ) : 1-60
DELETED AND ANCHORED CASES:
No case deletes or anchors
DELETED AND ANCHORED ITEMS:
No item deletes or anchors
RECODES
----------------------------------------------------------------------------------------------
all on mon01 (N = 54 L = 60 Probability Level= .50)
----------------------------------------------------------------------------------------------
Summary of item Estimates
Mean .00
SD 1.05
SD (adjusted) .98
Reliability of estimate .87
Fit Statistics
Infit Mean Square Outfit Mean Square
Mean 1.00 Mean .95
SD .14 SD .24
Infit t Outfit t
Mean .13 Mean -.04
SD 1.14 SD .90
0 items with zero scores
0 items with perfect scores
----------------------------------------------------------------------------------------------
all on mon01 (N = 54 L = 60 Probability Level= .50)
----------------------------------------------------------------------------------------------
Summary of case Estimates
Mean 1.10
SD .71
SD (adjusted) .63
Reliability of estimate .79
Fit Statistics
Infit Mean Square Outfit Mean Square
Mean .99 Mean .95
SD .19 SD .32
Infit t Outfit t
Mean .09 Mean -.03
SD 1.20 SD 1.03
0 cases with zero scores
2 cases with perfect scores
==============================================================================================
77
QUEST: The Interactive Test Analysis System
----------------------------------------------------------------------------------------------
21/12/ 9 14:30
all on mon01 (N = 54 L = 60 Probability Level= .50)
----------------------------------------------------------------------------------------------
--------------------------------------
3.0 |
|
|
|
NANG LUC CAO | DO KHO CAO
X |
|
XX |
XX | 44
2.0 | 15 37 48
XXXX | 8
XX | 45
X | 23
XXXXXX |
X |
|
|
XXXXXXXXX | 30 53
1.0 XXX |
XXX | 3 32 40
X |
XXX | 14 22 26 35
XXXXXX | 24
XXX | 6
| 21 50 54
| 49 57
| 20 36
.0 X | 4 11 25 31 39 55 59
X | 13
|
XX | 17 43
| 51 58
| 33 41
| 5 52 56
| 9 16 19 46 60
|
X | 7
-1.0 |
| 18 28 29 34 38 47
|
| 1 12 42
|
| 27
|
|
| 10
-2.0 |
|
|
NANG LUC THAP | 2 DO KHO THAP
|
|
|
|
|
-3.0 |
----------------------------------------------------------------------------------------------
Each X represents 1 students
QUEST: The Interactive Test Analysis System
78
------------------------------------------------------------------------------------------------------------
-----Item Fit
21/12/ 9 14:30
all on mon01 (N = 54 L = 60 Probability Level= .50)
------------------------------------------------------------------------------------------------------------
INFIT
MNSQ .63 .67 .71 .77 .83 .91 1.00 1.10 1.20 1.30
1.40 1.50 1.60
----------+---------+---------+---------+---------+---------+---------+---------+---------+---------+-------
1 item 1 . | * .
2 item 2 . | * .
3 item 3 . | * .
4 item 4 . | * .
5 item 5 . * | .
6 item 6 . | * .
7 item 7 . * | .
8 item 8 . | . *
9 item 9 . | * .
10 item 10 . * | .
11 item 11 . * | .
12 item 12 . * | .
13 item 13 . * | .
14 item 14 . | . *
15 item 15 . | * .
16 item 16 . |* .
17 item 17 . * | .
18 item 18 . * | .
19 item 19 . * | .
20 item 20 . * | .
21 item 21 . |* .
22 item 22 . | . *
23 item 23 . | * .
24 item 24 . *| .
25 item 25 . *| .
26 item 26 * | .
27 item 27 . * | .
28 item 28 . |* .
29 item 29 . * .
30 item 30 . * | .
31 item 31 . * | .
32 item 32 . * | .
33 item 33 . * | .
34 item 34 . | * .
35 item 35 . * | .
36 item 36 . * | .
37 item 37 . | . *
38 item 38 . * | .
39 item 39 . * | .
40 item 40 . | * .
41 item 41 . * | .
42 item 42 . * | .
43 item 43 . * | .
44 item 44 . * | .
45 item 45 . | * .
46 item 46 . * | .
47 item 47 . * | .
48 item 48 . * | .
49 item 49 . * | .
50 item 50 . * | .
51 item 51 . | * .
52 item 52 . * | .
53 item 53 . * | .
54 item 54 . * | .
55 item 55 . * | .
56 item 56 . *| .
57 item 57 . | * .
58 item 58 . |* .
59 item 59 . | * .
60 item 60 . *| .
------------------------------------------------------------------------------------------------------------
79
Phụ lục 3: Mẫu phiếu khảo sát giảng viên ra đề thi
PHIẾU KHẢO SÁT GIẢNG VIÊN RA ĐỀ THI TNKQ
Họ tên giảng viên:.................................................. Tuổi...............Giới tính..............
Thâm niên giảng dạy..................................................................................................
Môn học đảm nhiệm giảng dạy:..................................................................................
Trình độ:......................................................................................................................
Anh (Chị) hãy đọc kỹ các phát biểu dưới đây và đánh dấu X vào 1 trong 5 số
phù hợp nhất theo sự chọn lựa của cá nhân
0 = Hoàn toàn không đúng / hoàn toàn không đồng ý
1 = Cơ bản không đúng / cơ bản không đồng ý
2 = Đúng một phần / đồng ý một phần/ phân vân
3 = Cơ bản đúng / cơ bản đồng ý
4 = Hoàn toàn đúng / hoàn toàn đồng ý
Mức độ
Stt Nội dung được đánh giá 0 1 2 3 4
I Yếu tố thời gian dành cho công việc
1 Tôi đã đầu tư nhiều thời gian cho việc ra đề thi TNKQ.
2 Nhà trường bố trí thời gian đủ cho giáo viên xây dựng bộ đề
thi TNKQ.
3 Tôi đã áp dụng thử bộ đề thi trước khi thi kết thúc môn học.
II Động cơ của người thực hiện
4 Tôi thực sự hứng thú đối với việc áp dụng phương pháp thi
TNKQ.
5 Tôi đã dành thời gian tìm hiểu kỹ về thi TNKQ.
6 Tôi đã chủ động áp dụng việc thi TNKQ trong môn học do
mình giảng dạy.
7 Tôi cho rằng thi TNKQ là không cần thiết.
8 Tôi nhận thấy thi TNKQ là tiện lợi và khoa học.
III Mức độ nắm vững kỹ thuật ra đề TNKQ của giảng viên.
9 Bộ đề thi TNKQ dùng để đánh giá SV được thiết kế theo
ma trận kiến thức của môn học tôi giảng dạy.
10 Bộ đề thi TNKQ tôi thiết kế có thể phân loại được sinh viên
theo lực học.
11 Bộ đề thi TNKQ tôi thiết kế không quá khó, phù hợp với
lực học trung bình của sinh viên.
12 Tôi hiểu rõ từng câu hỏi và có thể trả lời đúng từng câu hỏi
trong bộ đề thi của mình mà không cần tới đáp án.
13 Tôi đã được tập huấn những kiến thức cơ bản về kỹ thuật ra
đề thi TNKQ.
80
14 Các câu hỏi trong đề thi phù hợp với thời lượng của từng
nội dung trong đề cương chi tiết môn học.
15 Số lượng các câu hỏi trong đề thi phân bố đều ở các nội
dung và bao quát cả chương trình môn học.
16 Tôi đã bỏ ra khá nhiều thời gian để tự nghiên cứu về kỹ
thuật ra đề thi TNKQ.
17 Tôi đã trao đổi về nội dung bộ đề thi TNKQ trong nhóm
giảng viên của Bộ môn.
18 Bộ đề thi TNKQ của tôi được thiết kế chung cho cả nhóm
môn học trong Bộ môn.
19 Sau mỗi lần thi tôi thường đánh giá chất lượng đề (các đặc
tính đo lường) để bổ sung và chỉnh sửa bộ đề thi.
20 Tôi thiết kế đề thi TNKQ chủ yếu dựa trên kinh nghiêm cá nhân
21 Tôi chưa nắm được kỹ thuật phân tích item
22 Tôi chưa nắm được lý thuyết hồi đáp IRT
23 Tôi biết sử dụng phần mêm SPSS để đánh giá độ tin cậy
24 Tôi biết sử dụng phần mêm Quest hoặc Conquest để phân
tích item
IV Sự quan tâm của nhà trường
25 Nhà trường khuyến khích việc áp dụng thi TNKQ.
26 Xây dựng đề thi TNKQ được coi là một tiêu chuẩn nhằm
đánh giá đổi mới phương pháp giảng dạy
27 Nhà trường có hỗ trợ kinh phí thích đáng cho việc xây dựng
đề thi TNKQ
V Tính chất các nhóm môn học
28 Môn học tôi giảng dạy phù hợp với việc thi TNKQ
29 Tôi cho rằng đề thi TNKQ chỉ phù hợp với một số môn học
30 Tôi cho rằng tính chất các nhóm môn học có ảnh hưởng
đáng kể đến chất lượng đề thi TNKQ
31. Anh chị giảng dạy môn học thuộc nhóm nào?
a. Nhóm Toán, Lý, Hoá c. Nhóm Ngoại ngữ
b. Nhóm Văn, Chính trị xã hội d. Nhóm các môn Kỹ thuật
32. Theo anh chị, yếu tố nào (trong 5 nhóm yếu tố trên) có ảnh hưởng lớn nhất đến
quá trình ra đề thi TNKQ của giảng viên?
.......................................................................................................................................
33. Anh chị có kinh nghiệm như thế nào về ra đề thi TNKQ:
………………………………………………………………………………………
Xin chân thành cảm ơn!
81
Các file đính kèm theo tài liệu này:
- Đánh giá các yếu tố ảnh hưởng đến chất lượng các bộ đề thi trắc nghiệm khách quan tại Khoa Công Nghệ Thông tin - Đại học Thái Nguyên.pdf