Nhìn vào bảng phân bố giữa năng lưc- câu hỏi (Item estimates) ta thấy mức
năng lực của TS chưa được cao (r = 0.27), và sự phân bố câu hỏi là tốt (bài TN có
tính ổn định cao r =0.96). Độ ổn định về mức năng lực của học sinh chưa được cao vì
TS ở lớp này có học lực không đồng đều giữa các lớp (lớp 11H2 học lực rất kém so
với 11E1, 11G1), HS còn bỡ ngỡ với hình thức kiểm tra này.
60 trang |
Chia sẻ: lylyngoc | Lượt xem: 3011 | Lượt tải: 4
Bạn đang xem trước 20 trang tài liệu Luận văn Xây dựng bộ câu trắc nghiệm khách quan về môn hoá học lớp 11, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
ng số phép thử được gọi là tần suất.
1.2.3.2.2. Luật số lớn là gì?
Khi số lượng phép thử tăng lên đủ lớn, giá trị tần suất sẽ tiến dần đến giá trị
xác suất.
Đây là nội dung của luật số lớn, định luật này làm cơ sở quan trọng cho mọi
nghiên cứu thống kê. Ngoài ra đây còn gọi là luật về giá trị trung bình.
1.2.3.2.3. Tổng thể và mẫu
Tổng thể là một tập hợp rất lớn các đối tượng dùng để xem xét các số liệu hoặc
tính chất nào đó. VD: xem xét kết qủa TN trong một tổng thể gồm toàn bộ thí sinh
tham dự kì thi cuối năm lớp 10.
Do việc thực hiện nghiên cứu trên một tổng thể với số lượng rất lớn đối tượng
thường gây nhiều khó khăn và tốn kém, nên người ta thường triển khai một số nghiên
cứu trên một tập hợp con với số lượng ít hơn của tổng thể. Tập hợp các con số đó gọi
là mẫu nghiên cứu. Người ta phải chọn những mẫu nghiên cứu có tính đại diện cho
tổng thể để việc nghiên cứu thu được các kết quả thống kê gần với kết quả thu được
từ tổng thể.
1.2.3.2.4. Phân bố tần suất
Đường cong mô tả sự xuất hiện của một đăc trưng nào đó mà ta thực hiện phép
đo trên một mẫu nghiên cứu được gọi là đường cong phân bố tần suất. VD: Khi tiến
hành điều tra số học sinh phổ thông trung học của các tỉnh thuộc khu vực miền Bắc.
Ta mô tả kết quả đo được trên một đồ thị, trục hoành biểu diễn số học sinh trong một
trường (theo khoảng), trục tung biểu diễn tần suất xuất hiện của số học sinh trong
khoảng nào đó. Nếu chúng ta tiến hành điều tra trên phạm vi cả nước thì ta sẽ được
một đường cong có dạng giống như trên nhưng mịn và đều hơn. Khi phân bố tần suất
đối với một tổng thể được gọi là phân bố xác suất.
Dạng phân bố kiểu hình chuông đối xứng như trên hình vẽ được gọi là phân bố
chuẩn. Các đại lượng đặc trưng để phân bố tần suất là:
Giá trị trung bình của các giá trị đo được trên mẫu (gồm n cá thể).
x =
n
xi
giá trị trung bình xác định vị trí của một phân bố tần suất trên một thang đo nào
đó.
Độ lệch tiêu chuẩn của các giá trị đo được so với giá trị trung bình.
S =
)1(
)( 2
n
xx
Khi n đủ lớn thì giá trị của S tính theo công thức trên gần với căn bậc hai của
trung bình các bình phương độ lệch. Độ lệch tiêu chuẩn xác định mức độ phân tán của
các số đo của đại lượng: khi độ lệch tiêu chuẩn bé đường phân bố sẽ có dạng hẹp và
nhọn, còn khi độ lệch tiêu chuẩn lớn thì đường phân bố sẽ có dạng doãn và tù.
Khi một mẫu không đồng nhất ta sẽ thu được đường cong phân bố lệch (lệch
âm hay lệch dương). Từ đó ta có thể phát biểu luật số lớn theo cách khác: Khi kích
thước của mẫu chọn càng lớn, giá trị trung bình của các đại lượng đo trên mẫu sẽ
tiến gần đến giá trị trung bình đo trên tổng thể.
Định lí giới hạn trung tâm
Nếu một đại lượng nào đó trong một tổng thể tuân theo một phân bố bất kì, từ
tổng thể đó thì khi ta chọn nhiều mẫu khác nhau và xác định một đặc trưng nào đó của
mẫu, chẳng hạn là giá trị trung bình thì định lí giới hạn trung tâm có nội dung như
sau: nếu kích thước của mẫu chọn đủ lớn, phân bố của giá trị trung bình của mẫu theo
các mẫu được chọn là gần với phân bố chuẩn, dù rằng phân bố của tổng thể theo quy
luật nào đi nữa.
Hệ số tương quan
Biến là một đại lượng đặc trưng nào đó nhận các giá trị khác nhau từ một cá thể
này đến một cá thể khác trong một tổng thể thống kê. Số liệu thống kê thường xem
xét mối quan hệ giữa các biến khác nhau. Trong trường hợp có hai biến, mối quan hệ
giữa chúng thường được biểu diễn bằng hệ số tương quan.
Hệ số tương quan R giữa hai biến x và y là:
R =
yx
xy
SS
S
.
Trong đó: xS , yS là các độ lệch tiêu chuẩn của biến x và biến y, còn xyS
được gọi là hiệp phương sai giữa x và y được tính theo công thức:
S xy = 1
))((
n
yyxx
Từ đó có thể lập được biểu thức để tính hệ số tương quan Pearson:
R =
2222 )()(
).(
yynxxn
yxxyn
Hệ số tương quan là đại lượng để đo mối quan hệ tuyến tính giữa hai biến ngẫu
nhiên. Nó có giá trị phân bố trong khoảng từ -1 đến 1.
R < 0 khi các giá trị cao (thấp,trung bình) của biến x tương ứng có liên hệ với
các giá trị cao (thấp, trung bình) của biến y.
R > 0 khi các giá trị cao (trung bình, thấp) của biến x có liên hệ với các giá trị
thấp (trung bình, cao) của biến y.
R = 0 khi quan hệ của các giá trị của biến x và các giá trị của biến y không tuân
theo một quy luật rõ ràng nào.
1.2.3.3. Đánh giá các câu TN
Phân tích các câu trả lời của TS trong một bài TN là việc làm rất cần thiết và rất
hữu ích cho người soạn TN. Nó giúp cho người soạn thảo:
1) Biết được những câu nào là quá khó, câu nào là quá dễ.
2) Lựa ra các câu có độ phân cách cao, nghĩa là phân biệt được giữa HS giỏi
và HS kém.
3) Biết được lí do vì sao câu TN không đạt được hiệu quả mong muốn và cần
phải sửa đổi như thế nào cho tốt hơn.
Một bài TN, sau khi đã được sửa đổi trên căn bản của sự phân tích như nói trên,
có khả năng đạt được tính tin cậy cao hơn là một bài TN có cùng số câu hỏi nhưng
chưa được thử nghiệm và phân tích.
Chúng ta sẽ phân tích câu TN ở hai tiêu chuẩn đó là: Độ khó và độ phân biệt.
1.2. 3.3.1 Độ khó
Khi soạn thảo xong một câu hoặc một bài TN người soạn thảo chỉ có thể ước
lượng độ khó hoặc độ phân biệt của nó bằng cảm tính. Độ lớn của các đại lượng đó
chỉ có thể tính được cụ thể bằng phương pháp thống kê sau lần TN thử, dựa vào kết
quả thu được từ các câu và các bài TN của TS.
Độ khó của câu TN được định nghĩa bằng tỉ lệ của tổng số người trả lời đúng
câu TN so với tổng số người làm câu TN ấy:
Tổng số TS trả lời đúng câu hỏi
Độ khó p của câu thứ i=
Tổng số TS trả lời câu hỏi
Việc sử dụng trị số p để đo độ khó là rất có ý nghĩa. Nó thay thế cách xác định
độ khó theo các đặc tính nội tại của câu TN bằng cách đếm số người làm đúng câu
hỏi. Nó cũng cho thấy rõ mức độ khó dễ phụ thuộc vào cả câu hỏi, lẫn người làm câu
hỏi. Ngoài ra cách định nghĩa này cũng cho ta một đại lượng chung phản ánh độ khó
dễ của các bài TN thuộc các lĩnh vực khoa học khác nhau.
Các câu hỏi của một bài TN thường phải có các độ khó khác nhau. Theo công
thức tính độ khó như trên, rõ ràng gía trị p càng bé câu hỏi càng khó và ngược lại.
Vậy p có giá trị như thế nào thì câu hỏi có thể được xem là có độ khó trung bình?
Muốn xác định được khái niệm này cần phải lưu ý đến các xác suất làm đúng câu hỏi
bằng cách chọn hú hoạ
Một bài TN được gọi là tốt không phải là bài TN gồm toàn những câu khó hay
toàn những câu dễ cả, mà là bài TN gồm những câu có mức độ khó trung bình hay
mức độ khó vừa phải.
Nhưng thế nào là độ khó vừa phải? Thông thường ta cho rằng một câu TN có
độ khó vừa phải là câu có chỉ số khó là 50%, nghĩa là 50% học sinh làm đúng câu hỏi
ấy và 50% làm sai. Nhưng muốn cho công bằng và đúng đắn hơn, ta cần phải phân
biệt loại câu TN để xác định thế nào là độ khó vừa phải.
Với một câu TN thuộc loại đúng-sai thì độ khó 50% chưa hẳn là độ khó vừa
phải vì như ta đã biết, câu hỏi thuộc loại này chỉ gồm có hai lựa chọn, do đó sự may
rủi làm đúng câu hỏi ấy là 50%. Vậy ta không thể cho 50% là chỉ số khó thíchs hợp
cho loại này. Vì lí do ấy, ta cần phải lưu ý đến một yếu tố khác. Đó là tỉ lệ may rủi kì
vọng. Tỉ lệ này thay đổi tuỳ theo số câu lựa chọn trong mỗi câu hỏi. Nếu câu hỏi có
hai lựa chọn thì tỉ lệ kì vọng là 50%. Như vậy, độ khó vừa phải của câu hai lựa chọn
này phải là trung điểm giữa tỉ lệ may rủi kì vọng và100%, nghĩa là: (100 + 50)/ 2 =
75%. Nói cách khác, câu TN loại đúng-sai có độ khó vừa phải nếu 75% TS trả lời
đúng câu hỏi ấy. Theo cách tính này thì tỉ lệ kì vọng của loại câu TN có 5 lựa chọn là
100/5, tức là 20%. Vậy độ khó vừa phải của câu TN có 5 lựa chọn là (100 + 20)/ 2 =
60%. Như vậy độ khó trung bình của một bài TN n phương án chọn là: (100%+1/n)/2.
Còn đối với các câu TL tự do, như loại điền khuyết, thì độ khó trung bình là 50%.
Khi chọn các câu TN theo độ khó người ta thường phải loại các câu quá khó
(không ai làm đúng) hoặc quá dễ (ai cũng làm đúng). Một bài TN tốt khi có nhiều câu
ở độ khó trung bình.
Độ khó của bài TN được xét bằng cách đối chiếu điểm số trung bình của bài và
điểm trung bình lí tưởng của nó. Điểm trung bình lí tưởng của bài TN là điểm số nằm
giữa điểm tối đa người làm đúng toàn bộ nhận được và điểm mà người không biết gì
có thể đạt được nhờ chọn hú hoạ. Giả sử chúng ta chỉ xét đến điểm thô. VD: một bài
TN 50 câu, mỗi câu có 5 phương án TL. Điểm thô tối đa là 50, điểm có thể đạt được
do chọn hú hoạ là 0,2 x 50 = 10, điểm trung bình lí tưởng là (50 + 10)/ 2 = 30. Nếu
điểm trung bình quan sát được trên hay dưới 30 quá xa thì bài TN ấy sẽ là quá khó
hay quá dễ. Nói chung, nếu điểm trung bình lí tưởng nằm ở khoảng giữa phân bố các
điểm quan sát được thì bài TN là vừa sức đối với đối tượng TS, còn khi điểm đó nằm
ở phía trên hoặc dưới phân bố điểm quan sát được thì bài trắc nghiệm tương ứng là
khó hơn hoặc dễ hơn so với đối tượng TS. Thông thường độ khó của một câu hỏi có
thể chấp nhận được nằm trong khoảng 0.25 – 0.75; câu có độ lớn hơn 0.75 là quá dễ,
có độ nhỏ hơn 0.25 là quá khó. Việc tính độ khó theo cách nêu trên được thực hiện
theo lý thuyết đo lường cổ điển. Trong lý thuyết trả lời câu hỏi ( IRT) hiện đại độ khó
và năng lực của thí sinh được tính bằng cách ước lượng theo các mô hình toán học
xác định.
1.2.3.3.2. Độ phân biệt
Trước hết chúng ta làm quen với phương pháp cổ điển đơn giản để tính độ phân
biệt. Độ phân biệt của câu trắc nghiệm dùng để đo lường mức độ khác nhau giữa phản
ứng của thí sinh giỏi và thí sinh kém lên câu hỏi đó. Độ phân biệt của một câu trắc
nghiệm hoặc một bài trắc nghiệm liên quan đến độ khó. Thật vậy, nếu một bài trắc
nghiệm dễ đến mức mọi thí sinh đều làm tốt, các điểm số đạt được chụm ở phần điểm
cao, thì độ phân biệt của nó rất kém, mọi thí sinh đều có thể phản ứng như nhau đối
với bài trắc nghiệm đó. Cũng vậy, nếu một bài trắc nghiệm khó đến mức mọi thí sinh
đều không làm được, các điểm số đạt được chụm ở phần điểm thấp, thì độ phân biệt
của nó cũng rất kém. Từ các trường hợp giới hạn nói trên có thể suy ra rằng muốn có
độ phân biệt tốt thì bài trắc nghiệm phải có độ khó ở mức trung bình. Khi ấy điểm số
thu được của nhóm thí sinh sẽ có phổ trải rộng.
Cách tính độ phân biệt
Dựa vào tổng điểm thô của từng thí sinh người ta tách từ đối tượng thí sinh ra
một nhóm giỏi bao gồm 27% thí sinh đạt điểm cao từ trên xuống và nhóm kém bao
gồm 27% thí sinh đạt điểm kém từ dưới lên. Gọi C là số thí sinh làm đúng câu hỏi
thuộc nhóm giỏi, T là số thí sinh làm đúng câu hỏi thuộc nhóm kém, S là số lượng thí
sinh của 27% tổng số, ta có biểu thức tính độ phân biệt D của câu hỏi như sau:
D = (C – T)/S
Người ta có thể tính theo phân biệt của một câu trắc nghiệm theo một định
nghĩa khái quát hơn: đó là hệ số tương quan giữa các điểm của câu trắc nghiệm đó với
tổng điểm của toàn bài trắc nghiệm xét trên mọi thí sinh làm bài trắc nghiệm ( hệ số
tương quan điểm nhị phân). Hệ số tương quan có giá trị dương lớn ( gần bằng 1) nếu
một thí sinh nào đó có điểm của câu trắc nghiệm cao thì điểm của toàn bài cũng cao
và ngược lại. Hệ số tương quan có giá trị âm lớn ( gần bằng -1) nếu một thí sinh nào
đó có điểm câu trắc nghiệm cao nhất thì điểm của toàn bài trắc nghiệm lại kém nhất,
ngược lại. Hệ số tương quan bằng 0 nếu điểm của câu trắc nghiệm và điểm của toàn
bài trắc nghiệm không có mối liên hệ chặt chẽ và ổn định nào cả. Nói cách khác, câu
trắc nghiệm có độ phân biết tốt khi câu trắc nghiệm và toàn bài trắc nghiệm đều đo
lường cùng một mục tiêu. Như vậy để tính độ phân biệt, ta có thể tính hệ số tương
quan Pearson giữa điểm của câu trắc nghiệm với tổng điểm của toàn bài trắc nghiệm,
sau đó kiểm nghiệm ý nghĩa của hệ số tương quan ấy.
1.2.3.4. Đánh giá bài trắc nghiệm
1.2.3.4.1. Độ tin cậy của bài trắc nghiệm
Trắc nghiệm là một phép đo: dùng thước đo là bài trắc nghiệm để đo lường
một năng lực nào đó của thí sinh. Độ tin cậy của bài trắc nghiệm chính là đại lượng
biểu thị mức độ chính xác của phép đo nhờ bài trắc nghiệm. Có nhiều phương pháp
theo khoa học thống kê để tính độ tin cậy của một bài trắc nghiệm.
Một bài trắc nghiệm được xem là đáng tin cậy khi nó cho ra những kết quả có
tính vững chãi. Có nghĩa là nếu làm bài trắc nghiệm ấy nhiều lần, mỗi học sinh sẽ vẫn
giữ được thứ hạng tương đối của mình trong nhóm nhưng không có nghĩa là bài trắc
nghiệm ấy được làm đi làm lại nhiều lần. Một bài trắc nghiệm có thể gồm rất nhiều
câu hỏi và đó là một mẫu trong một ngân hàng câu hỏi dùng để khảo sát kiến thức của
học sinh, do đó chúng phải chịu sai số chọn mẫu. Nếu một bài trắc nghiệm có 50 câu
hỏi được ra cho học sinh, tiếp theo đó là một bài với 50 câu khác về cùng một lĩnh
vực khảo sát, thì chắc chắn sẽ có những sự khác biệt giữa hai điểm số của một số học
sinh. Như vậy, một điểm số duy nhất dựa trên một mẫu các câu trắc nghiệm không
phải là số đo lường hoàn toàn đáng tin cậy.
Có những yếu tố may rủi đóng góp vào sự thiếu tin cậy trong trường hợp các
câu hỏi đúng sai và ở một mức độ ít hơn với các câu có nhiều lựa chọn. Điểm số của
học sinh bao gồm trong đó một số câu trả lời đúng bằng lối phỏng đoán và một số câu
làm đúng nhờ sự hiểu biết. Càng có nhiều câu phỏng đoán bao nhiêu thì người học
sinh ấy càng có ít cơ may có được cùng một điểm số, nếu làm lại bài trắc nghiệm ấy
lần thứ 2; do đó tính tin cậy của bài trắc nghiệm sẽ thấp nếu nhiều câu trả lời chỉ là
những điều phỏng đoán. Vì yếu tố may rủi chi phối điểm số trắc nghiệm trong trường
hợp này, người ta không thể xác định rằng những học sinh có điểm cao biết nhiều hơn
hay giỏi hơn các học sinh có điểm thấp hơn. Do đó, nếu có nhiều học sinh đoán mò
nghĩa là nhắm mắt mà đoán không cần phải suy nghĩ thì chắc chắn hệ số tin cậy sẽ
thấp và điểm số trên một bài trắc nghiệm như vậy sẽ không đáng tin cậy.
Nếu cho học sinh làm một bài trắc nghiệm dễ, các điểm số có khuynh hướng tập
trung vào đầu mút cao của thang điểm, như vậy khó mà phân biệt được trình độ khác
nhau của học sinh. Ngược lại, nếu là một bài trắc nghiệm rất khó, các điểm số sẽ tập
trung vào đầu mút thấp của thang điểm, như vậy chúng sẽ che lấp tính chất khác nhau
của các trình độ hiểu biết. Ngay cả khi ta cố giảm thiểu yếu tố may rủi bằng cách sử
dụng loại câu điền khuyết, yếu tố chọn mẫu cũng vẫn tồn tại. Một sự khác biệt một
vài điểm không thể bộc lộ sự khác biệt về thành tích. Chỉ khi nào các điểm số trắc
nghiệm được trải rộng thì các điểm số ấy mới cho thấy rõ sự khác biệt về thành quả
học tập. Do vậy, tính chất khó hay dễ của bài trắc nghiệm cũng ảnh hưởng đến tính tin
cậy của bài trắc nghiệm.
Ngoài ra, chiều dài của bài trắc nghiệm cũng ảnh hưởng đến tính tin cậy. Một
bài trắc nghiệm rất ngắn không khiến cho điểm số được trải rộng ra đủ để cho ra
những kết quả vững chãi. Bài trắc nghiệm càng dài thì tính tin cậy của nó càng tăng
lên.
Qua những yếu tố ảnh hưởng đến tính tin cậy của một bài trắc nghiệm cho ta
thấy muốn đảm bảo tính tin cậy tối đa của bài trắc nghiệm ta cần phải:
1) Giảm thiểu các yếu tố may rủi. Một trong cách giảm các yếu tố may rủi là cố
gắng hạn chế việc sử dụng các loại câu hai lựa chọn.
2) Viết những lời chỉ dẫn sao cho thật rõ ràng để học sinh khỏi phải nhầm lẫn.
3) Chuẩn bị trước bản chấm điểm ghi rõ các câu đúng. Nên tham khảo với các
đồng nghiệp về những câu được cho là đúng, nhất là những câu thuộc loại điền
khuyết.
Người ta có thể tính độ tin cậy của bài trắc nghiệm bằng các cách sau đây:
Phương pháp trắc nghiệm - trắc nghiệm lại: có nghĩa là dùng một bài trắc
nghiệm cho một nhóm TS làm hai lần và tính hệ số tương quan giữa hai bộ điểm.
Phương pháp này co nhược điểm là: các đáp án của TS trong lần thứ hai không độc
lập với lần thứ nhất, trình độ của TS trong lần thứ hai đã có sự thay đổi.
Phương pháp các bài TN tương đương: cho một nhóm TS làm hai bài TN tương
đương rồi tính độ tương quan giữa hai bộ điểm số. Sẽ gây khó khăn trong việc soạn
thảo các đề TN tương đương thực sự.
Phương pháp phân đôi bài TN: chính là tạo 2 bài TN tương, mỗi bài là một nửa
bài TN. Để hai nửa bài thực sự tương đương, người ta sắp xếp từng cặp câu chẵn lẻ
tương đương nhau để có hai bài TN một gồm các câu chẵn và một gồm các câu lẻ. Độ
tin cậy của nửa bài TN bằng hệ số tương quan giữa hai bộ điểm của hai nửa bài TN,
còn độ tin cậy của toàn bài TN có thể thu được khi hiệu chỉnh về tăng độ dài gấp đôi.
Sự phụ thuộc của độ tin cậy của bài TN vào độ dài của nó được tính theo công
thức tổng quát Spearman-Brown:
r n = 1)1( s
s
rn
nr
trong đó: r s là độ tin cậy của bài TN ngắn xuất phát, r n là độ tin cậy của bài TN
có độ dài gấp n lần. Rõ ràng để hiệu chỉnh cho trường hợp bài TN có độ dài gấp đôi ta
phải dùng công thức:
r =
1
2
s
s
r
r
Phương pháp Kuder-Richardson: Việc tính độ tin cậy theo phương pháp này
dựa trên ý tưởng xem mỗi câu trong bài TN là một bài TN tương đương, tức là chúng
có cùng điểm trung bình và cùng phương sai. Dựa vào đó chúng ta có thể tính độ tin
cậy của một bài TN theo công thức Kuder-Richardson- 20 như sau:
r =
)1( k
k
(1-
2
pq )
Với: k- là số câu của bài TN
p- tỉ lệ trường hợp trả lời đúng cho một câu
q- tỉ lệ trường hợp trả lời sai cho một câu
- phương sai của tổng điểm mọi TS đối với toàn bài TN
Nhược điểm của công thức K-R-20 là phải biết độ khó p của mỗi câu TN. Nên
trong trường hợp độ khó của các câu TN không khác nhau nhiều thì ta có thể dùng
công thức sau:
R =
)1( k
k
2
)1(
1
k
M
M
Trong đó M là gía trị trung bình của điểm số bài TN. Đây chính là công thức
Kuder-Richardson-21.
1.2.3.4.2 Độ giá trị
Một phép đo lường bất kì chỉ có giá trị khi nó đảm bảo là phép đo đó đã đo
được cái cần đo. Phép đo bởi bài TN đạt được mục tiêu là phép đo có giá trị. Hay, độ
giá trị của một bài TN là đại lượng biểu thị mức độ đạt được mục tiêu đề ra cho phép
đo nhờ bài TN.
Nhìn từ các góc độ và sắc thái khác nhau độ giá trị thường được phân loại như
sau:
1. Độ giá trị tiên đoán: một bài TN dùng để xét tuyển thường cần có độ giá trị
tiên đoán, tức là bộ điểm số của nó tương quan tốt với một bài TN đánh giá hoặc các
tiêu chí để đánh giá theo mục tiêu. Chẳng hạn, bộ điểm số của bài TN tuyển sinh đại
học đối với một nhóm TS nào phải tương quan tốt với kết quả học tập cuối giai đoạn
1 đại học, chẳng hạn theo tiêu chí điểm trung bình của giai đoạn 1 đại học.
Để nâng cao giá trị tiên đoán người ta thường không chỉ dùng một bài TN tiên
đoán, mà dùng nhiều bài TN khác nhau hoặc các yếu tố khác nhau kết hợp với nhau
để tiên đoán.
2. Độ giá trị đồng thời: nói lên mối quan hệ giữa điểm số của bài TN với một
tiêu chí khác đồng thời, đã có sẵn và được nhiều người chấp nhận, về khả năng mà bài
TN ấy muốn đo lường. Tức là bài TN đánh giá hoặc các tiêu chí để đánh giá xảy ra
đồng thời với bài TN tiên đoán.
3. Độ giá trị nội dung: độ giá trị nội dung phản ánh đầy đủ các mục tiêu xác
định cho môn học, bao trùm đầy đủ nội dung của môn học. Để xây dựng được một bài
TN có độ giá trị về nội dung, cần phải thiết kế bài TN dựa vào toàn bộ nội dung, vào
các loại trí năng mà mức kĩ năng mà môn học đòi hỏi. Để xác định độ giá trị về nội
dung không thể chỉ dựa vào các tính toán thống như độ giá trị tiên đoán hoặc độ giá
trị đồng thời, mà phải phân tích tỉ mỉ và công phu bài TN đối chiếu với mục tiêu và
nội dung môn học. Một bài TN có thể bao trùm nhiều nội dung môn học, vì có nhiều
câu hỏi, nhưng nó vẫn có thể kém giá trị vì chỉ chú trọng vào một phần nội dung nào
đó mà bỏ qua các phần quan trọng khác, hay bài TN ấy xem các phần giống nhau
không có sự ưu tiên cho kiến thức quan trọng
4. Độ giá trị cấu trúc: liên quan đến các loại trí năng và mức kĩ năng cần đo theo
các mục tiêu cụ thể của môn học.
Để có một bài trắc nghiệm có giá trị thì điều quan trọng là ta phải xác định được
cái cần đo và các mục tiêu của môn học. Như vậy trước khi khảo sát trước học sinh
thì người soạn TN phải suy xét và phán đoán các mức trí năng, kĩ năng sao cho phù
hợp với mục tiêu môn học…
Tóm lại để đánh giá một bài TN chúng ta xem xét trên hai yếu tố: độ tin cậy và
độ giá trị. Một bài TN tốt thì nó phải có được yếu tố tin cậy (kết quả TN có tính vững
trãi) và yếu tố giá trị (đo được cái cần đo). Một bài TN có thể đáng tin cậy mà không
có giá trị, nhưng ngược lại thì không đúng. Nó có thể cho ra những điểm số đáng tin,
nhưng không đo lường đúng loại thành quả học tập mà ta muốn đo lường. Tuy nhiên
một bài TN không tin cậy thì không thể nào có giá trị được. Hai sắc thái khác nhau
của độ tin cậy và độ giá trị là ở chỗ:độ tin cậy thì liên quan đến sự vững trãi của điểm
số, trong khi tính giá trị liên quan đến mục đích của sự đo lường.
1.2.3.4.3 Các loại điểm số TN
Một học sinh đạt được 50, 45, 30 điểm về bài TN toán, lý, hoá (điểm thô), nếu
như vậy chúng ta sẽ không thế nào biết được “học sinh ấy” đã đạt thành tích G hay
kém về môn học ấy. Điểm số nào của anh ta là trên trung bình? điểm nào cao nhất?
điểm nào thấp nhất?. Vì không có chuẩn mực nào để so sánh nên các câu hỏi tương tự
như vậy đều không trả lời được.
Để có thể giải thích các điểm thô trên bài TN, ta cần phải có hai căn bản nào đó
để so sánh chúng. Thông thường có hai lối so sánh:
+ So sánh với tiêu chuẩn tuyệt đối hay với độ khó về nội dung
+ So sánh với một nhóm được dùng làm chuẩn mực.
1) So sánh với tiêu chuẩn tuyệt đối
Các điểm TN thuộc loại này được đăt trên căn bản so sánh thành quả đạt được
của mỗi người với điểm số tối đa có thể đạt dược với bài TN ấy. Các điểm số của
những người khác cùng làm bài TN ấy không ảnh hưởng gì đến việc xác định điểm số
của bất cứ người nào trong nhóm làm TN ấy cả.
a. Điểm phần trăm đúng:
Điểm phần trăm đúng so sánh điểm số của người làm TN với điểm số tối đa có
thể đạt được, hay nói một cách khác nhau, loại điểm số này có thể xem như là điểm số
trên 1 bài TN với 100 câu hỏi.
X=
T
100
Đ
Trong đó:X: điểm tính theo tỷ lệ %
Đ: số câu TN làm đúng
T: tổng số câu TN
Như vậy yếu tố xác định điểm số câu TN thuộc loại này là độ khó của nội dung
bài TN.
b. Điểm chữ:
Là loại điểm cũng căn cứ trên tỉ lệ % số câu đúng, nhưng được biểu thị bằng
các mẫu tự A, B, C, D, …
Cả hai loại điểm trên đều bị chỉ trích vì tính cách chủ quan và tuỳ tiện trong
việc ấn định các mức điểm.
2) So sánh với nhóm làm chuẩn mực
Để biết được khả năng của một người làm TN so sánh với những người khác
trong nhóm làm chuẩn mực ta phải lựa chọn một nhóm chuẩn mực và thiết lập các
thang bậc, sau đó từ điểm thô ta biến cải theo thang bậc trên.
Ta có 2 loại điểm sau:
a. Điểm bách phân:
Là điểm trên thang điểm số mà ở đó có một số % trường hợp nào đó rơi vào
chính điểm ấy hay ở dưới nó.
Dựa vào điểm bách phân ta không những xếp hạng được TS từ thấp đến cao
trong một mẫu mà còn tính đến cả cỡ của mẫu tức số người trong một mẫu.
b. Điểm tiêu chuẩn:
Điểm tiêu chuẩn được dùng để khắc phục nhược điểm của điểm bách phân:
người ta không thể lâý trung bình của các thứ hạng bách phân nên ta không thể tính
khả năng trung bình của một người làm nhiều bài TN khác nhau, hay trung bình của
một nhóm người về một bài TN.
Điểm tiêu chuẩn được quan điểm như là một lối phát biểu khoảng cách của
điểm ấy tính từ trung bình, hay cũng có thể xem như là những điểm số đã được gán
cho một trung bình và một độ lệch tiêu chuẩn nào đó. Đây là loại điểm ưa chuộng
nhiều hơn trong TN và nghiên cứu.
Một số loại điểm chuẩn:
Điểm Z: là loại điểm chuẩn căn bản. Nó cho ta biết hiệu số (hay khoảng cách)
giữa một trị số điểm thô náo đó và được trung bình trong nhóm làm bài TN.
Z=
S
Trong đó: X: là điểm thô nào đó
: điểm thô trung bình trong nhóm làm TN
S: độ lệch tiêu chuẩn của nhóm
Nhược điểm của loại điểm Z này là: một nửa số điểm Z mang điểm số âm và tất
cả các điểm Z đều phải mang một hay nhiều số lẻ.
Điểm tiêu chuẩn V
Về căn bản, điểm tiêu chuẩn V cũng giống như điểm Z nhưng nó được quy về
phân bố bình thường với trung bình là 10 và độ lệch tiêu chuẩn là 4
Công thức: V=4*Z + 10
Điểm chuẩn V khắc phục được điểm âm
Để phù hợp với hệ thống điểm 11 (từ 0 đến 10) người ta chọn điểm trung bình
là 5 và độ lệch chuẩn là 2, từ đây ta có điểm tiêu chuẩn mới.
Điểm V (mới) =2*Z + 5
1.2.4. Lý thuyết ứng đáp câu hỏi và mô hình Rasch
1.2.4.1. Lí thuyết ứng đáp câu hỏi
Lí thuyết ứng đáp câu hỏi (Item Respone Theory hay gọi tắt là IRT) của Geog
Rasch đã mô hình hoá mối quan hệ giữa mức độ khả năng của một người và đáp ứng
của người ấy với một câu hỏi. Vì các mức độ khả năng là những gì không thể quan sát
được nên lí thuyết ứng đáp câu hỏi (IRT) cũng là một trong các mô hình được gọi là
mô hình đặc điểm tiềm tàng.
Khi xây dựng một mô hình toán học nói chung, để đơn giản và khả thi, bao giờ
người ta cũng quan tâm đến những mối quan hệ bản chất nhất, tước bỏ bớt những yếu
tố phức tạp nhưng không bản chất. Để xây dựng mô hình toán phản ánh quan hệ các
mối tương tác nguyên tố TS – CH, trong lý thuyết ứng đáp CH người ta giả định sau
đây:
(1). Chỉ một thuộc tính hoặc một năng lực được đo bởi các câu hỏi tạo nên bài
TN. Đó là giả định về thuộc tính đơn thứ nguyên. Trong thực tế thường có nhiều nhân
tố ảnh hưởng lên việc làm TN( động cơ, sự hồi hộp, khả năng làm nhanh, xu hướng
đón nhận, khả năng nhận thức…) ngoài năng lực chính được đo bởi bài TN. Vậy để
đạt giả định về tính đến thứ nguyên cần xây dựng bài TN sao cho khu biệt được thành
phần chính ảnh hưởng lên việc làm bài TN. Thành phần đó được xem là năng lực
nào đó được đo bởi bài TN. Năng lực này không nhất thiết là phải cố hữu hoặc không
đổi, nó có thể thay đổi theo thời gian do học tập thêm, do quên kiến thức hoặc thay
đổi do các yếu tố khác.
Khi giả định về đơn thứ nguyên thoả mãn, cũng sẽ có tính độc lập địa phương.
Điều này có nghĩa là khi giữ không đổi năng lực ảnh hưởng lên việc làm bài TN, việc
TL của TS đối với CH. Tập hợp các năng lực ấy biểu diễn một không gian năng lực
tiềm ẩn đầy đủ.
(2). Có một hàm đặc trưng của CH ( Iten Characteristic Function – ICF) phản
ánh mối quan hệ thực giữa các biến không quan sát được (năng lực) và các biến quan
sát được việc TLCH.
Để xây dựng IRT người ta thừa nhận 2 định đề sau:
1) Việc trả lời của 1 TS đối với 1 CH có thể dự báo bởi năng lực của TS.
2) Quan hệ giữa việc TLCH bởi TS và năng lực làm cơ sở cho hàm đặc trưng
CH ( ICC ). Hàm nói trên có đặc điểm là khi mức năng lực tăng xác suất để trả lời
đúng 1 CH sẽ tăng lên.
Đường cong đặc trưng CH (ICC) và đường phân bố năng lực của hai mẫu TS.
Hình trên thể hiện một ICC đối với TH khi chỉ có 1 năng lực làm cơ sở để
TLCH, cùng với hai hàm phân bổ năng lực của 2 nhóm TS. Ta thấy rằng: những TS
có năng lực thấp hơn dù TS đó có nằm ở nhóm nào đi nữa.
IRT cho phép ước lượng các sai số chuẩn của các giá trị ước lượng năng lực của
1 TS, chứ không phải là một ước lượng sai số cho mọi TS như trong lý thuyết cổ điển.
1.2.4.2. Mô hình Rasch
1.2.4.2.1. Giả thiết của Rasch về sự ứng đáp CH
Giả sử ta khảo sát một mối quan hệ nguyên tố mà trong đó TSv có một mức
năng lực nào đó âv nào đó về lực đo, đứng trước CHi có một độ khó ci.
Theo Rasch: “ Một TS có khả năng hơn TS khác phải có một xác suất lớn hơn
để trả lời đúng một CH bất kỳ, hay một câu hỏi khó hơn một CH khác, đối với bất kỳ
một TS nào xác suất để TL đúng CH sau là lớn hơn so với câu hỏi trước.
1.2.4.2.2. Hàm ứng đáp câu hỏi theo Rasch
Theo giả định của Rasch, xác suất của câu trả lời CHi phụ thuộc vào độ chênh
lệch giữa năng lực âv của TS và độ khó i của CHi, tức là hiệu số (âv- i). Khi âv=i,
rõ ràng xác suất trả lời đúng CH là 1/2 : có thể dễ dàng hiểu trạng thái này khi ước
đoán xác suất thắng cuộc của hai đô vật ngang sức nhau. Khi âv<<i, xác suất trả lời
đúng CH là gần bằng 0, còn khi âv>>i, xác suất trả lời đúng CH gần bằng 1. Như vậy
hàm ứng đáp CH tăng đơn điệu từ 0 đến 1 khi âv-i biến đổi từ -∞ đến +∞, qua giá trị
1/2 khi âv-i = 0. Rasch đã chọn một hàm giải tích với biểu thức toán học đơn giản
nhất có dáng điệu biến đổi như vậy:
Pi (v) =
iv
iv
e
e
1
Trong đó Pi (âv) là xác suất của TS có năng lực âv trả lời đúng CH có độ khó v,
e là cơ sở lôgarit tự nhiên.
Hình 2 biểu diễn ICC theo mô hình Rasch.
Mô hình Rasch ứng với hàm ứng đáp CH dạng đơn giản nhất, chỉ chứa một
tham số độ khó. Đối với mô hình một tham số người ta giả thiết các CH có độ phân
biệt như nhau, do đó các ICC của các CH có dạng như nhau, chúng chỉ khác nhau ở vị
trí của nó nếu biểu diễn đường cong theo trục năng lực â.
1.24.2.3. Tính bất biến
Tính bất biến là hòn đá tảng của IRT, biểu hiện sự khác nhau cơ bản giữa IRT
và lý thuyết trắc nghiệm cổ điển. Nội dung của tính bất biến đó là: các tham số đặc
trưng cho một CH không phụ thuộc vào phân bố năng lực của các TS và các tham số
đặc trưng cho một TS không phụ thuộc vào bộ CH của bàI trắc nghiệm.
Để hiểu sâu hơn tính bất biến đó đên đối với IRT, có thể lập luận như sau. Đối
với mô hình Rasch, từ biểu thức (1) của xác suất trả lời đúng, ta có thể xác định tỷ số
các phần bù(odds):
P/(1-P)= e(- )
Và từ đó: ln[P/(1-P)] = (âv -i)
1
0.5
0
P(â-)
(â-)
Hình 2
Nếu xuất phát từ một CH, có độ khó xác định i, đường biểu diễn của hàm
ln(odds)=(â) phụ thuộc vào năng lực â là một đường thẳng cắt trục tung tại I. Tức là
với các mẫu TS có các năng lực âi bất kỳ trong tổng thể TS, nếu mô hình ICC đó
được thoả mãn, giá trị i thu được của CHi đang xét là duy nhất. Mặt khác, nếu xuất
phát từ một TSv có năng lực xác định là âv đường biểu diễn ln(odds) = g() là một
đường thẳng cắt trục tung tại - âv. Tức là với các mẫu CH có các độ khó i bất kỳ
trong tổng thể CH, nếu mô hình ICC được thoả mãn, giá trị âv thu được của TSv đang
xét là duy nhất.
Từ lập luận trên có thể thấy rõ ràng tính bất biến đang xét chỉ đúng khi số liệu
thực tế thoả mãn mô hình ICC. Nói cách khác, tính bất biến đồng nhất với tính phù
hợp của số liệu thực tế với mô hình toán.
Một điều cần lưu ý nữa là tính bất biến đó là tính chất của tổng thể, chứ không
phải của một mẫu nào đó, vì ICC theo định nghĩa là đường hồi quy của sự trả lời CH
ở một năng lực nào đó, do đó P là giá trị trung bình của mọi trả lời CH trong tổng thể
các TS có một năng lực âv xác định. Đối với một mẫu TS con trong tổng thể có năng
lực âv chưa chắc giá trị trung bình của moi trả lời CH trong mẫu đó đã thoả mãn mô
hình ICC, hoặc nếu có một mẫu con thoả mãn thì các mẫu khác cũng chưa chắc đã
thoả mãn, do đó nói chung không thể hy vọng sự bất biến xảy ra trong tất cả các mẫu
cho dù mô hình phù hợp với dữ liệu của cả tổng thể. Trong thực tế ta có thể xác định
mức độ bất biến khi sử dụng các mẫu số liệu, chẳng hạn xét sự tương quan của năng
lực xác định được qua các ước lượng từ hai mẫu khác nhau.
1.2.4.2.4. Thang đo năng lực và điểm thực
Mục đích cuối cùng của trắc nghiệm là gán một điểm số nào đó cho TS, phản
ánh mức độ đạt được của TS về một năng lực nào đó được đo bởi bài trắc nghiệm.
Hiển nhiên là điểm đó phải được giải thích cẩn thận và phải có giá trị đối với mục
đích sử dụng.
Trong khuôn khổ lý thuyết trắc nghiệm cổ đỉên người ta thường gán số câu
đúng (điểm thô) cho TS, xem đó là ước lượng điểm thực của TS đối với bài trắc
nghiệm. Đối với IRT mỗi TS có một năng lực bên trong â, năng lực này xác định xác
suất trả lời đúng CH của anh ta, và cũng dựa trên việc TS trả lời bài trắc nghiệm để
xác định năng lực của TS. Theo IRT người ta có thể ước lượng được â, va ta sẽ thấy
sau này là â có mối quan hệ đơn điệu với điểm thực nếu dữ liệu thực tế phù hợp với
mô hình.
Bản chất của điểm thực
Gọi điểm thô của TS là X, đó là ước lượng của điểm thực . Ta định nghĩa điểm
thực là một biến đổi tuyến tính của điểm thô, và biểu diễn:
E(X) =
Chia X cho tổng CH sẽ được điểm tỷ lệ trả lời đúng (biến đổi tuyến tính). Điểm
tỷ lệ trả lời đúng có ý nghĩa cả khi chia bài trắc nghiệm ra các bài trắc nghiệm con có
số câu khác nhau để đo các đối tượng khác nhau.
Dù biến đổi thế nào, nhược điểm lốn của điểm X vẫn tồn tại: nó không độc lập
với các CH mà một TS trả lời, và điểm biến đổi không độc lập với nhóm TS liên
quan. Trong khi đó thì năng lực â có tính độc lập vừa nêu. Vì có thể so sánh các TS
trả lời các bộ CH khác nhau khi dùng điểm â nên có thể xem thang điểm â là một
thang điểm tuyệt đối ứng với năng lực tiềm ẩn được đo.
Bản chất của thang đo mà trên đó â được xác định là gì? Thang X không là
thang tỷ lệ, cũng không phải thang khoảng cách, mà có thể xem đó là thang thứ tự.
Thang đo mà trên đó â được xác định cũng vậy, nhưng đôi khi có thể giải thích thang
mà trên đó â được xác định như là một thang tỷ lệ “giới hạn”.
Chuyển đổi sang thang điểm thực
Chuyển đổi quan trọng nhất của thang điểm â là chuyển sang thang điểm thực.
Gọi X là điểm thô tính theo số câu đúng:
X =
n
j
jU
1
Trong đó Uj là các câu trả lời đúng 1 và sai 0 của một TS cho CHj. Nếu biểu
diễn điểm thực là thì theo biểu thức (2)
=E(X) =E(
n
j
jU
1
)= )(
1
n
j
jUE
Nếu một biến ngẫu nhiên Y lấy giá ntrị y1 và y2 với các xác suất tương ứng là P1
và P2 thì
E(Y) = y1P1 + y2P2
Vì Uj nhận giá trị 1 với xác suất Pj(â) và giá trị 0 với xác suất Qj(â) nên ta có thể
biểu diễn:
E(Uj) = 1.P(â) + 0.Qj(â) = Pj (â)
Cuối cùng:
= )(
1
n
j
jP
Tức là: điểm thực của một TS có khả năng â là tổng của các đường cong đặc
trưng của mọi CH trong bài trắc nghiệm, do đó điểm thực cũng được gọi là đường
cong đặc trưng của bài trắc nghiệm. Cần một lần nữa nhắc lại rằng quan hệ trên chỉ
đúng khi mô hình trả lời câu hỏi phù hợp với số liệu thực tế.
Việc chuyển đổi từ biến năng lực â sang điểm thực có tác dụng quan trọng sau:
1) loại bỏ các giá trị âm; 2) tạo nên thang đo với các điểm từ 0 đến n (hoặc theo tỷ lệ
từ 1% đến 100%), dễ giải thích; 3) có thể xác định điểm cắt, từ đó suy ngược lại điểm
cắt trên thang â; 4) một tác dụng quan trọng là nếu biết trước năng lực â của một TS
nào đó thì có thể tính điểm của một bài trắc nghiệm mà TS đó không làm (xem lại thí
dụ về vận động viên nhảy cao đã nêu trên đây). Từ đó có thể tiên đoán điểm thực của
TS hoặc tình trạng đạt hoặc không đạt đối với một bài trắc nghiệm mới. Tính chất này
cồn được sử dụng để xác định các hằng số của thang điểm khi đặt các tham số của
hai bài trắc nghiệm trên cùng một thang đo (equating).
Chương 2: Lập dàn bài trắc nghiệm
2.1. Mục đích của bài TN
Bài kiểm tra này nhằm kiểm tra những hiểu biết tối thiểu về phần Hoá hữu cơ -
11. Bên cạnh đó còn nhằm kiểm tra những chỗ mạnh chỗ yếu của học sinh, giúp học
sinh phát hiện những kiến thức chưa đầy đủ qua một số câu hỏi có tính chất đòi hỏi
học sinh phải hiểu rõ vấn đề, giúp học sinh khái quát được kiến thức đã học một cách
toàn diện. Đánh giá năng lực thực của học sinh một cách chính xác hơn.
2.2. Phân tích nội dung môn học
Bao gồm chủ yếu việc xem xét và phân biệt 4 loại học tập:
(1). Những thông tin mang tính chất sự kiện mà học sinh phải nhớ hay nhận ra.
(2). Khả năng và ý tưởng mà chúng ta phải giải thích hay minh hoạ
(3). Những ý tưởng phức tạp mà chúng ta cần giải thích hay giải nghiã.
(4). Những thông tin, ý tưởng và kĩ năng cần được ứng dụng hay chuyển dịch
sang một tình huống mới.
Phần này bao gồm các bước sau:
Bước 1. Tìm ra những ý tưởng chính yếu của phần đó.
1) Định nghĩa - CTTQ.
2) Đồng đẳng - đồng phân.
3) Danh pháp – cấu tạo.
4) Tính chất hoá học.
5) Điều chế.
Bước 2. Lựa chọn những từ, nhóm chữ và cả những ý kiến (nếu có) mà học sinh
sẽ phải giải nghĩa.
a) Ankan, Anken, Ankin, Ankadien, Xiclo ankan.
b) Quy tắc thế và cộng.
Bước 3. Phân loại hạng thông tin được trình bày
a) Những thông tin nhằm mục đích giải nghĩa hay minh hoạ
- Các định nghĩa.
- Cấu tạo của một số chất cơ bản.
b) Những khái luận quan trọng:
Quy tắc thế vào các hiđrocacbon no.
Quy tắc cộng ( Macopnhicop) vào hiđrocacbon no.
Quy tắc thế trong vòng benzen.
Tính chất hoá học đặc trưng của từng loại hợp chất
Bước 4. Lựa chọn một số thông tin và ý tưởng đòi hỏi học sinh phải có khả
năng ứng dụng những điều đã biết để giải quyết những vấn đề trong những tình
huống mới.
Tính chất hoá học của từng hợp chất.
Cách điều chế.
Tên gọi ( danh pháp)
Thiết lập dàn bài TN
Kĩ năng
Nội dung
Nhớ Hiểu áp dụng
Phân
tích
Tổng
hợp
Đánh
giá
(1) (2) (3) (4) (5) (6)
1. Định nghĩa 2 câu
2. CTTQ 1 câu 1 câu 2 câu
3. Danh pháp 2 câu
4. Tính chất hoá
học
2 câu 1 câu 2 câu 4 câu 1 câu
5. Điều chế 5 câu 1 câu
6. Cấu tạo 3 câu 1 câu
7. Tỉ khối hơi 1 câu
2.4 Quá trình thực hiện.
Bao gồm các bước sau:
Bước 1: nghiên cứu nội dung kiến thức cần kiểm tra (phần ankan, xicloankan, anken,
ankađien-caosu, ankin). Lập dàn bài sơ lược.
Bước 2: Tạo bảng đặc trưng hai chiều và lập câu hỏi chi tiết dựa theo bảng đặc
trưng hai chiều trên.
Bước 3: Liên hệ với trường PTTH Hai Bà Trưng - Hà Nội để lấy mẫu kiểm tra.
Bước 4: Tham khảo ý kiến của GV giảng dạy bộ môn Hoá cùng các bạn về nội
dung bài kiểm tra tránh gặp phải một số sai sót (kiến thức quá khó hay quá dễ, chưa
tổng quát…). Sau đó hoàn chỉnh lại các câu hỏi một cách hợp lí hơn.
Bước 5: Mã hoá đề thi tạo lập 6 đề khác nhau dựa trên 29 câu hỏi đã viết.
Bước 6: Tiến hành kiểm tra trên mẫu TS (các lớp 11E1, 11G1, 11H2), dưới sự
giúp đỡ của cô giáo phụ trách bộ môn: Vũ Thị Liên.
Bước 7: Chấm bài lấy điểm kiểm tra một tiết, thống kê số liệu.
Bước 8: Nhập dữ liệu để chạy chương trình Quest.
Bước 9: Phân tích và đánh giá kết quả thu được, tìm ra ưu nhược điểm của bài
kiểm tra đề ra những phương pháp nhằm hạn chế các sai sót.
CHƯƠNG 3: PHÂN Tích kết quả
3.1. Phân tích bài tn
3.1.1. Phân tích câu TN
Việc phân tích các câu hỏi dựa vào độ khó và độ phân cách của từng câu. Độ
khó của câu hỏi tuỳ thuộc vào câu đó có mấy phương án lựa chọn vì:
Độ khó pi của câu hỏi = (100 + 100/ n)/ 2
Trong đó n là số phương án trả lời trong một câu hỏi. Độ khó cho ta biết được một
bài TN nên để lại những câu nào và loại đi những câu nào. Ta không thể để lại những
câu mà hầu hết học sinh đều làm được và cũng không thể để lại những câu mà hầu
hết học sinh không làm được. Một câu TN tốt là câu TN mà có độ khó vừa phải, theo
công thức trên thì với câu hỏi có 4 lựa chọn thì độ khó vừa phải là 62,5%, câu có 3
lựa chọn là 66,67% và câu loại đúng sai là 75%.
Độ phân cách của câu hỏi cho ta biết câu hỏi đo có phân biệt được học sinh giỏi
và học sinh kém. Nếu độ phân cách nhỏ hơn 19 thì câu có độ phân cách không tốt
câu này không thể phân biệt được học sinh giỏi và học sinh kém. Độ phân cách từ 20
đến 29 có thể coi là tạm được, độ phân cách từ 30 đến 39 là khá tốt và độ phân cách
từ 40 trở lên là rất tốt.
Cách tính độ phân cách và độ phân biệt có thể được tính theo mục 3 trang 24.
Dựa trên cơ sở đó chúng ta có nhập dữ lệu vào và chạy theo chương trình QUEST để
tính độ tin cậy và độ phân biệt (xem phần phụ lục).
Qua chương trình Quest kết quả cho ta 17 câu có thể chấp nhận được, trong đó có
4 câu dễ và 13 câu khó và 12 câu phải sửa đổi hoặc bỏ đi thay bằng câu khác.
Ta sẽ đánh giá một số câu TN ở trên.
Ta xét câu 8: (câu có độ phân biệt cao).
Phản ứng sau: CH2 CH CHCH2 + HCl (tỉ lệ 1:1) có sản
phẩm chính là:
C) CH2 CH 2CHCH2
A) Cl
B) D)
PAC A B C D
STS 5 29 4 48
% 5,8 33,7 4,7 55,8
D -0,07 0,34 -0,08 -0,25
Độ phân biệt của phương án đúng là dương và có giá trị lớn D= 0,34>0,2 rất tốt,
còn độ phân biệt của các phương án nhiễu là âm rất phù hợp. Nhưng độ khó của câu
này cách quá xa so với độ khó trung bình 33,7 < 62,5. Như vậy có thể dùng câu này
trong việc phân biệt giữa HS giỏi và HS kém.
Ta xem tiếp một ví dụ nữa là câu 26:(câu tốt)
Cho hai bình khí: C2H4 và C2H2 có thể nhận biết bằng cách nào?
A) dd Br2 B) dd KMnO4
C) dd AgNO3/ NH3 D) Cả ba cách trên
PAC A B C D
STS 13 7 53 25
% 13,3 7,1 54,1 25,5
D -0,19 -0,01 0,43 -0,33
Đây là một phương án rất tốt vì: Độ phân biệt của phương án đúng dương và
khá cao 0,43 và độ khó là 54,1 < 62,5 đồng thời các phương án nhiễu đều có độ phân
biệt âm, rất phù hợp.
CH3CHCHCH2
Cl
CH3CHCHCH3
Cl Cl
CH3CHCHCH2
Cl
Giả sử như câu 1:(câu quá dễ).
1) Hiđrocacbon no là:
A) Hiđrocacbon mà trong phân tử chỉ có liên kết đơn
B) Hiđrocacbon mà trong phân tử không có liên kết đôi
C) Hợp chất hữu cơ mà trong phân tử chỉ có liên kết đơn
D) Hợp chất hữu cơ mà trong phân tử chỉ có liên kết
PAC A B C D
STS 87 0 8 4
% 87,9 0 8,1 4,0
D 0,06 NA 0,06 0,00
Như vậy câu này có độ khó quá dễ (87,9) trong khi độ khó vừa phải của câu là
62,5%. Chính vì thế đây cũng là câu có độ phân biệt quá thấp. Các phương án lựa
chọn ở đây độ nhiễu không tốt, như phương án B quá dễ nên học sinh đều dễ dàng trả
lời được cần phải thay đổi lại câu hỏi này.
Xét đến câu 14:(câu không tốt)
14) Hãy chọn phương trình sai khi điều chế axetilen:
A) CaC2 + 2H2O Ca(OH)2 + C2H2
B) 2CH4 1500
oC C2H2 + 3H2
C) CH2Cl CH2Cl kiềm/rượu C2H2 + HCl
D) CaCO3 + H2O Ca(OH)2 + C2H2
PAC A B C D
STS 1 1 40 55
% 1,0 1,0 41,2 56,7
D - 0,15 0,09 0,03 -0,02
Độ khó của câu là 56,7 so với câu có 4 phương án lựa chọn thì đây cũng là một
câu hơi khó. Độ phân biệt của câu hỏi là -0,02 như vậy câu này khó hơn với TS giỏi
và dễ hơn với TS kém. Nguyên nhân của câu này là do khi đánh máy có sơ suất trong
phương án C do đó hầu hết các TS giỏi đều chọn phương án này và có thể phương án
C không được dạy ở trên lớp nên TS không biết và cũng không suy đoán ra.
Xét câu 22: (không tốt)
22) Phân tử axetilen có cấu tạo:
A) 4 liên kết và 1 liên kết
B) 3 liên kết giữa 2 nguyên tử C
C) 4 nguyên tử nằm trên cùng một mặt phẳng
D) 4 nguyên tử nằm trên cùng một đường thẳng và có 2 liên kết giữa 2 nguyên
tử C.
PAC A B
STS 58 37
% 61,1 38,9
D 0,07 -0,07
Đây là một câu hỏi có độ khó trung bình là 75% như vậy kết quả cho ta thấy là
độ khó của câu này khá thấp, có nghĩa là câu này khó, nhưng lại có độ phân cách thấp
D= -0,07. Cần phải xem xét lại câu 22: Đây có thể là do trong quá trình giảng GV
không chú trọng cấu tạo của phân tử metan không phân tích rõ để các em đã bị lừa
khi đọc qua câu hỏi.
Từ kết quả phân tích cho ta những câu tốt dùng để đo năng lực của HS và
những câu chưa tốt cần phải sửa hoặc bỏ đi. Qua 29 câu trên, ta thu được 17 câu có
thể chấp nhận được, trong đó có 4 câu dễ (câu: 2, 20, 25, 29) và 13 câu khó (câu: 3,
4, 6, 7, 8, 9, 10, 16, 17, 21, 23, 26, 28); và 12 câu phải sửa đổi hoặc bỏ đi thay bằng
câu khác.
3.1.2. Phân tích bài TN
Hai đại lượng quan trọng thường được dựa vào để đánh giá một bài TN là độ tin
cậy và độ giá trị.
Người ta thường sử dụng hệ số tương quan để diễn tả các đại lượng trên. Bài
TN này chúng ta thu được r = 0,96 chứng tỏ rằng bài kiểm tra này có độ tin cậy khá
tốt. Ngoài ra chúng ta còn phải kể đến các thành phần cấu tạo của các mẫu được chọn
khi tính toán thống kê như mẫu TS hoặc bài TN.
Đối với bài TN này ta sẽ xét từng thành phần. Trước hết là nội dung bài TN,
qua chương trình QUEST ta có kết quả sau:
Trung bình (mean): 0,00
Độ lệch chuẩn (SD): 1,35
Độ tin cậy : 0,96
Như vậy độ khó trung bình của bài TN này là 0,00 với độ lệch chuẩn là 1,35.
Các số thống kê hoà hợp là:
Infit mean square: 0,99 Outfit mean square: 1,00
SD : 0,08 SD : 0,14
Infit t : 0,03 Outfit t : 0,08
Tiếp theo ta xét đến các số liệu của mẫu:
Mean -0,33
SD 0,55
Các thông số hoà hợp với mô hình Rasch:
Infit mean square : 1,01 Outfit mean square : 1,00
SD : 0,25 SD : 0,40
Infit t : -0,01 Outfit t : 0,01
Trị số kì vọng của các bình phương trung bình (mean square) xấp xỉ bằng 1 và
trị số kì vọng của t xấp xỉ bằng 0 (trích theo 3, tr 133). Các số thông kê hoà hợp trên
đây cho thấy rằng các điều kiện ấy đã được thoả mãn.
Từ đồ thị “Item Fit Map” (xem mục lục) cho ta thấy rằng tất cả 29 câu trắc
nghiệm trong bài đều hoà hợp với mô hình Rasch. Nhưng theo đồ thị “Case Fit
Map” (xem mục lục) thì không phải tất cả các thí sinh tham dự đều hoà hợp với mô
hình Rasch. Nói chung các thông số về mẫu và câu trắc nghiệm đều hoà hợp với mô
hình Rasch.
Nếu xét đến từng TS ta lấy 2 thí dụ TS 01 và TS 74.
Đối với TS 01 ta có: Năng lực (ability) : 1,21
Fit : 1,62
Điểm thô (Score) :73,08
Như vậy thí sinh này có năng lực rất cao nhưng có những câu không vượt quá
khả năng mà vẫn sai như câu4, 15, 17, 19, 24, 27, 28. Nguyên nhân có thể do khi học
bài không kỹ, không chú ý khi cô giáo giảng bài nên không tiếp thu được đầy đủ
thông tin hoặc nhìn bài bạn. TS này không phù hợp với mô hình Rasch.
Đối với TS 74 ta có: Năng lực (ability) : -0,33
Fit : 0,87
Điểm thô (Score) :44,44
Đây là một TS hoà hợp với mô hình Rasch. Các câu 19, 20 là những câu dưói
năng lực nhưng vẫn không làm được là có thể vì câu hỏi chưa rõ ràng, phương án trả
lời chưa thoả mãn với ý của TS hoặc nhìn bài bạn.
Nhìn vào bảng phân bố giữa năng lưc- câu hỏi (Item estimates) ta thấy mức
năng lực của TS chưa được cao (r = 0.27), và sự phân bố câu hỏi là tốt (bài TN có
tính ổn định cao r =0.96). Độ ổn định về mức năng lực của học sinh chưa được cao vì
TS ở lớp này có học lực không đồng đều giữa các lớp (lớp 11H2 học lực rất kém so
với 11E1, 11G1), HS còn bỡ ngỡ với hình thức kiểm tra này.
Trên đây là một số phân tích về câu, mẫu và TS của bài TNKQ đối với HS khối
11(E1, G1, H2) tại trường PTTH Hai Bà Trưng Hà Nội. Qua kiểm tra và phân tích
kết quả tôi xin đưa ra một số ý kiến riêng của bản thân như sau:
1) TNKQ thực sự là một phương pháp khoa học và có hiệu quả thiết thực trong
việc đo lường thành quả của HS. Nó cho ta con số khá chính xác về năng lực của HS,
về độ khó và độ phân cách của câu TN, về độ tin cậy của bài TN… Từ đó ta có thể
định cỡ câu TN và mẫu TS để đánh giá thành quả học tập.
2) Với TNKQ ta hoàn toàn có thể kiểm tra được toàn bộ nội dung môn học, hạn
chế được may rủi, đỡ tốn công chấm bài và hoàn toàn khách quan trong thi cử…
3) Phương pháp này rất tốn thời gian để soạn đề nhưng nếu có sự hiểu biết sâu
sắc về lĩnh vực này (đặc biệt là các phần mềm để úng dụng) thì sẽ khắc phục được
điểm yếu này. Mỗi phương pháp TN đều có ưu nhược điểm riêng của nó, không có
một phương pháp nào được coi là hoàn hảo mà chỉ có cách phối hợp hiệu quả các
phương pháp để tạo nên hình thức đánh giá hoàn hảo. Hiện nay hầu hết các thầy cô ở
phổ thông đều cho rằng TNKQ có rất nhiều nhược điểm và không thích dùng nó để
đánh gía HS. Để phổ biến rộng rãi phương pháp TNKQ thì phải có nhiều tài liệu và
hình thức giảng dạy để GV thấy được những ưu nhược điểm của phương pháp này mà
ứng dụng linh hoạt vào công việc dạy học của mình.
Tài liệu tham khảo
1. Ph.d. Nguyễn Phụng Hoàng (chủ biên), 1996, Phương pháp trắc nghiệm
trong kiểm tra và đánh giá thành quả học tập, Nhà xuất bản GD.
2. TSKHGD. dương thiệu tống, 1995, Trắc nghiệm và đo lường thành quả
học tập, Bộ giáo dục và đào tạo trường ĐH tổng hợp TPHCM.
3. TSKHGD. Dương thiệu tống, 1998, Trắc nghiệm tiêu chí,Nhà xuất bản
GD.
4. Bộ giáo dục và đào tạo , 1994, Những cơ sở của kĩ thuật Trắc Nghiệm, Hà
Nội.
5. GS.TSKH. Lâm quang thiệp, 2003, Đo lường và đánh giá trong giáo dục,
Hà Nội.
Mục lục
Mở ĐầU ............................................................................................................ 1
Chương 1: CƠ Sở Lí LUậN ........................................................................... 5
1.1 lịch sử những phép đo lường và trắc nghiệm ............................................. 6
1.1.1 Trên thế giới ....................................................................................... 6
1.1.2. ở nước ta .......................................................................................... 7
1.2. Các khái niệm ........................................................................................... 8
1.2.1. Trắc nghiệm là gì? ............................................................................. 8
1.2.2. Trắc nghiệm khách quan là gì? ........................................................ 12
1.2.3. Các tiêu chuẩn để đánh giá các câu TN và bài thi TNKQ ................. 24
1.2.4. Lý thuyết ứng đáp câu hỏi và mô hình Rasch ................................... 41
Chương 2: Lập dàn bài trắc nghiệm .............................................................. 48
2.1. Mục đích của bài TN .............................................................................. 48
2.2. Phân tích nội dung môn học ................................................................... 48
2.3. Thiết lập dàn bài TN ........................................................................... 49
2.4 Quá trình thực hiện. ................................................................................. 49
CHƯƠNG 3: PHÂN Tích kết quả .................................................................. 51
3.1. Phân tích bài tn ....................................................................................... 51
3.1.1. Phân tích câu TN ............................................................................. 51
3.1.2. Phân tích bài TN .............................................................................. 54
Tài liệu tham khảo .......................................................................................... 58
Kí hiệu
TN : Trắc nghiệm
TNKQ: Trắc nghiệm khách quan
TL : Tự luận
GD : Giáo dục
TS : Thí sinh
HS : Học sinh
GV : Giáo viên
TL : Trả lời
CH : Câu hỏi
MCQ : Câu hỏi nhiều lựa chọn
Các file đính kèm theo tài liệu này:
- 2z_4401.pdf