Ở Việt Nam Chúng ta đã tổ chức một mùa tuyển sinh đại học bằng trắc
nghiệm khách quan và đạt được kết quả ngoài sức tưởng tượng. Ban đầu khi
chúng ta tiến hành kỳ thi thửa đầu tiên tại Đà Nẵng tưởng chừng như học sinh
không chấp nhận và gây nhiều dư luận cho xã hội, nhưng khi tiến hành chúng ta
làm song song cả đề thi tiểu luận và đề thi trắc nghiệm cho thí sinh lựa chọn. Kết
quả là có 70% số thí sinh tham dự đã chọn đề thi bằng trắc nghiệm khách quan là
con số ngoài dự đoán và mong đợi của những nhà tổ chức.
57 trang |
Chia sẻ: lylyngoc | Lượt xem: 2730 | Lượt tải: 6
Bạn đang xem trước 20 trang tài liệu Luận văn Tổng quan về phương pháp trắc nghiệm khách quan, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
độ thí sinh hay không?
-Có những đầu mối hở không chủ tâm để doán câu trả lời hay không?
-Có phải rõ ràng một câu trả lời đúng (hoặc tốt nhất) cho từng câu hỏi
không?
-Loại câu hỏi đó có phù hợp với thông tin cần biết hay không ?
-Những nhận định trong các câu hỏi có gì là xúc phạm hay không ?
-Có đủ các câu hỏi tiêu biểu để tạo ra được một mẫu thích hợp của các hành
vi được đánh giá hay không?
Việc xét duyệt các câu hỏi này được đem ra thử nghiệm là để đảm bảo sao
cho chúng ta tránh được cách diễn đạt bằng ngôn ngữ quá phức tạp đối với các ý
tưởng đang định trắc nghiệm, Tránh các từ thừa, các phủ định kép và các câu
nhiễu không hợp lý. Khi xem xét cũng cố gắng tìm ra các câu hỏi không có câu
trả lời đúng (hay tốt nhất) cũng như các câu có nhiều phương án trả lời đúng. Các
câu hỏi như vậy có thể được loại bỏ hay viết lại.
II.1.4.Lưu ý chung khi viết câu hỏi khách quan.
+Yêu cầu chung:
1.Sử dụng ngôn ngữ phù hợp với thí sinh
2.Không hỏi ý kiến riêng của thí sinh, chỉ hỏi sự kiện, kiến thức.
Loại nhiều lựa chọn:
1.Các phương án sai phải có vẻ hợp lý.
2.Chỉ nên dùng 4 hoặc 5 phương án chọn
3.Đảm bảo cho câu dẫn nối liền với mọi phương án chọn theo đúng ngữ
pháp.
4.Chỉ có một phương án chon là đúng
5.Tránh dùng câu phủ định, đặc biệt là phủ định hai lần.
6.Tránh lạm dụng kiểu “không phương án nào trên đây đúng” hoặc “mọi
phương án trên đây là đúng”
7.Tránh việc tạo phương án khác biệt so với các phương án khác (dài hơn
hoặc ngắn hơn, mô tả tỉ mỉ hơn…)
8.Phải sắp xếp phương án đúng theo thứ tự ngẫu nhiên.
II.2.Các đại lượng đặc trưng liên quan đến bài trắc nghiệm
II.2.1.Xác suất.
Đối với các hiện tượng ngẫu nhiên người ta không thể biết chắc chắn một sự
kiện hoặc biến cố gì đó xảy ra, chỉ có thể nói xác suất xẩy ra một biến cố nào đó.
Ví dụ xác suất xuất hiện một sự cố như sự xuất hiện “mặt lục” của xúc sắc 6 mặt
là 1/6. Xác suất là motọ số không âm, có giá trị từ 0 đến 1, xác suất bằng 0 ứng
với sự cố không thể xảy ra, xác suất bằng 1 ứng với sự cố chắc chắn xảy ra.
II.2.Bản đặc trưng 2 chiều
Khi chúng ta đã có trong tay một đề kiểm tra được xây dựng đúng theo các
bước như trên đây nhưng liệu chúng ta đã đảm bảo được chất lượng của đề thi đó
là tốt hay xấu chưa. Để trả lời câu hỏi này chúng tôi xin giải thích rõ hơn về bản
đặc trưng hai chiều. Vậy bản đặc trưng hai chiều là gì ? bản đặc trưng 2 chiều là
khái niệm để đánh giá đề thi mà chúng ta cho kiểm tra đã đạt chưa và đã đạt được
đúng mục tiêu giảng dạy chưa. Một đề thi muốn đạt được chất lượng tốt nghĩa là
nó phải đo được cái cần đo hay bám sát vào mục tiêu giảng dậy. Về nội dung
phải đảm bảo vừa tầm với học sinh, kiến thức bao quát được cả quá trình dạy, các
câu được phân bố đồng đều về cấu trúc cũng như nội dung chương trình. Như vậy
để đánh giá được cả một đề thi đó ra sao chúng ta phải đánh giá đến từng câu hỏi
một. Yêu cầu ở mỗi câu hỏi ở mức kỹ năng nào : nhớ, hiểu hay áp dụng … Để
hiểu rõ vấn đề chúng tôi xin phân tích đề thi mà chúng tôi đã tíến hành thử
nghiệm về nội dung và các yêu cầu của một đề thi bằng trắc nghiệm KQ qua các
phần sau đây:
I.2.1.Sơ lược về kiến thức chương trình hoá 10.
Đây là yếu tố quan trọng nhất để xây dựng một đề thi bất kỳ nào đó kể cả tự
luận hay trắc nghiệm. Chỉ có những người có chuyên môn thật vững kiến thức thì
mới có khả năng ra một đề thi tốt được. Mà một đề thi muốn tốt thì người ra đề
thực sự phải có chuyên môn sâu vì họ sẽ đánh giá cho câu hỏi về vấn đề gì mà
đảm bảo kiến thức xuyên suốt chương trình mà đạt được mức độ nhận thức theo
mức độ chương trình chung.
II.2.1.1.Cấu trúc chương trình
Chương trình hoá lớp 10 gồm 5 chương sau:
-Chương I: Cấu tạo nguyên tử
-Chương II: liên kết hoá học định luật tuần hoàn Menđelêep
-Chương III: Phản ứng Oxi hoá khử
-Chương IV: Phân nhóm chính nhóm VII- nhóm halogen
-Chương V: Oxi-lưu huỳnh lý thuyết phản ứng hoá học
II.2.1.2.Nội dung chính của từng chương
*Chương I: Cấu tạo nguyên tử
Yêu cầu chính của chương trình là học sinh nắm được các khái niệm cơ bản
thuyết cấu tạo nguyên tử. Ví dụ thành phần cấu tạo của nguyê ntử ra sao, hạt
nhân nguyên tử là gì, thế nào là nguyên tố hoá học, khái niệm về đồng vị, đặc biệt
nắm được cấu tạo của bảng hệ thống tuần hoàn, vì đây là phần đầu của chương
trình nên học sinh thường rất bỡ ngỡ và khó hiểu những khái niệm trừu tượng
như cấu hình (e) obi tan nguyên tử, electron lớp ngoài cùng. Phần quan trọng của
chương này chính là nắm được tính chất chung của bảng HTTH. Ví dụ khi câu
hỏi đưa ra một chất cho diện tích bằng bao nhiêu thì thường sẽ hỏi viết cấu hình
(e) của nguyên tố đó có mấy (e) lớp ngoài cùng, từ đó suy ra tính chất của nhân tố
đó có tính kim loại hay phi kim loại. Khi có trong tay bảng FTTH học sinh tối
thiểu phải trả lời được các câu hỏi như thế nào là chu kỳ, phân nhóm (chính, phụ)
số electron ngoài cũng có liên quan gì đến tính chất của nguyên tố đó. Nếu số
electron ngoài cùng là 1,2,3 thì nó thể hiện tính kim loại, 4,5,6 thể hiện tính phi
kim, bằng thể hiện tính chất của khí (khí hiếm)… Như vậy nếu học sinh
không hiểu được bản chất thì không thể trả lời được câu hỏi. Chẳng hạn, trong đề
kiểm tra thử nghiệm chúng tôi đưa ra 4 câu về chương cấu tạo chất chúng ta phân
tích một ví dụ cụ thể trong đề thi đó:
VD: Cho một nguyên tố có cấu hình (e) ngoài cùng 3523P5. Vậy nguyên tố
ấy sẽ là : A) B) P C) N D) F
Rõ ràng với yêu cầu của câu hỏi được đặt ra như vậy thì một học sinh kém
hay ở mức trung bình trở xuống sẽ không trả lời được. Để trả lời đúng câu này
học sinh phải nắm được khái niệm (e) lớp ngoài cùng có ý nghĩa như thế nào,
nắm được obitan nguyên tử và thế nào là điện tích nguyên tố. Khi câu hỏi đưa ra
dạng khuyết như vậy đầu tiên chúng ta sẽ phải viết được cấu hình đầy đủ của
nguyên tố đó có dạng : 1522522P5. Sau đó tính được điện tích nguyên tố bằng
tổng các electron được phân bố trên các obitan, sẽ tính được Z=17, dùng bảng
HTTH tra nguyên tố có thứ tự (hay điện tích nguyên tố bằng 17 sẽ là clo). Thực
tế có những học sinh kém đến mức không biết xác định nguyên tố tên là gì nếu
biết điện tích nguyên tố vì họ không hiểu được khái niệm điện tích nguyên tố là
gì và cấu trúc bảng HTTH như thế nào, cách tra ra sao ?
*Chương II: Liên kết hoá học định luật tuần hoàn Menđeleev
Nội dung chính của chương này đặt ra một số vấnđề như : vì sao các chất lại
tồn tại và chúng tồn tại theo một quy luật nhất định nào đó ? từ đó thuyết liên kết
hoá học ra đời và giải thích được câu hỏi đó. Yêu cầu đối với học sinh ở chương
này nắm được bản chất của liên kết hoá học là gì, có các loại liên kết hoá học
nào, bản chất của từng loại liên kết một. Ngoài ra học sinh phải nắm được định
luật tuần hoàn của Menđeleev cho phép chúgn ta biết được tính chất hoá học của
nguyên tố hoá học bất kỳ và tính chất của chúng biến đổi theo một quy luật nhất
định. Vì thời gian và số lượng câu nên chúng tôi không đưa nội dung này vào
trong đề kiểm tra của mình.
*Chương III: Phản ứng oxi hoá khử
Đây là một mảng kiến thức rất quan trọng trong không chỉ trong chương
trình lớp 10 mà nó xuyên suốt cả chương trình phổ thông. Yêu cấu tối thiểu đối
với học sinh bình thường phải nắm được các khái niệm như : Số ôxi hoá, chất ôxi
hoá, chất khử, phản ứng. Và đương nhiên phải hiểu được bản chất của vấn đề ví
như cho một phản ứng bất kì học sinh phải chỉ ra được nó có thuộc loại phản ứng
ôxy hoá khử hay không, đâu là chất oxy hoá, đâu là chất khử. Khi đã có các khái
niệm rồi thì yêu cầu cuối cùng và quan trọng nhất đối với học sinh trong chương
này chính là có thể cân bằng (e). Nếu học sinh không cân bằng nổi một phương
trình đơn giản thì kiến thức học sinh đó đáng báo động và phải điều chỉnh ngay vì
chưa biết cân bằng phương trình coi như không hiểu gì về chương oxi hoá-khử.
Trong đề thi của mình chúng tôi đã đưa ra 6 câu hỏi về chương này với các dạng
khác nhau với các mức yêu cầu khác nhau, có dạng đơn giản chỉ là xác định số
oxi hoá của một nguyên tố bất kỳ trong một hợp chất nào đất, có câu áp dụng
bằng phương trình oxi hoá khử hay có dạng cho một phương trình phản kứng yê
ucầu học sinh xác định đâu là chất khử, đâu là chất oxi hoá.
Ví dụ: cho phản ứng:
Fe304 +10 HN03 = 3 Fe (N03)3 + N)2 + 5H20 vậy thì:
A) Fe304 và HN03 đều là chất oxi hoá
B) Fe304, HN03 đều là chất khử
C) Fe304 là chất khử, HN03 chất oxi hoá
D) Fe304 chất oxi hoá, HN03 chất khử
Như vậy với ví dụ này nếu học sinh biết xác định số oxi hoá của nguyên tố
nào thay đổi và hiểu được định nghĩa thế nào là chất khử, chất oxi hoá thì sẽ làm
được câu hỏi này một cách dễ dàng.
*Chương IV: Phân nhóm chính nhóm VII - Nhóm Haloofen
Đây là chương rất quan trọng trong khối lượng kiến thức hoá 10 nên chúng
tôi đã xây dựng một số lượng các câu hỏi khá lớn trong đề kiểm tra của mình (8
câu trên 30 câu). Nội dung chính của chương này mà học sinh phải nắm được là
các tính chất vật lý hoá học chung của phân nhóm chính nhóm VII, sau đó đi chi
tiết tính chất của từng nguyên tố một. Theo như phân bố chương trình sách giáo
khoa nguyên tố clo được trình bày kỹ càng và trọng tâm nhất trong các nguyên tố
halogen. Học sinh cần phải nắm được các tính chất lí hoá học của nguyên tố clo
và tính chất đặc trưng của một số hợp chất chứa oxy cảu clo như : clorua vôi,
nước taven, axits clohidric, muối clorua… Ngoài ra các nguyên tố còn lại như
Flo, Brem, iDt không chỉ hiểu được các tính chất chung mà phải nắm được một
số tính chất riêng của từng nguyên tố là gì. Trong sách ra đề của chúng tôi trong
chương này vừa có dạng tổng quát như so sánh mức độ hoạt động của các nguyên
tố halogen, so sánh axít của chúng, tính chất của clo là gì, các phương pháp điều
chế clo, hay có những bài tập áp dụng có tính bán kết quả. Như vậy mục tiêu khi
ra câu hỏi không phải dừng ở mức kỹ năng nhớ, hiểu áp dụng mà nó đòi hỏi kỹ
năng tư duy tương đối cao (phân tích, đánh giá)
Chúng ta xét một câu hỏi trong bộ đề kiểm tra mà chúng tôi đã tiến hành thử
nghiệm. Một dạng câu hỏi áp dụng tính toán nhưng để làm được thì không những
học sinh phải sử dụng tính toán đơn thuần mà phải kết hợp được nhiều mức kỹ
năng khác nhau.
Cho 8,7 gam Mn02 tác dụng với dung dịch H dư thì thể tích khi Cl2 ( )
thu được sẽ là :
A)22,4 (l) B)4,48 (l)
C)2,24 (l) D)11,2 (l)
Để làm được câu hỏi này học sinh phải kết hợp viết và cân bằng được
phương trình và tính toán theo phương trình phản ứng mà điều này đối với học
sinh kém quả thực không mấy đơn giản chút nào vì làm trong một khoảng thời
gian ngắn đòi hỏi sự nhanh nhẹn và kỹ năng làm bài thành thạo.
*Chương V: Oxi-lưu huỳnh. Lý thuyết về phản ứng hóa học.
Đây cũng là chương được chúng tôi phân bố câu hỏi cũng tương đối nhiều
(khoảng 9 câu). Cũng giống như chương Halogen ngoài những tính chất đặc
trưng chung của phân nhóm chính. Nhóm VI học sinh phải nắm được tính chất
của một số các chất được trình bày riêng một bài. Yêu cầu học sinh phải nắm
được tính chất của oxi lưu huỳnh, hidosunfua, các oxits của lưu huỳnh, đặc biệt là
axít Sunfuric… Dạng câu hỏi chúng tôi xây dựng về chương này cũng vừa có lý
thuyết và có các dạng bài tập tính toán. Có câu đòi hỏi mức độ tư duy rất cao
dành cho học sinh giỏi, ví dụ:
Cho các chất: O2, S, H2S, SO2 chất tan nhất trong nước là :
A) SO2 B) S
C) H2S C) O2
Nếu học sinh không nắm được tính chất vật lí của từng bài về lưu huỳnh,
Oxi, hidroSunfua, Oxít của lưu huỳnh thì khó có thể trả lời được câu này vì nó
đòi hỏi không chỉ nhớ kiến thức qua từng bài mà học sinh phải biết tổng hợp kiến
thức qua mỗi bài học để so sánh từng chất với nhau.
Vì trong thời gian chúng tôi nghiên cứu đề tài nàyếu tố khi tiến hành thí
nghiệm học sinh gần kết thúc chương trình và để đánh giá chính xác thực lực học
sinh trong học kỳ 2 nên đề kiểm tra mà chúng tôi biên soạn chủ yếu tập trung vào
3 chương cuối cùng (chương oxi hoá khử, các nguyên tố halogen, các nguyên tố
nhóm VIA) nên có thể nội dung chưa xuyên suốt được toàn bộ chương trình lớp
10 nhưng gần như những vấn đề nổi cộm và cốt lõi nhất chúng tôi có đưa vào và
với sự đa dạng về các loại câu hy vọng kết quả của chúng tôi làm thử đạt được
như mong đợi.
II.3.Phương pháp đánh giá bài trắc TN
II.3.1.Các mức độ mục tiêu trong lĩnh vực nhận thức.
Nói đến mức độ mục tiêu trong lĩnh vực nhận thức chúng ta nghĩ ngay đến
Bloom, người đã xây dựng nên các cấp độ của các mục tiêu giáo dục hay gọi là
cách phân loại Bloom theo. Bloom trong lĩnh vực nhận thức được chưa thành các
mức độ hành vi từ đơn giản đến phức tạp nhất như sau:
1.Nhớ (Knou ledgo): Nghĩa là sự nhớ lại các dữ liệu đã được học trước đây
nghĩa là một người có thể nhắc lại một loạt các dữ liêụ từ các sự kiện đơn giản
đến các lý thuyết phức tạp, tái hiện trong trí nhớ những thông tin cần thiết. Đây là
cấp độ thấp nhất của kết quả học tập trong lĩnh vực nhận thức. Ví dụ trong hoá
học học sinh có khả năng nhớ bài học có thể trả lời được câu hỏi như : Nêu các
tính chất hoá học của axit clohidric. Nhưng một bài kiểm tra mà ra các câu hỏi
kiểu dạng như thế này thì chưa đạt yêu cầu vì nó sẽ kích thích học sinh học thuộc
lòng, học vẹt mà thực chất lại không hiểu được vấn đề gì.
2.Hiểu (Comprehention): Nghĩa là khả năng nắm được ý nghĩa của tài liệu.
Hay nói cách khác có thể thực hiện bằng việc chuyển tài liệu từ dạng này sang
dạng khác bằng cách giải thích tài liệu (hay tóm tắt) và bằng cách ước lượng xu
hướng tương lai (dự báo các kết quả hoặc ảnh hưởng). Kết quả học tập được đo ở
mức độ này cao hơn so với nhớ, đây là mức độ thấp nhất để hiểu thấu sự vật.
Ví dụ: Số electron của một ion Mg2 là:
A) 2 B) 12
C) 24 D) 10
Nếu học sinh không hiểu được yêu cầu nội dung câu hỏi mà chỉ học thuộc
thôi thì rất dễ mắc bẫy. Muốn trả lời được câu hỏi này, thí sinh phải hiểu được
khái niệm thế nào là điện tích ion, thế nào là số electron của nguyên tố từ đó suy
ra được số electron của một ion mang điện tích dương hay âm bất kỳ nào đó. Nếu
thí sinh chọn phương án có 2 electron có nghe ra cũng có lý nếu hiểu điện tích
ion bằng số electron, nếu chọn 12 hay 24 cũng có vẻ không vô lý lắm vì nếu học
sinh học thuộc lòng thứ tự điện tích các nguyên tố thì thấy ngay số thứ tự của Mg
trong bảng HTTH là 12, còn số 24 là biết đâu do đoán mò lấy số 2 nhân với 12
thì may ra đúng. Như vậy, chúng ta thấy chỉ học thuộc lòng mà không hiểu bản
chất thì học sinh sẽ khó có thể trả lời đúng và đáp án đúng ở đay lại là 10
(phương án D) mà con số này nó có vẻ không hợp lý lắm so với kiến thức mà học
sinh đã được học. Vì bình thường nguyên tử của nguyên tố magie có 12 electron
nhưng ở đây người ta hỏi số electron của ion Mg2+ nghĩa là nguyên tử đã nhường
cho 2 electron để được ion dương Mg2+ và chỉ cần làm 1 phép tính đơn giản lấy
12- 2 = 10 (electron)
3.Áp dụng (application): được định nghĩa là khả năng sử dụng các tài liệu đã
học vào một hoàn cảnh cụ thể mới. Điều đó bao gồm việc áp dụng các quy tắc,
phương pháp, khái niệm, nguyên lý, định luật, lý thuyết. Kết quả học tập trong
lĩnh vực nào đó ở cấp độ này đòi hỏi sự thấu hiểu cao hơn so với mức kỹ năng
nhớ và hiểu một chút. Thí dụ khi học sinh học kiến thức về chương oxi hoá khử,
học sinh đã nắm được các bước để cân bằng một phản ứng oxi hoá khử theo
phương pháp thăng bằng electron thì khi gặp bất kỳ một phản ứng nào đều có thể
làm được. Bài tập dạng cân bằng như vậy chúng tôi có áp dụng vào trong đề kiểm
tra thử nghiệm này, có khoảng 2 câu về cân bằng phương trình ở mức độ trung
bình và một bài tương đối phức tạp một chút. Ví dụ:
Cho phản ứng: ANH3 + BO2 = CNO + DH2O. Các hệ số A, B, C, D sẽ là
A) 5,4,5,4 B) 4,4,5,5
C) 4,5,4,5 D) 4,5,4,6
Chúng ta thấy ngay rằng nếu hiểu và vận dụng đúng các bước cân bằng mà
học sinh đã học thì việc cân bằng này rất dễ dàng mà không tốn nhiều thời gian.
Ngoài ra nếu học sinh có thể thay đáp án thử lại xem kết quả nào hợp lý sau đó sẽ
chọn giá trị tương ứng nhưng cách làm đó rất thủ công và mất nhiều thời gian học
sinh phải thử đến 4 phép tính gây cảm giác rất rối và nặng nề. Vì đối với những
phương trình đơn giản có thể thử được nhanh nhưng có những phương trình cân
bằng với hệ số rất lớn thì công việc tính toán chiếm rất mất nhiều thời gian hơn là
cân bằng phương trình đó bình thường theo phương pháp đã học.
4.Phân tích (Analysis): Nghĩa là khả năng phân chia một tài liệu ra thành các
phần của nó sao cho có thể hiểu được các cấu trúc tổ chức của nó. Điều đó có thể
bao gồm việc chỉ ra đúng các bộ phận phân tích mối quan hệ giữa các bộ phận và
nhận biết được các nguyên lý tổ chức được bao hàm. Kết quả học tập ở mớc độ
này đòi hỏi học sinh có mức độ trí tuệ cao hơn so với mức hiểu và áp dụng vì nó
yêu cầu một sự thấu hiểu cả nội dung và hình thái cấu trúc của tài liệu.
Thí dụ: ion X có cấu hình (e) lớp ngoài cùng: 3S23P6. Vậy X là :
A) B) S C) P D) N
Để trả lời được câu hỏi này học sinh phải phân tích được đề bài, dữ liệu bài
toán cho là ion X2 nhưng lại hỏi về nguyên tố X. Đầu tiên ta sẽ chuyển cấu hình
ion X2 về cấu hình X, sau đó từ cấu hình (e) lớp ngoài cùng viết cấu hình (e) đầy
đủ của X và tính số điện tích nguyên tố sẽ tra được nguyên tố đó dựa vào bảng
HTTH.
Rõ ràng với một câu hỏi như vậy chúng ta đã chuyển sang các dạng trung
gian khác nhau để tìm ra phương án trả lời.
5.Tổng hợp (Syn theis): Được định nghĩa là khả năng sắp xếp các bộ phận
lại với nhau để hình thành một tổng thể mới. Điều đó có thể bao gồm việc tạo ra
một cuộc giao tiếp đơn nhất, một kế hoạch hành động hoặc một mạng lưới các
quan hệ trừu tượng. Kết quả học tập trong lĩnh vực này nhấn mạnh các hành vi
sáng tạo, đặc biệt tập trung chủ yếu vào việc hình thành các mô hình hoặc cấu
trúc mới. Mức kỹ năng tổng hợp đòi hỏi trình độ, kiến thức học sinh tương đối
cao, thường những em học lực khá, giỏi mới có khả năng trả lời đúng câu hỏi.
6.Đánh giá (Evaluation): Là khả năng xác định giá trị cảu tài liệu (tuyên bố,
tiểu thuyết, báo cáo …) việc đánh giá dự trên các tiêu chí nhất định được đặt ra
sẵn. Đó có thể là các tiêu chí bên trong (cách tổ chức) hoặc các tiêu chí bên ngoài
(phù hợp với mục đích), và người đánh giá phải tự xác định hoặc được cung cấp
các tiêu chí. Kết quả học tập trong lĩnh vực này là cao nhất trong các cấp bậc
nhận thức vì nó chứa các yếu tố của mọi cấp bậc khác.Vậy các cấp độ nhận thức
theo Bloom có thể được mô tả bằng sơ đồ sau theo mức độ từ thấp đến cao
6.Đánh giá
5.Tổng
hợp
4.Phân
tích
3.áp dụng
2. Hiểu
1.Nhớ
Sơ đồ các mưc kỹ năng theo Bloom
Có những người nghĩ rằng chỉ có đề thi tự luận mới đánh giáđược tư duy ở
mức độ cao còn đánh giá bằng TNKQ chỉ đạt ở mức độ tối thiểu nào đó, lối suy
nghĩ như vậy là hoàn toàn sai lầm. Theo Bloom một bài kiểm tra có thể đánh giá
mức độ tư duy của học sinh tương đối cao, có thể đạt mức độ cao nhất. Thế thì
muốn ra được các câu hỏi yêu cầu học sinh ở mức độ nhận thức cao nó tuỳ thuộc
rất nhiều vào khả năng người ra đề. Với chương trình lớp 10 thì khả năng tư duy
còn nhiều hạn chế chính vì vậy thường thì học sinh học theo kiểu cảm nhận là
chính. Vì vậy khi soạn các câu hỏi trắc nghiệm chúng tôi chủ yếu tập trung ở các
mức độ 1, 2, 3. Cũng có những câu (nhưng không nhiều) yêu cầu học sinh ở mức
độ cao (4, 5, 6) thường dành cho các em khá giỏi. Tuỳ theo mục tiêu đạt ra đối
với học sinh cần đạt trình độ như thế nào để người ra đề thi cân nhắc và vận dụng
ở mức độ hợp lý đối với học sinh.
II.3.2.Yêu cầu đối với một bài thi TNKQ.
II.3.2.1.Yêu cầu về nội dung
Nội dung là yếu tố quan trọng nhất để đánh giá một bài học hay mọt bài
kiểm tra có tốt hay không. Mục đích của mỗi bài học là học sinh cần nắm những
phần gì quan trọng nhất, cái gì cần nhớ nhất, đó chính là nội dung của một bài
học. Còn đối với một đề kiểm tra cũng vậy, chúng ta phải luôn tự đặt trong đầu
các câu hỏi đề thi gồm những nội dung chính gì quan trọng nhất, phần nào bắt
buộc đối với mọi học sinh thì phải nhấn sâu cho nhiều câu hỏi vào. Điều quan
trọng là nội dung của mỗi câu hỏi có ăn khớp với nội dung học sinh đã được học
trên lớp chưa ? Tránh những trường hợp nội dung câu hỏi rất hay nhưng không hề
liên quan đến kiến thức cần kiểm tra như vậy sẽ dẫn đến một hậu quả rất nghiêm
trọng là chúng ta sẽ không đo được mục tiêu giáo dục đã đề ra. Với thời gian và
trong điều kiện cho phép, các câu hỏi mà chúng tôi đã biên soạn gần như bao phủ
được toàn bộ chương trình lớp 10 nhưng trọng tâm số câu hỏi rơi vào nhiêù nhất
là các chương: oxi hoá khử, phân nhóm chính nhóm VIIA, phân nhóm chính
VIA. Ngoài những câu hỏi học sinh học chắc tính chất hoá học, có một số câu đòi
hỏi học sinh thuộc cả tính chất vật lý, phương pháp điều chế….
II.3.2.2.Yêu cầu về các mức kỹ năng.
Như đã giới thiệu ở trên để đánh giá chất lượng đề thi và đo được mục tiêu
giảng dậy chúng ta phải đặt ra những yêu cầu về mức độ nhận thức đối với từng
câu hỏi. Với trình độ học sinh lớp 10 chủ yếu các mức kỹ năng cần đạt là mức kỹ
năng 1 (nhớ), kỹ năng (hiểu) và mức kỹ năng 3 (áp dụng) là tương đối đạt yêu
cầu của chương trình giảng dạy. Nên đa số các cấu hỏi trắc nghiệm đạt ở các mức
độ 1,2,3 mà chúng tôi chủ định biên soạn. Nhưng nếu một đề kiểm tra mà chỉ
dừng lại ở các mức kỹ năng đó thì chưa đạt được mục tiêu là phân chia sự nhận
thức khác nhau giữa học sinh kém và học sinh giỏi. Chính vì vậy đề thi phải có
một số các câu hỏi (thường là ít) yêu cầu học sinh ở cấp độ cao hơn. Vì các câu ở
mức kỹ năng cao mới đánh giá và phân biệt được khả năng tư duy ở hai trình độ
khácnhau thì chất lượng làm bài cũng phân chia rõ ràng. Ngoài ra các câu khó
này còn đánh giá được số điểm của từng đối tượng tương ứng với trình độ của
học sinh. Thường thì học sinh khá, giỏi sẽ sẽ trả lời được các câu hỏi khó để đạt
điểm 9, 10 còn học sinh trung bình đạt số điểm thường là 5,6. Nhưng cũng tránh
ra những câu quá khó, hay một đề thi có quá nhiều câu đòi hỏi ở cấp độ cao làm
cho hầu hết thí sinh không trả lời được (kể cả thí sinh giỏi) thì đề thi không phân
cấp được khả năng làm bài giữa học sinh thuộc nhóm kém và nhóm giỏi. Theo
chúng tôi, số lượng các câu hỏi ở mức độ khó nữa phải chiếm khoảng 20-30%,
còn số câu ở mức độ khó phải nhỏ hơn 10% thì hợp lý hơn cả. Như vậy các câu
hỏi được ra nằm ở các mức độ. Rất dễ (gần như ai cũng làm được ), dễ trung
bình, khó, rất khó. Và do đó, chúng ta sẽ nhận thấy rằng để đạt được điểm tốt
(9,10) thì học sinh phải thực sự có năng lực để trả lời các câu hỏi khó.
II.3.2.3.Yêu câu về cách tổ chức
Thường thì kiểm tra bằng TNKQcó thể kiểm tra đồng thời một số lượng học
sinh tương đối lớn, nên nếu khâu tổ chức triển khai không tốt, dù bất kỳ một sơ
suất nhỏ nào cũng đều có thể dẫn đến hậu quả xuất và những phản ứng xã hội bất
lợi. Do đó để triển khai một kỳ thi với quy mô lớn người ta phải chuẩn bị hết sức
cẩn thận về đề thi, quy trình thi, thể thức chấm điểm, cách công bố kết quả… Các
câu hỏi trong một đề thi là các câu đã được thử nghiệm, phân tích cân nhắc trau
chuốt và định cỡ ( xác định độ khó, độ phân biệt, độ tin cậy và độ giá trị của cả
bài). Để đạt được một kỳ thi hay bài kiểm tra, theo chúng tôi có thể tiến hành
theo các bước sau đây:
*Xác định môn thi và nội dung tổng quát với từng môn. Đồng thời định ra
yêu cầu về các mức kỹ năng: nhớ, hiểu, biết vận dụng, phân tích, tổng hợp, đánh
giá…Để thực hiện khâu này thường người ta lập một ma trận 2 chiều: các dòng
phân theo các nội dung chính, các cột phân theo các mức kỹ năng tương ứng
trong mỗi ô ghi số câu hỏi cần thiết của phần nội dung và mức kỹ năng đó.
*Trao đổi trong tổ chuyên môn, phát hiện và sửa chữa những câu sai mà bản
thân người ra đề không cảm thấy.
*Biên tập và đưa các câu trắc nghiệm vào ngân hàng câu hỏi lưu trong máy
tính phụ trách biên tập phải là người am hiểu cả về chuyên môn lẫn kỹ thuật viết
trắc nghiệm.
*Lập đề thi và tổ chức thi thử trên một số nhóm thí sinh.
*Chấm thi và phân tích thống kê kết quả thi thử từ đó xác định được các đặc
trưng của mỗi câu trắc nghiệm như độ khó, độ phân biệt…qua đó có thể xác định
được độ tin cậy của bài trắc nghiệm, phân loại chất lượng các câu trắc nghiệm.
*Ra đề thi chính thức căn cứ vào dàn bài (phân bố câu theo nội dung và mức
độ kỹ năng tương ứng vơí bản đặc trưng hai chiều). Từ một đề thi gốc, nhờ phần
mềm tin học có thể tạo ra các đề thi tương ứng có cùng nội dung nhưng khác
nhau về hình thức bằng cách đảo lộn thứ tự các câu hỏi và đảo các phương án trả
lời A,B.C,D…
*In và tổ chức thi: đề thi được in sẵn, mỗi thí sinh một đề riêng
*Chấm và phân tích các kết quả thi.
*Công bố kết quả
Ưu điểm lớn của các kỳ thi đại trà bằng trắc nghiệm khách quan là: Nhờ
những thông tin thu được qua việc phân tích thống kê toàn bộ bài làm của thí sinh
qua các kỳ thi là những số liệu rất quý báu để đánh giá định lượng về tình hình
giáo dục của từng khu vực, từng cộng đồng, từng nhóm thí sinh và đánh giá xu
thế phát triển chất lượng giáo dục theo thời gian.
CHƯƠNG III: PHÂN TÍCH KẾT QUẢ NGHIÊN CỨU
Ở chương I và chương II chúng tôi đã giới thiệu những kiến thức cơ bản để
xây dựng một đề thi hay đề kiểm tra bằng các cầu hỏi trăc nghiệm khách quan và
lý thuyết về các tài liệu đặc trưng để đánh giá đề thi trắc nghiệm khách quan
chúng tôi đã xây dựng để kiểm tra bằng phương pháp trắc nghiệm và đã tiến hành
thử nghiệm cho kiểm tra một tiết với học sinh lớp 10. Sau đó đã nhập các đáp án
trả lời của học sinh xử lý số liệu trên chương trình Quest. Chúng tôi xin giới thiệu
sơ lược về quá trình làm thí nghiệm của mình và kết quả có 4 phương án trả lời:
ABCD. Trong đó, có một phương án trả lời trả lời đúng sau khi phân tích được
sau đây.
III.1. Các bước tiến hành thí nghiệm
1. Xây dựng bộ các câu hỏi dạng trắc nghiệm, mỗi câu hỏi có 4 phương án
lựa chọn
2. Xây dựng một đề thi gồm 30 câu hỏi trắc nghiệm lấy từ trong "ngân
hàng" câu hỏi
3. Tham khảo về nội dung các câu hỏi với những người cùng chuyên môn,
có chỉnh sửa, bổ sung và thay thế những câu chưa đạt yêu cầu.
4. Hình thành một đề gốc sau đó bảo vị trí các câu và vị trí các đáp án trả lời
các câu hỏi nhờ phần mềm tin học.
5. In và cho kiểm tra thử trên thực tế khi kiểm tra chúng tôi đã tạo được tâm
lý vững chắc cho học sinh để mọi thí sinh đều coi đây là trắc nghiệm thật lấy
điểm 1 tiết để học sinh có tinh thần làm nghiêm túc, hết mình để phép thử đạt yêu
cầu.
6. Cuối cùng, nhập số liệu xử lý kết quả làm bài của học sinh bằng phần
mềm tin học
III.2. Phân tích kết quả thực tế
III. 2.1. Kết quả chung
- Số lượng câu trong một đề thi: 30 câu (30items)
- Số thí sinh làm trắc nghiệm: 100 thí sinh (100Cases)
- Mỗi câu hỏi nhất.
- Đáp án của đề gốc: CCDCCCDBAACCCACACAACCADCADACCA
1. Summary of item Estimates (Tóm lược các năng lực của câu trắc nghiệm )
Mean: .00
SD: 1.01
SD (adjusted): .98
Reliability of estimate: .94 (độ tin cậy của bài trắc nghiệm)
Giải thích: Mean: .00 nghĩa là số trung bình là 0.00. SD: 1.01 nghĩa là độ
lệch chuẩn so với năng lực. Kết quả xấp xỉ bằng một là tương đối tốt. Độ ổn định
của bài trắc nghiệm là 0,94 là một kết quả tương đối tốt và hoàn toàn chấp nhận
được.
2.
Infit Mean Square
Mean: 1.00
SD: .09
Out fit Mean Square
Mean: 1.01
SD: .18
3. O items with zero scores and O items with perfect scores: Nghĩa là:
không có một câu nào bỏ trống và không có một câu nào thí sinh trả lời đúng
hoàn toàn.
III.2.2. Phân tích câu trắc nghiệm
Để đánh giá chất lượng của bài trắc nghiệm, chúng ta sẽ đánh giá từng câu
hỏi một. Mỗi một câu hỏi lại được đánh giá qua các tiêu chí như: độ khó, độ phân
biệt, phương án đúng và phương án nhiều của câu hỏi ấy. Sau đây chúng tôi phân
tích hai câu trắc nghiệm để minh hoạ:
Ví dụ 1: Item 1 (câu số 1)
Nội dung câu hỏi: Cho 8, 7 gam MnO2 tác dụng với dung dịch HCl dư thì
thể tích khí Cl2 (đktc) thu được sẽ là:
A. 2,24 (l)
C. 4,48 (l)
B. 11,2 (l)
D. 22,4 (l)
Kết quả phân tích câu 1:
Item 1: item 1 (key = C)
Categories
Count
Percent (%)
Pt-Biserial
P- Value
A
11
11,1
-.25
.007
B
12
12,1
- .24
.009
C*
59
59,6
.35
.000
D
17
17,2
-.05
.322
Missing
1
Phân tích: đán án đúng của câu 1 là phương án C trong 4 lựa chọn A, B, C,
D. Cout là số thì sinh tham gia trả lời các phương án. Thấy ngay ở phương án A
có 11 thí sinh lựa chọn, B có 12, C có 59, D có 17 người lựa chọn, có 1 người
không làm câu này (missing). Percent (%) là số phần trăm thí sinh tham gia trả
lời các phương án ở phương án C (phương án đúng) có 59,6% thí sinh lựa chọn.
Pt - Biserial là tương quan điểm nhị phân hay độ phân biệt của câu hỏi. Với
phương án C độ phân biệt là dương (0,35 > 0,2) tương đối lớn còn các phương án
nhiễu đều có độ phân biệt âm nên đây có thể nói là một câu hỏi tương đối tốt
Ví dụ 2: Item 18 (câu 18)
A. Hợp chất với kim loại hoặc với Hiđrô chúng luôn có số ôxi hoá là -1.
B. Có số Ôxi hoá duy nhất là + 7
C. Có số Ôxihoa duy nhất là + 1
D. Cả A, B, C đều sai
Kết quả câu 18:
Item 18: item 18 (key = A)
Categories
Count
Percent (%)
Pt-Biserial
A*
29
30,9
11
B
5
5,3
-.20
C*
8
8.5
- .18
D
52
55,3
.0,8
Missing
6
Nghĩa là với câu 18 ta thấy số thí sinh lựa chọn phương án đúng là 29
(chiếm 30,9%) nhưng lại chọn phương án nhiễu D là 52 học sinh (55,35) lớn hơn
rất nhiều so với phương án đúng. Đối với câu hỏi này phải chăng phương án A
chưa phải là phương án đúng nhất nhưng ta đã nhằm gán cho nó là phương án
đúng phải chăng phương án D mới là phương án đúng 3 có hai khả năng làm cho
học sinh lựa chọn phương án nhiễu D nhiều hơn hẳn so với phương án đúng là
thứ nhất do trong quá trình giảng dạy đã tạo nên sự nhầm lẫn nào chăng, thứ hai
là do học sinh không hiểu rõ yêu cầu của câu hỏi gây ra nhầm lẫn điều này cần
xem lại cách diễn đạt của câu trắc nghiệm. Như vậy đây là một câu không có độ
phân biệt thấp (0,11< 0,2) nên cần điều chỉnh phương án nhiễu D hay thay bằng
một câu khác
III.3. Xây dựng mô hình Rasch trên số liệu thực
III.3.1. Sự phù hợp của các câu hỏi
Run One: Hoa hoc 10
--------------------------------------------------------------------------
Item Fit 14/ 5/2004 20:29 all on hoa10 (N = 100 L = 30)
--------------------------------------------------------------------------
INFIT
MNSQ .63 .71 .83 1.00 1.20 1.40 1.60
--------------+---------+---------+---------+---------+---------+---------
1 item 1 . *| .
2 item 2 . * | .
3 item 3 . | * .
4 item 4 . * | .
5 item 5 . * | .
6 item 6 . * | .
7 item 7 . |* .
8 item 8 . | * .
9 item 9 . *| .
10 item 10 . * .
11 item 11 . * .
12 item 12 . * | .
13 item 13 . | * .
14 item 14 . * | .
15 item 15 . * | .
16 item 16 . | * .
17 item 17 . * | .
18 item 18 . | * .
19 item 19 . |* .
20 item 20 . *| .
21 item 21 . | * .
22 item 22 . * .
23 item 23 . * | .
24 item 24 . |* .
25 item 25 . * | .
26 item 26 . | * .
27 item 27 . * | .
28 item 28 . |* .
29 item 29 . | * .
30 item 30 . * | .
Hình 1
Qua hình 1 ta thấy cả 30 câu hỏi trong bài trắc nghiệm thử mà chúng ta đã
làm thí nghiệm đều hợp lý, nằm trong ngưỡng cho phép của mô hình Rasch
III.3.2. Sự phù hợp của các thí sinh (Hình 2):
Run One: Hoa hoc 10
-------------------------------------------------------------------------
Case Fit In input Order 14/ 5/2004 20:29
all on hoa10 (N = 100 L = 30)
--------------------------------------------------------------------------
INFIT
MNSQ .63 .71 .83 1.00 1.20 1.40 1.60
--------------+---------+---------+---------+---------+---------+-----+---
1 09 . | * .
2 18 . | * .
3 21 . * | .
4 23 * . | .
5 24 . * | .
6 35 . * | .
7 42 . *| .
8 45 . *| .
9 47 . | * .
10 55 . | * .
11 59 . | * .
12 65 . * | .
13 66 . | * .
14 74 . | * .
15 78 . * | .
16 79 . * | .
17 80 . * | .
18 84 . * | .
19 26 . * | .
20 98 . | * .
21 14 . * .
22 17 . * | .
23 22 * | .
24 28 . | * .
25 30 . | * .
26 34 . | * .
27 37 . | *.
28 50 . * | .
29 51 . * | .
30 54 . | .*
31 56 . | * .
32 57 . | . *
33 64 . | * .
34 69 . | * .
35 75 . | . *
36 76 . | . *
37 77 . | * .
38 81 . | * .
39 90 . | . *
40 99 . * .
41 02 . * | .
42 10 . * | .
43 12 * | .
44 16 . * | .
45 19 . * | .
46 20 . * | .
47 25 . * | .
48 31 . * | .
49 36 . | * .
50 41 . | * .
Qua hình 2 đa số thí sinh đều nằm trong ngưỡng cho phép chỉ có một số
trường hợp vựot khỏi giới hạn. Như vậy số liệu thực tế tương đối phù hợp với mô
hình Rasch
.
III.3.3. Phân bố khả năng trả lời đúng của thí sinh và độ đó của các câu hỏi
Run One: Hoa hoc 10
--------------------------------------------------------------------------------
Item Estimates (Thresholds) 14/ 5/2004 20:29
all on hoa10 (N = 100 L = 30)
--------------------------------------------------------------------------------
4.0 |
|
X |
|
|
3.0 X |
|
|
2.0 | 25
|
|
XXX |
X |
| 23
X |
X | 13 20 27
1.0 X | 8 18
XXXXXXX |
XXX |
XXXXXX | 29
XXX | 3 9 19 26
XXXXXXXXXX | 5 16
XXXXXXXXXXX | 2 10 15
.0 XXXXXXX |
XXXXXXXX |
XXXXXX | 12 24
XXXXXX | 1 30
XXXXXXXXX | 22 28
XXXX | 21
X |
XX |
-1.0 XX |
X | 11
| 4
| 6
XXX | 14
| 17
|
X |
-2.0 |
|
X |
|
-3.0 |
--------------------------------------------------------------------------------
Each X represents 1 students
Hình 3
Mỗi dấu X đại diện cho một thí sinh tham gia làm trắc nghiệm. Qua hình
ta thấy lượng thí sinh tập trung ở mức độ năng lực trung bình tại O là lớn nhất,
chiếm số đông trong vùng từ - 1,0 đến + 1,0, số lượng câu khó ở mức độ trung
bình tương đối nhiều. Câu 25 là câu khó nhất vì có ít thí sinh làm đúng nhất và
câu 7 là câu dễ nhất vì hầu như ai cũng trả lời đúng. Do vậy, mô hình chung cho
thấy kết quả thu được là tương đối tốt.
III.3.4. Phân tích kết quả của từng câu hỏi một
Bảng 1
Run One: Hoa hoc 10
--------------------------------------------------------------------------
Item Estimates (Thresholds) In input Order 14/ 5/2004 20:29
all on hoa10 (N = 100 L = 30)
-------------------------------------------------------------------------
ITEM NAME |SCORE MAXSCR| THRSH | INFT OUTFT INFT OUTFT
| | 1 | MNSQ MNSQ t t
-------------------------------------------------------------------------
1 item 1 | 59 99 | -.34 | .99 1.24 -.2 1.4
| | .22|
| | |
2 item 2 | 42 87 | .15 | .92 .87 -1.3 -.8
| | .23|
| | |
3 item 3 | 37 91 | .46 | 1.22 1.20 2.8 1.2
| | .23|
| | |
4 item 4 | 77 99 | -1.27 | .85 .71 -1.1 -1.2
| | .25|
| | |
5 item 5 | 39 90 | .35 | .84 .78 -2.5 -1.5
| | .23|
| | |
6 item 6 | 76 96 | -1.35 | .95 1.20 -.3 .8
| | .26|
| | |
7 item 7 | 88 95 | -2.61 | 1.01 .87 .1 -.1
| | .40|
| | |
8 item 8 | 27 92 | .99 | 1.10 1.39 .9 1.9
| | .24|
| | |
9 item 9 | 42 98 | .40 | .99 .97 -.1 -.1
| | .22|
| | |
10 item 10 | 42 91 | .25 | 1.00 .95 .0 -.3
| | .22|
| | |
11 item 11 | 73 99 | -1.04 | 1.00 .89 .0 -.4
| | .24|
| | |
12 item 12 | 52 94 | -.18 | .89 .85 -1.7 -1.0
| | .22|
| | |
13 item 13 | 24 86 | 1.04 | 1.07 1.15 .6 .8
| | .26|
| | |
14 item 14 | 81 99 | -1.52 | .96 .98 -.2 .0
| | .27|
| | |
15 item 15 | 43 90 | .14 | .94 .90 -1.0 -.6
| | .22|
| | |
16 item 16 | 40 91 | .32 | 1.07 1.12 1.0 .8
| | .22|
| | |
17 item 17 | 82 100 | -1.55 | .95 1.05 -.2 .3
| | .27|
| | |
18 item 18 | 29 94 | .96 | 1.09 1.28 .9 1.5
| | .24|
| | |
==========================================================================
*****Output Continues****
Run One: Hoa hoc 10
--------------------------------------------------------------------------
Item Estimates (Thresholds) In input Order 14/ 5/2004 20:29
all on hoa10 (N = 100 L = 30)
--------------------------------------------------------------------------
ITEM NAME |SCORE MAXSCR| THRSH | INFT OUTFT INFT OUTFT
| | 1 | MNSQ MNSQ t t
--------------------------------------------------------------------------
19 item 19 | 37 91 | .46 | 1.01 .95 .2 -.2
| | .23|
| | |
20 item 20 | 26 91 | 1.05 | .98 1.12 -.2 .7
| | .25|
| | |
21 item 21 | 60 93 | -.59 | 1.08 1.07 1.0 .4
| | .23|
| | |
22 item 22 | 58 94 | -.47 | 1.00 .95 .0 -.2
| | .22|
| | |
23 item 23 | 22 94 | 1.36 | .93 .82 -.4 -.8
| | .26|
| | |
24 item 24 | 54 96 | -.22 | 1.01 1.18 .2 1.1
| | .22|
| | |
25 item 25 | 13 89 | 1.98 | .88 .69 -.5 -1.0
| | .32|
| | |
26 item 26 | 40 97 | .44 | 1.13 1.24 1.8 1.5
| | .22|
| | |
27 item 27 | 28 96 | 1.02 | .93 .88 -.6 -.6
| | .24|
| | |
28 item 28 | 61 97 | -.50 | 1.02 1.00 .3 .0
| | .22|
| | |
29 item 29 | 33 89 | .61 | 1.09 1.05 1.1 .3
| | .23|
| | |
30 item 30 | 54 92 | -.36 | .95 .91 -.7 -.5
| | .22|
-------------------------------------------------------------------------
Mean | | .00 | 1.00 1.01 .0 .1
SD | | 1.01 | .09 .18 1.0 .9
==========================================================================
Bảng 1 cho thấy các đại lượng đặc trưng có liên quan đến một câu trắc nghiệm
bất kỳ: Score là số thí sinh làm đúng, Maxscr là tổng số thí sinh tham gia trả lời
câu hỏi, Infit và Outfit nhận các giá trị xấp xỉ 1 là kết quả tốt.
III.3.5. Khả năng trả lời của thí sinh đối với các câu hỏi. Xét một ví dụ cụ
thể sau:
------------------------------- K I D M A P----------------------------
Candidate: 09 ability: .68
group: all fit: 1.23
scale: all % score: 63.33
------------Harder Achieved ----------------------Harder Not Achieved ------
| |
| |
| |
| |
| |
| |
| |
| |
| |
| |
| |
| |
25 | |
| |
| |
| |
| | 23(C)
..........................................
| |
20 13 8 | | 18(D) 27(C)
| |
|XXX|
29 | |
9 | | 3(B) 19(D) 26(B)
16 10 5 ...........................
2 | | 15(D)
| |
| | 12(D)
24 | | 1(D) 30(B)
28 22 | |
21 | |
| |
| |
11 | |
| |
4 | | 6(B)
| |
17 14 | |
| |
7 | |
| |
| |
| |
------------Easier Achieved ----------------------Easier Not Achieved ------
==========================================================================
ability: là năng lực của thí sinh
fit: sự phù hợp với mô hình Rasch .
% Score: Phần trăm trả lời đúng số câu của bài trắc nghiệm với thí sinh 09
này, năng lực là 0,69 sự phụ hợp với mô hình Rasch là 1,23, phần trăm số câu
làm đúng là 63,33% nghĩa là bài làm của thí sinh tương đối tốt.
Các đặc trưng cho sự trả lời của mỗi thí sinh đối với bài trắc nghiệm được
tổng kết ở bảng 2 dưới đây.
Run One: Hoa hoc 10
-------------------------------------------------------------------------
Case Estimates In input Order 14/5/2004 20:29
all on hoa10 (N = 100 L = 30)
--------------------------------------------------------------------------
NAME |SCORE MAXSCR | ESTIMATE ERROR | INFIT OUTFT INFTOUTFT
| | | MNSQ MNSQ t t
--------------------------------------------------------------------------
1 09 | 19 30 | .68 .41 | 1.23 1.27 1.42 .84
2 18 | 17 21 | 1.62 .60 | 1.13 .90 .47 .09
3 21 | 18 30 | .51 .41 | .95 .86 -.29 .37
4 23 | 13 29 | -.26 .41 | .72 .65 -1.88 1.28
5 24 | 13 26 | .02 .44 | .81 .73 -1.15 .84
6 35 | 16 30 | .19 .40 | .82 .74 -1.24 .90
7 42 | 10 30 | -.81 .43 | .98 .84 -.02 .38
8 45 | 22 30 | 1.22 .44 | .98 1.23 -.02 .64
9 47 | 15 30 | .03 .40 | 1.24 1.23 1.58 .85
10 55 | 16 29 | .27 .41 | 1.25 1.67 1.62 1.96
11 59 | 16 28 | .35 .42 | 1.03 .94 .27 .07
12 65 | 10 26 | -.56 .44 | .83 .75 -.91 .72
13 66 | 12 27 | -.22 .43 | 1.06 1.02 .43 .16
14 74 | 7 25 | -1.05 .49 | 1.09 1.13 .43 .44
15 78 | 7 30 | -1.41 .47 | .93 1.21 -.18 .60
16 79 | 10 28 | -.71 .44 | .89 .80 -.54 .53
17 80 | 12 30 | -.46 .41 | .97 .88 -.12 .31
18 84 | 13 29 | -.23 .41 | .87 .78 -.76 .73
19 26 | 15 30 | .03 .40 | .95 .90 -.32 .28
20 98 | 28 30 | 3.00 .75 | 1.18 1.91 .48 1.02
21 14 | 20 30 | .85 .42 | 1.01 .90 .11 .17
22 17 | 14 28 | -.03 .42 | .90 .85 -.61 .46
23 22 | 13 30 | -.29 .41 | .77 .69 -1.54 1.11
24 28 | 17 29 | .44 .41 | 1.16 1.19 1.06 .67
25 30 | 16 30 | .19 .40 | 1.09 1.10 .68 .43
26 34 | 12 29 | -.40 .42 | 1.25 1.24 1.43 .83
27 37 | 11 30 | -.63 .42 | 1.27 1.27 1.45 .90
28 50 | 12 30 | -.46 .41 | .93 .91 -.35 .21
29 51 | 16 30 | .19 .40 | .90 .81 -.69 .60
30 54 | 18 30 | .51 .41 | 1.32 1.31 2.00 1.00
31 56 | 10 29 | -.77 .43 | 1.14 1.12 .75 .46
32 57 | 12 30 | -.46 .41 | 1.41 1.41 2.20 1.33
33 64 | 13 20 | .45 .51 | 1.07 .93 .39 .03
34 69 | 16 25 | .59 .46 | 1.12 1.04 .72 .23
35 75 | 10 19 | .22 .50 | 1.64 1.90 3.08 2.26
36 76 | 12 17 | .79 .58 | 1.61 2.13 2.11 1.75
37 77 | 14 30 | -.13 .40 | 1.11 1.06 .75 .31
38 81 | 7 30 | -1.41 .47 | 1.04 1.21 .26 .58
39 90 | 13 29 | -.23 .41 | 1.36 1.54 2.07 1.68
40 99 | 29 30 | 3.76 1.03 | 1.00 .56 .31 .22
41 02 | 20 30 | .85 .42 | .94 .82 -.28 .39
42 10 | 19 30 | .68 .41 | .88 .78 -.74 .60
43 12 | 16 30 | .19 .40 | .77 .69 -1.66 1.11
44 16 | 11 24 | -.38 .45 | .92 .93 -.44 .14
45 19 | 17 30 | .35 .40 | .84 .76 -1.13 .75
46 20 | 17 30 | .35 .40 | .91 .83 -.58 .50
47 25 | 17 30 | .35 .40 | .88 .80 -.84 .61
48 31 | 17 30 | .35 .40 | .85 .84 -1.03 .46
49 36 | 14 30 | -.13 .40 | 1.11 1.11 .72 .48
50 41 | 16 30 | .19 .40 | 1.04 1.00 .34 .09
51 58 | 14 23 | .34 .47 | .96 .86 -.19 .30
52 71 | 16 30 | .19 .40 | .88 .80 -.85 .64
53 72 | 16 30 | .19 .40 | .88 .80 -.83 .64
54 73 | 20 30 | .85 .42 | .85 .75 -.90 .61
55 83 | 12 30 | -.46 .41 | .95 .95 -.24 .07
56 93 | 14 30 | -.13 .40 | .86 .84 -.91 .50
============================================================================
*****Output Continues****
Run One: Hoa hoc 10
---------------------------------------------------------------------------
Case Estimates In input Order 14/5/2004 20:29
all on hoa10 (N = 100 L = 30)
----------------------------------------------------------------------------
NAME |SCORE MAXSCR | ESTIMATE ERROR | INFIT OUTFT INFT OUTFT
| | | MNSQ MNSQ t t
----------------------------------------------------------------------------
57 95 | 11 30 | -.63 .42 | .97 .93 -.08 .13
58 96 | 13 30 | -.29 .41 | .97 .96 -.12 .06
59 97 | 12 30 | -.46 .41 | .99 .99 .02 .06
60 100 | 4 30 | -2.21 .58 | .96 1.28 .03 .60
61 01 | 24 30 | 1.64 .48 | .97 1.27 -.03 .64
62 04 | 23 30 | 1.42 .46 | 1.05 1.36 .31 .82
63 05 | 14 27 | .12 .43 | .85 .78 -.96 .65
64 15 | 23 29 | 1.56 .49 | 1.11 1.50 .48 .98
65 32 | 15 30 | .03 .40 | .95 .90 -.30 .26
66 33 | 15 30 | .03 .40 | .95 .90 -.28 .25
67 40 | 14 30 | -.13 .40 | .97 .92 -.12 .21
68 43 | 16 30 | .19 .40 | .97 .91 -.18 .21
69 44 | 13 30 | -.29 .41 | .93 .90 -.37 .26
70 48 | 14 30 | -.13 .40 | .93 .89 -.42 .32
71 49 | 13 30 | -.29 .41 | 1.12 1.31 .80 1.09
72 52 | 13 18 | .81 .56 | .81 .66 -.74 .55
73 53 | 8 17 | -.22 .54 | 1.27 1.26 1.22 .77
74 60 | 14 19 | .94 .56 | .80 .60 -.73 .66
75 62 | 13 18 | .74 .56 | .78 .64 -.86 .62
76 63 | 8 14 | .00 .59 | 1.13 1.11 .61 .40
77 67 | 12 30 | -.46 .41 | 1.27 1.43 1.53 1.37
78 70 | 7 10 | .41 .74 | .92 .75 -.12 .29
79 86 | 14 30 | -.13 .40 | 1.03 1.24 .23 .89
80 88 | 14 30 | -.13 .40 | 1.22 1.48 1.39 1.57
81 03 | 21 30 | 1.03 .43 | .97 1.06 -.13 .27
82 06 | 12 30 | -.46 .41 | .80 .72 -1.19 .96
83 07 | 15 30 | .03 .40 | 1.01 .98 .15 .01
84 08 | 20 30 | .85 .42 | .78 .65 -1.34 .97
85 11 | 18 30 | .51 .41 | .85 .77 -1.04 .67
86 13 | 16 30 | .19 .40 | .75 .76 -1.84 .80
87 27 | 20 30 | .85 .42 | .78 .65 -1.35 .97
88 29 | 16 29 | .30 .41 | .75 .75 -1.79 .80
89 38 | 13 28 | -.16 .42 | .74 .67 -1.69 1.14
90 39 | 17 30 | .35 .40 | .93 .96 -.44 .04
91 46 | 18 30 | .51 .41 | .92 .87 -.48 .34
92 61 | 12 30 | -.46 .41 | 1.07 1.02 .44 .17
93 68 | 11 30 | -.63 .42 | .83 .79 -.96 .63
94 82 | 9 30 | -1.00 .44 | 1.09 1.06 .46 .27
95 85 | 18 30 | .51 .41 | .93 .87 -.42 .93
97 89 | 7 30 | -1.41 .47 | 1.09 1.19 .42 .55
98 91 | 13 23 | .31 .45 | 1.16 1.20 1.03 .73
99 92 | 9 30 | -1.00 .44 | 1.06 1.07 .35 .30
100 94 | 5 30 | -1.91 .53 | 1.45 1.78 1.31 1.29
----------------------------------------------------------------------------
Mean | | .10 | 1.01 1.01 .00 .05
SD | | .84 | .18 .30 1.00 .76
============================================================================
Bảng 2
Trong đó Esimate là năng lực của thí sinh, error là độ khó của bài trắc
nghiệm
CHƯƠNG IV: KẾT LUẬN
IV. Khoa học đo lường và đánh giá trong giáo dục trên thế giới và nước ta.
IV.1. Trên thế giới, khoa học đo lường đã có một lịch sử ra đời (khoảng một thế
kỷ) và phát triển hết sức mạnh mẽ. ở Châu Âu và đặc biệt là Mỹ, lĩnh vực khoa
học này phát triển mạnh từ thời kỳ trước và sau chiến tranh thế giới thứ 2. Việc
chấm bài trắc nghiệm bằng máy của IBM năm 1935, việc thành lập NCME vào
thập niên 1950 và ra đời ETS (dịch vụ trắc nghiệm giáo dục) năm 1947 ngành
công nghiệp trắc nghiệm đã hình thành ở Mỹ. Từ đó đến nay khoa học về đo
lường tâm lý và giáo dục đã phát triển liên tục tự phê bình chỉ trích và tự điều
chỉnh phát triển ngày một mạnh mẽ hơn thường xuyên hơn. Tương ứng với ngành
công nghiệp trắc nghiệm đồ sộ và sự phát triển như vũ bão của ngành công nghệ
thông tin, lý thuyết về đo lường trong tâm lý trong giáo dục cũng phát triển rất
nhanh. Đặc biệt là với sự ra đời của thuyết ứng đáp câu hỏi đã đạt được những
thành tựu quan trọng nâng cao độ chính xác của phương phaps trắc nhiệm .Ngoài
ra ,trên những thành tựu của IRT và ngôn ngữ học máy tính công nghệ E- RATE
chấm tự động các bài luận tiếng anh nhờ máy tính của ETS đã được triển khai
nhờ mạng Internet trong năm vùa qua. Trong các kỳ thi tuyển sinh đại học mà
dựa vào kết quả của các kỳ thi do các công ty ngoài Nhà nước tổ chức để xét
tuyển. Có hai dịch vụ hỗ trợ TTĐH ở Hoa Kỳ là SAT (Scholastic Achievement
Test) do công ty ETS (Educational Testing Services) tổ chức, và ACT
(American College Test) do chương trình ACT American College Testing
Program triển khai.
Cả SAT và ACT thường tổ chức thi mỗi năm 4 lần, cho các học sinh ở
những năm cuối bậc phổ thông trung học. Hiện naz hàng năm có khoảng 1,8 triệu
thí sinh thi SAT và 1,6 triệu thí sinh thi ACT.
IV.1.2. Ở Việt Nam Chúng ta đã tổ chức một mùa tuyển sinh đại học bằng trắc
nghiệm khách quan và đạt được kết quả ngoài sức tưởng tượng. Ban đầu khi
chúng ta tiến hành kỳ thi thửa đầu tiên tại Đà Nẵng tưởng chừng như học sinh
không chấp nhận và gây nhiều dư luận cho xã hội, nhưng khi tiến hành chúng ta
làm song song cả đề thi tiểu luận và đề thi trắc nghiệm cho thí sinh lựa chọn. Kết
quả là có 70% số thí sinh tham dự đã chọn đề thi bằng trắc nghiệm khách quan là
con số ngoài dự đoán và mong đợi của những nhà tổ chức. Lý do mà các thí sinh
lựa chọn đề thi trắc nghiệm là việc chấm điểm bằng máy tính tạo sự tin tưởng và
độ chính xác điểm vì khi tự luận đôi khi điểm chấm phụ thuộc vào rất nhiều các
yếu tố chủ quan khác nhau. Rõ ràng tuy mới được đưa vào thử nghiệm đầu tiên
nhưng trắc nghiệm khách quan đã thể hiện được ưu thế vượt trội của mình so với
sử dụng phương pháp tự luận truyền thống. Và kết quả chúng ta đã lựa chọn
tương đối khách quan và chính xác những người có khả năng vào đại học, trường
hợp may rủi xảy ra là rất ít. Từ mùa thi tại Đà Nẵng 1996 đó tới nay chúng ta đã
mở rộng ra tại nhiều tỉnh và đã áp dụng thi tuyển bằng trắc nghiệm cả trong Nam
và ngoài Bắc. Đến nay phương pháp trắc nghiệm được dùng ngay trong kỳ kiểm
tra học kỳ về một số môi thi học kỳ trong đại học.
IV.3. Giải pháp về phướng phát triển khoa học đo lường trong giáo dục ở
nước ta
Chúng tôi xin đề xuất những phương hướng sau:
- Tất cả giáo chức của các trường đại học cần được bồi dưỡng những hiểu
biết sơ đẳng về khoa học này.
- Mọi trường đại học đều nên tổ chức bộ phận nghiên cứu triển khai để áp
dụng khoa học về đo lường trong giáo dục vào các hoạt động kiểm tra đánh giá
kết quả học tập của sinh viên, hoạt động giảng dạy và phục vụ của giáo chức và
viên chức.
- Các trường đại học và viện nghiên cứu chuyên về giáo dục cần đẩy mạnh
việc nghiên cứu về khoa học đo lường trong giáo dục để thấu hiểu nó, từ đó
hướng dẫn áp dụng nó trong toàn hệ thống giáo dục từ mâu giáo đến sau đại học.
- Tiếp đến, cần trước khai áp dụng khoa học đo lường trong giáo dục ra
mọi hoạt động xã hội bên ngoài hệ thống giáo dục, vì rằng trong lương lai, với sụ
phát triển của kinh tế xã hội, tất yếu việc áp dụng khoa học đó sẽ trở thành một
ngành công nghiệp lớn.
TÀI LIỆU THAM KHẢO
1. Lâm Quang Thiệp 2000 Đo lường và đánh giá chất lượng giáo dục
2. Lâm Quang Thiệp 1994. Những cơ sở của kỹ thuật trắc nghiệm. Bộ giáo
dục và đào tạo vụ đại học
3.Dương Thiệu Tống: Trắc nghiệm và đo lường thành quả học tập (Tập 1)
Trường ĐHTH Thành Phố Hồ Chí Minh xuất bản năm 1995
4. Dương Thiệu Tống: Trắc nghiệm và đo lường thành quả học tập (Tập 2)
Trường ĐHTH Thành Phố Hồ Chí Minh xuất bản năm 1995
5. Cơ sở của Kỹ thuật trắc nghiệm (Trích các bài giảng của P.Griffin- Vụ
Đại học, 19994)
6. Nguyễn Phụng Hoàng và Võ Ngọc Lan: Phương pháp trắc nghiệm trong
kiểm tra và đánh giá thành quả học tập NXBGD.1996
7. Trần Trọng Thuỷ, Khoa học Chẩn đoán Tâm lý,NXBGD,Hà Nội, 1994.
8. Thorndike,E.L.I trodution to the Thẻoy of Meantal and Social
Maesanure . New Yhork:Teacher College,Clumbia University,1904.
Các file đính kèm theo tài liệu này:
- Luận Văn- Tổng quan về phương pháp trắc nghiệm khách quan.pdf