Luận văn Tổng quan về phương pháp trắc nghiệm khách quan

Ở Việt Nam Chúng ta đã tổ chức một mùa tuyển sinh đại học bằng trắc nghiệm khách quan và đạt được kết quả ngoài sức tưởng tượng. Ban đầu khi chúng ta tiến hành kỳ thi thửa đầu tiên tại Đà Nẵng tưởng chừng như học sinh không chấp nhận và gây nhiều dư luận cho xã hội, nhưng khi tiến hành chúng ta làm song song cả đề thi tiểu luận và đề thi trắc nghiệm cho thí sinh lựa chọn. Kết quả là có 70% số thí sinh tham dự đã chọn đề thi bằng trắc nghiệm khách quan là con số ngoài dự đoán và mong đợi của những nhà tổ chức.

pdf57 trang | Chia sẻ: lylyngoc | Lượt xem: 2803 | Lượt tải: 6download
Bạn đang xem trước 20 trang tài liệu Luận văn Tổng quan về phương pháp trắc nghiệm khách quan, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
độ thí sinh hay không? -Có những đầu mối hở không chủ tâm để doán câu trả lời hay không? -Có phải rõ ràng một câu trả lời đúng (hoặc tốt nhất) cho từng câu hỏi không? -Loại câu hỏi đó có phù hợp với thông tin cần biết hay không ? -Những nhận định trong các câu hỏi có gì là xúc phạm hay không ? -Có đủ các câu hỏi tiêu biểu để tạo ra được một mẫu thích hợp của các hành vi được đánh giá hay không? Việc xét duyệt các câu hỏi này được đem ra thử nghiệm là để đảm bảo sao cho chúng ta tránh được cách diễn đạt bằng ngôn ngữ quá phức tạp đối với các ý tưởng đang định trắc nghiệm, Tránh các từ thừa, các phủ định kép và các câu nhiễu không hợp lý. Khi xem xét cũng cố gắng tìm ra các câu hỏi không có câu trả lời đúng (hay tốt nhất) cũng như các câu có nhiều phương án trả lời đúng. Các câu hỏi như vậy có thể được loại bỏ hay viết lại. II.1.4.Lưu ý chung khi viết câu hỏi khách quan. +Yêu cầu chung: 1.Sử dụng ngôn ngữ phù hợp với thí sinh 2.Không hỏi ý kiến riêng của thí sinh, chỉ hỏi sự kiện, kiến thức. Loại nhiều lựa chọn: 1.Các phương án sai phải có vẻ hợp lý. 2.Chỉ nên dùng 4 hoặc 5 phương án chọn 3.Đảm bảo cho câu dẫn nối liền với mọi phương án chọn theo đúng ngữ pháp. 4.Chỉ có một phương án chon là đúng 5.Tránh dùng câu phủ định, đặc biệt là phủ định hai lần. 6.Tránh lạm dụng kiểu “không phương án nào trên đây đúng” hoặc “mọi phương án trên đây là đúng” 7.Tránh việc tạo phương án khác biệt so với các phương án khác (dài hơn hoặc ngắn hơn, mô tả tỉ mỉ hơn…) 8.Phải sắp xếp phương án đúng theo thứ tự ngẫu nhiên. II.2.Các đại lượng đặc trưng liên quan đến bài trắc nghiệm II.2.1.Xác suất. Đối với các hiện tượng ngẫu nhiên người ta không thể biết chắc chắn một sự kiện hoặc biến cố gì đó xảy ra, chỉ có thể nói xác suất xẩy ra một biến cố nào đó. Ví dụ xác suất xuất hiện một sự cố như sự xuất hiện “mặt lục” của xúc sắc 6 mặt là 1/6. Xác suất là motọ số không âm, có giá trị từ 0 đến 1, xác suất bằng 0 ứng với sự cố không thể xảy ra, xác suất bằng 1 ứng với sự cố chắc chắn xảy ra. II.2.Bản đặc trưng 2 chiều Khi chúng ta đã có trong tay một đề kiểm tra được xây dựng đúng theo các bước như trên đây nhưng liệu chúng ta đã đảm bảo được chất lượng của đề thi đó là tốt hay xấu chưa. Để trả lời câu hỏi này chúng tôi xin giải thích rõ hơn về bản đặc trưng hai chiều. Vậy bản đặc trưng hai chiều là gì ? bản đặc trưng 2 chiều là khái niệm để đánh giá đề thi mà chúng ta cho kiểm tra đã đạt chưa và đã đạt được đúng mục tiêu giảng dạy chưa. Một đề thi muốn đạt được chất lượng tốt nghĩa là nó phải đo được cái cần đo hay bám sát vào mục tiêu giảng dậy. Về nội dung phải đảm bảo vừa tầm với học sinh, kiến thức bao quát được cả quá trình dạy, các câu được phân bố đồng đều về cấu trúc cũng như nội dung chương trình. Như vậy để đánh giá được cả một đề thi đó ra sao chúng ta phải đánh giá đến từng câu hỏi một. Yêu cầu ở mỗi câu hỏi ở mức kỹ năng nào : nhớ, hiểu hay áp dụng … Để hiểu rõ vấn đề chúng tôi xin phân tích đề thi mà chúng tôi đã tíến hành thử nghiệm về nội dung và các yêu cầu của một đề thi bằng trắc nghiệm KQ qua các phần sau đây: I.2.1.Sơ lược về kiến thức chương trình hoá 10. Đây là yếu tố quan trọng nhất để xây dựng một đề thi bất kỳ nào đó kể cả tự luận hay trắc nghiệm. Chỉ có những người có chuyên môn thật vững kiến thức thì mới có khả năng ra một đề thi tốt được. Mà một đề thi muốn tốt thì người ra đề thực sự phải có chuyên môn sâu vì họ sẽ đánh giá cho câu hỏi về vấn đề gì mà đảm bảo kiến thức xuyên suốt chương trình mà đạt được mức độ nhận thức theo mức độ chương trình chung. II.2.1.1.Cấu trúc chương trình Chương trình hoá lớp 10 gồm 5 chương sau: -Chương I: Cấu tạo nguyên tử -Chương II: liên kết hoá học định luật tuần hoàn Menđelêep -Chương III: Phản ứng Oxi hoá khử -Chương IV: Phân nhóm chính nhóm VII- nhóm halogen -Chương V: Oxi-lưu huỳnh lý thuyết phản ứng hoá học II.2.1.2.Nội dung chính của từng chương *Chương I: Cấu tạo nguyên tử Yêu cầu chính của chương trình là học sinh nắm được các khái niệm cơ bản thuyết cấu tạo nguyên tử. Ví dụ thành phần cấu tạo của nguyê ntử ra sao, hạt nhân nguyên tử là gì, thế nào là nguyên tố hoá học, khái niệm về đồng vị, đặc biệt nắm được cấu tạo của bảng hệ thống tuần hoàn, vì đây là phần đầu của chương trình nên học sinh thường rất bỡ ngỡ và khó hiểu những khái niệm trừu tượng như cấu hình (e) obi tan nguyên tử, electron lớp ngoài cùng. Phần quan trọng của chương này chính là nắm được tính chất chung của bảng HTTH. Ví dụ khi câu hỏi đưa ra một chất cho diện tích bằng bao nhiêu thì thường sẽ hỏi viết cấu hình (e) của nguyên tố đó có mấy (e) lớp ngoài cùng, từ đó suy ra tính chất của nhân tố đó có tính kim loại hay phi kim loại. Khi có trong tay bảng FTTH học sinh tối thiểu phải trả lời được các câu hỏi như thế nào là chu kỳ, phân nhóm (chính, phụ) số electron ngoài cũng có liên quan gì đến tính chất của nguyên tố đó. Nếu số electron ngoài cùng là 1,2,3 thì nó thể hiện tính kim loại, 4,5,6 thể hiện tính phi kim, bằng thể hiện tính chất của khí (khí hiếm)… Như vậy nếu học sinh không hiểu được bản chất thì không thể trả lời được câu hỏi. Chẳng hạn, trong đề kiểm tra thử nghiệm chúng tôi đưa ra 4 câu về chương cấu tạo chất chúng ta phân tích một ví dụ cụ thể trong đề thi đó: VD: Cho một nguyên tố có cấu hình (e) ngoài cùng 3523P5. Vậy nguyên tố ấy sẽ là : A) B) P C) N D) F Rõ ràng với yêu cầu của câu hỏi được đặt ra như vậy thì một học sinh kém hay ở mức trung bình trở xuống sẽ không trả lời được. Để trả lời đúng câu này học sinh phải nắm được khái niệm (e) lớp ngoài cùng có ý nghĩa như thế nào, nắm được obitan nguyên tử và thế nào là điện tích nguyên tố. Khi câu hỏi đưa ra dạng khuyết như vậy đầu tiên chúng ta sẽ phải viết được cấu hình đầy đủ của nguyên tố đó có dạng : 1522522P5. Sau đó tính được điện tích nguyên tố bằng tổng các electron được phân bố trên các obitan, sẽ tính được Z=17, dùng bảng HTTH tra nguyên tố có thứ tự (hay điện tích nguyên tố bằng 17 sẽ là clo). Thực tế có những học sinh kém đến mức không biết xác định nguyên tố tên là gì nếu biết điện tích nguyên tố vì họ không hiểu được khái niệm điện tích nguyên tố là gì và cấu trúc bảng HTTH như thế nào, cách tra ra sao ? *Chương II: Liên kết hoá học định luật tuần hoàn Menđeleev Nội dung chính của chương này đặt ra một số vấnđề như : vì sao các chất lại tồn tại và chúng tồn tại theo một quy luật nhất định nào đó ? từ đó thuyết liên kết hoá học ra đời và giải thích được câu hỏi đó. Yêu cầu đối với học sinh ở chương này nắm được bản chất của liên kết hoá học là gì, có các loại liên kết hoá học nào, bản chất của từng loại liên kết một. Ngoài ra học sinh phải nắm được định luật tuần hoàn của Menđeleev cho phép chúgn ta biết được tính chất hoá học của nguyên tố hoá học bất kỳ và tính chất của chúng biến đổi theo một quy luật nhất định. Vì thời gian và số lượng câu nên chúng tôi không đưa nội dung này vào trong đề kiểm tra của mình. *Chương III: Phản ứng oxi hoá khử Đây là một mảng kiến thức rất quan trọng trong không chỉ trong chương trình lớp 10 mà nó xuyên suốt cả chương trình phổ thông. Yêu cấu tối thiểu đối với học sinh bình thường phải nắm được các khái niệm như : Số ôxi hoá, chất ôxi hoá, chất khử, phản ứng. Và đương nhiên phải hiểu được bản chất của vấn đề ví như cho một phản ứng bất kì học sinh phải chỉ ra được nó có thuộc loại phản ứng ôxy hoá khử hay không, đâu là chất oxy hoá, đâu là chất khử. Khi đã có các khái niệm rồi thì yêu cầu cuối cùng và quan trọng nhất đối với học sinh trong chương này chính là có thể cân bằng (e). Nếu học sinh không cân bằng nổi một phương trình đơn giản thì kiến thức học sinh đó đáng báo động và phải điều chỉnh ngay vì chưa biết cân bằng phương trình coi như không hiểu gì về chương oxi hoá-khử. Trong đề thi của mình chúng tôi đã đưa ra 6 câu hỏi về chương này với các dạng khác nhau với các mức yêu cầu khác nhau, có dạng đơn giản chỉ là xác định số oxi hoá của một nguyên tố bất kỳ trong một hợp chất nào đất, có câu áp dụng bằng phương trình oxi hoá khử hay có dạng cho một phương trình phản kứng yê ucầu học sinh xác định đâu là chất khử, đâu là chất oxi hoá. Ví dụ: cho phản ứng: Fe304 +10 HN03 = 3 Fe (N03)3 + N)2 + 5H20 vậy thì: A) Fe304 và HN03 đều là chất oxi hoá B) Fe304, HN03 đều là chất khử C) Fe304 là chất khử, HN03 chất oxi hoá D) Fe304 chất oxi hoá, HN03 chất khử Như vậy với ví dụ này nếu học sinh biết xác định số oxi hoá của nguyên tố nào thay đổi và hiểu được định nghĩa thế nào là chất khử, chất oxi hoá thì sẽ làm được câu hỏi này một cách dễ dàng. *Chương IV: Phân nhóm chính nhóm VII - Nhóm Haloofen Đây là chương rất quan trọng trong khối lượng kiến thức hoá 10 nên chúng tôi đã xây dựng một số lượng các câu hỏi khá lớn trong đề kiểm tra của mình (8 câu trên 30 câu). Nội dung chính của chương này mà học sinh phải nắm được là các tính chất vật lý hoá học chung của phân nhóm chính nhóm VII, sau đó đi chi tiết tính chất của từng nguyên tố một. Theo như phân bố chương trình sách giáo khoa nguyên tố clo được trình bày kỹ càng và trọng tâm nhất trong các nguyên tố halogen. Học sinh cần phải nắm được các tính chất lí hoá học của nguyên tố clo và tính chất đặc trưng của một số hợp chất chứa oxy cảu clo như : clorua vôi, nước taven, axits clohidric, muối clorua… Ngoài ra các nguyên tố còn lại như Flo, Brem, iDt không chỉ hiểu được các tính chất chung mà phải nắm được một số tính chất riêng của từng nguyên tố là gì. Trong sách ra đề của chúng tôi trong chương này vừa có dạng tổng quát như so sánh mức độ hoạt động của các nguyên tố halogen, so sánh axít của chúng, tính chất của clo là gì, các phương pháp điều chế clo, hay có những bài tập áp dụng có tính bán kết quả. Như vậy mục tiêu khi ra câu hỏi không phải dừng ở mức kỹ năng nhớ, hiểu áp dụng mà nó đòi hỏi kỹ năng tư duy tương đối cao (phân tích, đánh giá) Chúng ta xét một câu hỏi trong bộ đề kiểm tra mà chúng tôi đã tiến hành thử nghiệm. Một dạng câu hỏi áp dụng tính toán nhưng để làm được thì không những học sinh phải sử dụng tính toán đơn thuần mà phải kết hợp được nhiều mức kỹ năng khác nhau. Cho 8,7 gam Mn02 tác dụng với dung dịch H dư thì thể tích khi Cl2 ( ) thu được sẽ là : A)22,4 (l) B)4,48 (l) C)2,24 (l) D)11,2 (l) Để làm được câu hỏi này học sinh phải kết hợp viết và cân bằng được phương trình và tính toán theo phương trình phản ứng mà điều này đối với học sinh kém quả thực không mấy đơn giản chút nào vì làm trong một khoảng thời gian ngắn đòi hỏi sự nhanh nhẹn và kỹ năng làm bài thành thạo. *Chương V: Oxi-lưu huỳnh. Lý thuyết về phản ứng hóa học. Đây cũng là chương được chúng tôi phân bố câu hỏi cũng tương đối nhiều (khoảng 9 câu). Cũng giống như chương Halogen ngoài những tính chất đặc trưng chung của phân nhóm chính. Nhóm VI học sinh phải nắm được tính chất của một số các chất được trình bày riêng một bài. Yêu cầu học sinh phải nắm được tính chất của oxi lưu huỳnh, hidosunfua, các oxits của lưu huỳnh, đặc biệt là axít Sunfuric… Dạng câu hỏi chúng tôi xây dựng về chương này cũng vừa có lý thuyết và có các dạng bài tập tính toán. Có câu đòi hỏi mức độ tư duy rất cao dành cho học sinh giỏi, ví dụ: Cho các chất: O2, S, H2S, SO2 chất tan nhất trong nước là : A) SO2 B) S C) H2S C) O2 Nếu học sinh không nắm được tính chất vật lí của từng bài về lưu huỳnh, Oxi, hidroSunfua, Oxít của lưu huỳnh thì khó có thể trả lời được câu này vì nó đòi hỏi không chỉ nhớ kiến thức qua từng bài mà học sinh phải biết tổng hợp kiến thức qua mỗi bài học để so sánh từng chất với nhau. Vì trong thời gian chúng tôi nghiên cứu đề tài nàyếu tố khi tiến hành thí nghiệm học sinh gần kết thúc chương trình và để đánh giá chính xác thực lực học sinh trong học kỳ 2 nên đề kiểm tra mà chúng tôi biên soạn chủ yếu tập trung vào 3 chương cuối cùng (chương oxi hoá khử, các nguyên tố halogen, các nguyên tố nhóm VIA) nên có thể nội dung chưa xuyên suốt được toàn bộ chương trình lớp 10 nhưng gần như những vấn đề nổi cộm và cốt lõi nhất chúng tôi có đưa vào và với sự đa dạng về các loại câu hy vọng kết quả của chúng tôi làm thử đạt được như mong đợi. II.3.Phương pháp đánh giá bài trắc TN II.3.1.Các mức độ mục tiêu trong lĩnh vực nhận thức. Nói đến mức độ mục tiêu trong lĩnh vực nhận thức chúng ta nghĩ ngay đến Bloom, người đã xây dựng nên các cấp độ của các mục tiêu giáo dục hay gọi là cách phân loại Bloom theo. Bloom trong lĩnh vực nhận thức được chưa thành các mức độ hành vi từ đơn giản đến phức tạp nhất như sau: 1.Nhớ (Knou ledgo): Nghĩa là sự nhớ lại các dữ liệu đã được học trước đây nghĩa là một người có thể nhắc lại một loạt các dữ liêụ từ các sự kiện đơn giản đến các lý thuyết phức tạp, tái hiện trong trí nhớ những thông tin cần thiết. Đây là cấp độ thấp nhất của kết quả học tập trong lĩnh vực nhận thức. Ví dụ trong hoá học học sinh có khả năng nhớ bài học có thể trả lời được câu hỏi như : Nêu các tính chất hoá học của axit clohidric. Nhưng một bài kiểm tra mà ra các câu hỏi kiểu dạng như thế này thì chưa đạt yêu cầu vì nó sẽ kích thích học sinh học thuộc lòng, học vẹt mà thực chất lại không hiểu được vấn đề gì. 2.Hiểu (Comprehention): Nghĩa là khả năng nắm được ý nghĩa của tài liệu. Hay nói cách khác có thể thực hiện bằng việc chuyển tài liệu từ dạng này sang dạng khác bằng cách giải thích tài liệu (hay tóm tắt) và bằng cách ước lượng xu hướng tương lai (dự báo các kết quả hoặc ảnh hưởng). Kết quả học tập được đo ở mức độ này cao hơn so với nhớ, đây là mức độ thấp nhất để hiểu thấu sự vật. Ví dụ: Số electron của một ion Mg2 là: A) 2 B) 12 C) 24 D) 10 Nếu học sinh không hiểu được yêu cầu nội dung câu hỏi mà chỉ học thuộc thôi thì rất dễ mắc bẫy. Muốn trả lời được câu hỏi này, thí sinh phải hiểu được khái niệm thế nào là điện tích ion, thế nào là số electron của nguyên tố từ đó suy ra được số electron của một ion mang điện tích dương hay âm bất kỳ nào đó. Nếu thí sinh chọn phương án có 2 electron có nghe ra cũng có lý nếu hiểu điện tích ion bằng số electron, nếu chọn 12 hay 24 cũng có vẻ không vô lý lắm vì nếu học sinh học thuộc lòng thứ tự điện tích các nguyên tố thì thấy ngay số thứ tự của Mg trong bảng HTTH là 12, còn số 24 là biết đâu do đoán mò lấy số 2 nhân với 12 thì may ra đúng. Như vậy, chúng ta thấy chỉ học thuộc lòng mà không hiểu bản chất thì học sinh sẽ khó có thể trả lời đúng và đáp án đúng ở đay lại là 10 (phương án D) mà con số này nó có vẻ không hợp lý lắm so với kiến thức mà học sinh đã được học. Vì bình thường nguyên tử của nguyên tố magie có 12 electron nhưng ở đây người ta hỏi số electron của ion Mg2+ nghĩa là nguyên tử đã nhường cho 2 electron để được ion dương Mg2+ và chỉ cần làm 1 phép tính đơn giản lấy 12- 2 = 10 (electron) 3.Áp dụng (application): được định nghĩa là khả năng sử dụng các tài liệu đã học vào một hoàn cảnh cụ thể mới. Điều đó bao gồm việc áp dụng các quy tắc, phương pháp, khái niệm, nguyên lý, định luật, lý thuyết. Kết quả học tập trong lĩnh vực nào đó ở cấp độ này đòi hỏi sự thấu hiểu cao hơn so với mức kỹ năng nhớ và hiểu một chút. Thí dụ khi học sinh học kiến thức về chương oxi hoá khử, học sinh đã nắm được các bước để cân bằng một phản ứng oxi hoá khử theo phương pháp thăng bằng electron thì khi gặp bất kỳ một phản ứng nào đều có thể làm được. Bài tập dạng cân bằng như vậy chúng tôi có áp dụng vào trong đề kiểm tra thử nghiệm này, có khoảng 2 câu về cân bằng phương trình ở mức độ trung bình và một bài tương đối phức tạp một chút. Ví dụ: Cho phản ứng: ANH3 + BO2 = CNO + DH2O. Các hệ số A, B, C, D sẽ là A) 5,4,5,4 B) 4,4,5,5 C) 4,5,4,5 D) 4,5,4,6 Chúng ta thấy ngay rằng nếu hiểu và vận dụng đúng các bước cân bằng mà học sinh đã học thì việc cân bằng này rất dễ dàng mà không tốn nhiều thời gian. Ngoài ra nếu học sinh có thể thay đáp án thử lại xem kết quả nào hợp lý sau đó sẽ chọn giá trị tương ứng nhưng cách làm đó rất thủ công và mất nhiều thời gian học sinh phải thử đến 4 phép tính gây cảm giác rất rối và nặng nề. Vì đối với những phương trình đơn giản có thể thử được nhanh nhưng có những phương trình cân bằng với hệ số rất lớn thì công việc tính toán chiếm rất mất nhiều thời gian hơn là cân bằng phương trình đó bình thường theo phương pháp đã học. 4.Phân tích (Analysis): Nghĩa là khả năng phân chia một tài liệu ra thành các phần của nó sao cho có thể hiểu được các cấu trúc tổ chức của nó. Điều đó có thể bao gồm việc chỉ ra đúng các bộ phận phân tích mối quan hệ giữa các bộ phận và nhận biết được các nguyên lý tổ chức được bao hàm. Kết quả học tập ở mớc độ này đòi hỏi học sinh có mức độ trí tuệ cao hơn so với mức hiểu và áp dụng vì nó yêu cầu một sự thấu hiểu cả nội dung và hình thái cấu trúc của tài liệu. Thí dụ: ion X có cấu hình (e) lớp ngoài cùng: 3S23P6. Vậy X là : A) B) S C) P D) N Để trả lời được câu hỏi này học sinh phải phân tích được đề bài, dữ liệu bài toán cho là ion X2 nhưng lại hỏi về nguyên tố X. Đầu tiên ta sẽ chuyển cấu hình ion X2 về cấu hình X, sau đó từ cấu hình (e) lớp ngoài cùng viết cấu hình (e) đầy đủ của X và tính số điện tích nguyên tố sẽ tra được nguyên tố đó dựa vào bảng HTTH. Rõ ràng với một câu hỏi như vậy chúng ta đã chuyển sang các dạng trung gian khác nhau để tìm ra phương án trả lời. 5.Tổng hợp (Syn theis): Được định nghĩa là khả năng sắp xếp các bộ phận lại với nhau để hình thành một tổng thể mới. Điều đó có thể bao gồm việc tạo ra một cuộc giao tiếp đơn nhất, một kế hoạch hành động hoặc một mạng lưới các quan hệ trừu tượng. Kết quả học tập trong lĩnh vực này nhấn mạnh các hành vi sáng tạo, đặc biệt tập trung chủ yếu vào việc hình thành các mô hình hoặc cấu trúc mới. Mức kỹ năng tổng hợp đòi hỏi trình độ, kiến thức học sinh tương đối cao, thường những em học lực khá, giỏi mới có khả năng trả lời đúng câu hỏi. 6.Đánh giá (Evaluation): Là khả năng xác định giá trị cảu tài liệu (tuyên bố, tiểu thuyết, báo cáo …) việc đánh giá dự trên các tiêu chí nhất định được đặt ra sẵn. Đó có thể là các tiêu chí bên trong (cách tổ chức) hoặc các tiêu chí bên ngoài (phù hợp với mục đích), và người đánh giá phải tự xác định hoặc được cung cấp các tiêu chí. Kết quả học tập trong lĩnh vực này là cao nhất trong các cấp bậc nhận thức vì nó chứa các yếu tố của mọi cấp bậc khác.Vậy các cấp độ nhận thức theo Bloom có thể được mô tả bằng sơ đồ sau theo mức độ từ thấp đến cao 6.Đánh giá 5.Tổng hợp 4.Phân tích 3.áp dụng 2. Hiểu 1.Nhớ Sơ đồ các mưc kỹ năng theo Bloom Có những người nghĩ rằng chỉ có đề thi tự luận mới đánh giáđược tư duy ở mức độ cao còn đánh giá bằng TNKQ chỉ đạt ở mức độ tối thiểu nào đó, lối suy nghĩ như vậy là hoàn toàn sai lầm. Theo Bloom một bài kiểm tra có thể đánh giá mức độ tư duy của học sinh tương đối cao, có thể đạt mức độ cao nhất. Thế thì muốn ra được các câu hỏi yêu cầu học sinh ở mức độ nhận thức cao nó tuỳ thuộc rất nhiều vào khả năng người ra đề. Với chương trình lớp 10 thì khả năng tư duy còn nhiều hạn chế chính vì vậy thường thì học sinh học theo kiểu cảm nhận là chính. Vì vậy khi soạn các câu hỏi trắc nghiệm chúng tôi chủ yếu tập trung ở các mức độ 1, 2, 3. Cũng có những câu (nhưng không nhiều) yêu cầu học sinh ở mức độ cao (4, 5, 6) thường dành cho các em khá giỏi. Tuỳ theo mục tiêu đạt ra đối với học sinh cần đạt trình độ như thế nào để người ra đề thi cân nhắc và vận dụng ở mức độ hợp lý đối với học sinh. II.3.2.Yêu cầu đối với một bài thi TNKQ. II.3.2.1.Yêu cầu về nội dung Nội dung là yếu tố quan trọng nhất để đánh giá một bài học hay mọt bài kiểm tra có tốt hay không. Mục đích của mỗi bài học là học sinh cần nắm những phần gì quan trọng nhất, cái gì cần nhớ nhất, đó chính là nội dung của một bài học. Còn đối với một đề kiểm tra cũng vậy, chúng ta phải luôn tự đặt trong đầu các câu hỏi đề thi gồm những nội dung chính gì quan trọng nhất, phần nào bắt buộc đối với mọi học sinh thì phải nhấn sâu cho nhiều câu hỏi vào. Điều quan trọng là nội dung của mỗi câu hỏi có ăn khớp với nội dung học sinh đã được học trên lớp chưa ? Tránh những trường hợp nội dung câu hỏi rất hay nhưng không hề liên quan đến kiến thức cần kiểm tra như vậy sẽ dẫn đến một hậu quả rất nghiêm trọng là chúng ta sẽ không đo được mục tiêu giáo dục đã đề ra. Với thời gian và trong điều kiện cho phép, các câu hỏi mà chúng tôi đã biên soạn gần như bao phủ được toàn bộ chương trình lớp 10 nhưng trọng tâm số câu hỏi rơi vào nhiêù nhất là các chương: oxi hoá khử, phân nhóm chính nhóm VIIA, phân nhóm chính VIA. Ngoài những câu hỏi học sinh học chắc tính chất hoá học, có một số câu đòi hỏi học sinh thuộc cả tính chất vật lý, phương pháp điều chế…. II.3.2.2.Yêu cầu về các mức kỹ năng. Như đã giới thiệu ở trên để đánh giá chất lượng đề thi và đo được mục tiêu giảng dậy chúng ta phải đặt ra những yêu cầu về mức độ nhận thức đối với từng câu hỏi. Với trình độ học sinh lớp 10 chủ yếu các mức kỹ năng cần đạt là mức kỹ năng 1 (nhớ), kỹ năng (hiểu) và mức kỹ năng 3 (áp dụng) là tương đối đạt yêu cầu của chương trình giảng dạy. Nên đa số các cấu hỏi trắc nghiệm đạt ở các mức độ 1,2,3 mà chúng tôi chủ định biên soạn. Nhưng nếu một đề kiểm tra mà chỉ dừng lại ở các mức kỹ năng đó thì chưa đạt được mục tiêu là phân chia sự nhận thức khác nhau giữa học sinh kém và học sinh giỏi. Chính vì vậy đề thi phải có một số các câu hỏi (thường là ít) yêu cầu học sinh ở cấp độ cao hơn. Vì các câu ở mức kỹ năng cao mới đánh giá và phân biệt được khả năng tư duy ở hai trình độ khácnhau thì chất lượng làm bài cũng phân chia rõ ràng. Ngoài ra các câu khó này còn đánh giá được số điểm của từng đối tượng tương ứng với trình độ của học sinh. Thường thì học sinh khá, giỏi sẽ sẽ trả lời được các câu hỏi khó để đạt điểm 9, 10 còn học sinh trung bình đạt số điểm thường là 5,6. Nhưng cũng tránh ra những câu quá khó, hay một đề thi có quá nhiều câu đòi hỏi ở cấp độ cao làm cho hầu hết thí sinh không trả lời được (kể cả thí sinh giỏi) thì đề thi không phân cấp được khả năng làm bài giữa học sinh thuộc nhóm kém và nhóm giỏi. Theo chúng tôi, số lượng các câu hỏi ở mức độ khó nữa phải chiếm khoảng 20-30%, còn số câu ở mức độ khó phải nhỏ hơn 10% thì hợp lý hơn cả. Như vậy các câu hỏi được ra nằm ở các mức độ. Rất dễ (gần như ai cũng làm được ), dễ trung bình, khó, rất khó. Và do đó, chúng ta sẽ nhận thấy rằng để đạt được điểm tốt (9,10) thì học sinh phải thực sự có năng lực để trả lời các câu hỏi khó. II.3.2.3.Yêu câu về cách tổ chức Thường thì kiểm tra bằng TNKQcó thể kiểm tra đồng thời một số lượng học sinh tương đối lớn, nên nếu khâu tổ chức triển khai không tốt, dù bất kỳ một sơ suất nhỏ nào cũng đều có thể dẫn đến hậu quả xuất và những phản ứng xã hội bất lợi. Do đó để triển khai một kỳ thi với quy mô lớn người ta phải chuẩn bị hết sức cẩn thận về đề thi, quy trình thi, thể thức chấm điểm, cách công bố kết quả… Các câu hỏi trong một đề thi là các câu đã được thử nghiệm, phân tích cân nhắc trau chuốt và định cỡ ( xác định độ khó, độ phân biệt, độ tin cậy và độ giá trị của cả bài). Để đạt được một kỳ thi hay bài kiểm tra, theo chúng tôi có thể tiến hành theo các bước sau đây: *Xác định môn thi và nội dung tổng quát với từng môn. Đồng thời định ra yêu cầu về các mức kỹ năng: nhớ, hiểu, biết vận dụng, phân tích, tổng hợp, đánh giá…Để thực hiện khâu này thường người ta lập một ma trận 2 chiều: các dòng phân theo các nội dung chính, các cột phân theo các mức kỹ năng tương ứng trong mỗi ô ghi số câu hỏi cần thiết của phần nội dung và mức kỹ năng đó. *Trao đổi trong tổ chuyên môn, phát hiện và sửa chữa những câu sai mà bản thân người ra đề không cảm thấy. *Biên tập và đưa các câu trắc nghiệm vào ngân hàng câu hỏi lưu trong máy tính phụ trách biên tập phải là người am hiểu cả về chuyên môn lẫn kỹ thuật viết trắc nghiệm. *Lập đề thi và tổ chức thi thử trên một số nhóm thí sinh. *Chấm thi và phân tích thống kê kết quả thi thử từ đó xác định được các đặc trưng của mỗi câu trắc nghiệm như độ khó, độ phân biệt…qua đó có thể xác định được độ tin cậy của bài trắc nghiệm, phân loại chất lượng các câu trắc nghiệm. *Ra đề thi chính thức căn cứ vào dàn bài (phân bố câu theo nội dung và mức độ kỹ năng tương ứng vơí bản đặc trưng hai chiều). Từ một đề thi gốc, nhờ phần mềm tin học có thể tạo ra các đề thi tương ứng có cùng nội dung nhưng khác nhau về hình thức bằng cách đảo lộn thứ tự các câu hỏi và đảo các phương án trả lời A,B.C,D… *In và tổ chức thi: đề thi được in sẵn, mỗi thí sinh một đề riêng *Chấm và phân tích các kết quả thi. *Công bố kết quả Ưu điểm lớn của các kỳ thi đại trà bằng trắc nghiệm khách quan là: Nhờ những thông tin thu được qua việc phân tích thống kê toàn bộ bài làm của thí sinh qua các kỳ thi là những số liệu rất quý báu để đánh giá định lượng về tình hình giáo dục của từng khu vực, từng cộng đồng, từng nhóm thí sinh và đánh giá xu thế phát triển chất lượng giáo dục theo thời gian. CHƯƠNG III: PHÂN TÍCH KẾT QUẢ NGHIÊN CỨU Ở chương I và chương II chúng tôi đã giới thiệu những kiến thức cơ bản để xây dựng một đề thi hay đề kiểm tra bằng các cầu hỏi trăc nghiệm khách quan và lý thuyết về các tài liệu đặc trưng để đánh giá đề thi trắc nghiệm khách quan chúng tôi đã xây dựng để kiểm tra bằng phương pháp trắc nghiệm và đã tiến hành thử nghiệm cho kiểm tra một tiết với học sinh lớp 10. Sau đó đã nhập các đáp án trả lời của học sinh xử lý số liệu trên chương trình Quest. Chúng tôi xin giới thiệu sơ lược về quá trình làm thí nghiệm của mình và kết quả có 4 phương án trả lời: ABCD. Trong đó, có một phương án trả lời trả lời đúng sau khi phân tích được sau đây. III.1. Các bước tiến hành thí nghiệm 1. Xây dựng bộ các câu hỏi dạng trắc nghiệm, mỗi câu hỏi có 4 phương án lựa chọn 2. Xây dựng một đề thi gồm 30 câu hỏi trắc nghiệm lấy từ trong "ngân hàng" câu hỏi 3. Tham khảo về nội dung các câu hỏi với những người cùng chuyên môn, có chỉnh sửa, bổ sung và thay thế những câu chưa đạt yêu cầu. 4. Hình thành một đề gốc sau đó bảo vị trí các câu và vị trí các đáp án trả lời các câu hỏi nhờ phần mềm tin học. 5. In và cho kiểm tra thử trên thực tế khi kiểm tra chúng tôi đã tạo được tâm lý vững chắc cho học sinh để mọi thí sinh đều coi đây là trắc nghiệm thật lấy điểm 1 tiết để học sinh có tinh thần làm nghiêm túc, hết mình để phép thử đạt yêu cầu. 6. Cuối cùng, nhập số liệu xử lý kết quả làm bài của học sinh bằng phần mềm tin học III.2. Phân tích kết quả thực tế III. 2.1. Kết quả chung - Số lượng câu trong một đề thi: 30 câu (30items) - Số thí sinh làm trắc nghiệm: 100 thí sinh (100Cases) - Mỗi câu hỏi nhất. - Đáp án của đề gốc: CCDCCCDBAACCCACACAACCADCADACCA 1. Summary of item Estimates (Tóm lược các năng lực của câu trắc nghiệm ) Mean: .00 SD: 1.01 SD (adjusted): .98 Reliability of estimate: .94 (độ tin cậy của bài trắc nghiệm) Giải thích: Mean: .00 nghĩa là số trung bình là 0.00. SD: 1.01 nghĩa là độ lệch chuẩn so với năng lực. Kết quả xấp xỉ bằng một là tương đối tốt. Độ ổn định của bài trắc nghiệm là 0,94 là một kết quả tương đối tốt và hoàn toàn chấp nhận được. 2. Infit Mean Square Mean: 1.00 SD: .09 Out fit Mean Square Mean: 1.01 SD: .18 3. O items with zero scores and O items with perfect scores: Nghĩa là: không có một câu nào bỏ trống và không có một câu nào thí sinh trả lời đúng hoàn toàn. III.2.2. Phân tích câu trắc nghiệm Để đánh giá chất lượng của bài trắc nghiệm, chúng ta sẽ đánh giá từng câu hỏi một. Mỗi một câu hỏi lại được đánh giá qua các tiêu chí như: độ khó, độ phân biệt, phương án đúng và phương án nhiều của câu hỏi ấy. Sau đây chúng tôi phân tích hai câu trắc nghiệm để minh hoạ: Ví dụ 1: Item 1 (câu số 1) Nội dung câu hỏi: Cho 8, 7 gam MnO2 tác dụng với dung dịch HCl dư thì thể tích khí Cl2 (đktc) thu được sẽ là: A. 2,24 (l) C. 4,48 (l) B. 11,2 (l) D. 22,4 (l) Kết quả phân tích câu 1: Item 1: item 1 (key = C) Categories Count Percent (%) Pt-Biserial P- Value A 11 11,1 -.25 .007 B 12 12,1 - .24 .009 C* 59 59,6 .35 .000 D 17 17,2 -.05 .322 Missing 1 Phân tích: đán án đúng của câu 1 là phương án C trong 4 lựa chọn A, B, C, D. Cout là số thì sinh tham gia trả lời các phương án. Thấy ngay ở phương án A có 11 thí sinh lựa chọn, B có 12, C có 59, D có 17 người lựa chọn, có 1 người không làm câu này (missing). Percent (%) là số phần trăm thí sinh tham gia trả lời các phương án ở phương án C (phương án đúng) có 59,6% thí sinh lựa chọn. Pt - Biserial là tương quan điểm nhị phân hay độ phân biệt của câu hỏi. Với phương án C độ phân biệt là dương (0,35 > 0,2) tương đối lớn còn các phương án nhiễu đều có độ phân biệt âm nên đây có thể nói là một câu hỏi tương đối tốt Ví dụ 2: Item 18 (câu 18) A. Hợp chất với kim loại hoặc với Hiđrô chúng luôn có số ôxi hoá là -1. B. Có số Ôxi hoá duy nhất là + 7 C. Có số Ôxihoa duy nhất là + 1 D. Cả A, B, C đều sai Kết quả câu 18: Item 18: item 18 (key = A) Categories Count Percent (%) Pt-Biserial A* 29 30,9 11 B 5 5,3 -.20 C* 8 8.5 - .18 D 52 55,3 .0,8 Missing 6 Nghĩa là với câu 18 ta thấy số thí sinh lựa chọn phương án đúng là 29 (chiếm 30,9%) nhưng lại chọn phương án nhiễu D là 52 học sinh (55,35) lớn hơn rất nhiều so với phương án đúng. Đối với câu hỏi này phải chăng phương án A chưa phải là phương án đúng nhất nhưng ta đã nhằm gán cho nó là phương án đúng phải chăng phương án D mới là phương án đúng 3 có hai khả năng làm cho học sinh lựa chọn phương án nhiễu D nhiều hơn hẳn so với phương án đúng là thứ nhất do trong quá trình giảng dạy đã tạo nên sự nhầm lẫn nào chăng, thứ hai là do học sinh không hiểu rõ yêu cầu của câu hỏi gây ra nhầm lẫn điều này cần xem lại cách diễn đạt của câu trắc nghiệm. Như vậy đây là một câu không có độ phân biệt thấp (0,11< 0,2) nên cần điều chỉnh phương án nhiễu D hay thay bằng một câu khác III.3. Xây dựng mô hình Rasch trên số liệu thực III.3.1. Sự phù hợp của các câu hỏi Run One: Hoa hoc 10 -------------------------------------------------------------------------- Item Fit 14/ 5/2004 20:29 all on hoa10 (N = 100 L = 30) -------------------------------------------------------------------------- INFIT MNSQ .63 .71 .83 1.00 1.20 1.40 1.60 --------------+---------+---------+---------+---------+---------+--------- 1 item 1 . *| . 2 item 2 . * | . 3 item 3 . | * . 4 item 4 . * | . 5 item 5 . * | . 6 item 6 . * | . 7 item 7 . |* . 8 item 8 . | * . 9 item 9 . *| . 10 item 10 . * . 11 item 11 . * . 12 item 12 . * | . 13 item 13 . | * . 14 item 14 . * | . 15 item 15 . * | . 16 item 16 . | * . 17 item 17 . * | . 18 item 18 . | * . 19 item 19 . |* . 20 item 20 . *| . 21 item 21 . | * . 22 item 22 . * . 23 item 23 . * | . 24 item 24 . |* . 25 item 25 . * | . 26 item 26 . | * . 27 item 27 . * | . 28 item 28 . |* . 29 item 29 . | * . 30 item 30 . * | . Hình 1 Qua hình 1 ta thấy cả 30 câu hỏi trong bài trắc nghiệm thử mà chúng ta đã làm thí nghiệm đều hợp lý, nằm trong ngưỡng cho phép của mô hình Rasch III.3.2. Sự phù hợp của các thí sinh (Hình 2): Run One: Hoa hoc 10 ------------------------------------------------------------------------- Case Fit In input Order 14/ 5/2004 20:29 all on hoa10 (N = 100 L = 30) -------------------------------------------------------------------------- INFIT MNSQ .63 .71 .83 1.00 1.20 1.40 1.60 --------------+---------+---------+---------+---------+---------+-----+--- 1 09 . | * . 2 18 . | * . 3 21 . * | . 4 23 * . | . 5 24 . * | . 6 35 . * | . 7 42 . *| . 8 45 . *| . 9 47 . | * . 10 55 . | * . 11 59 . | * . 12 65 . * | . 13 66 . | * . 14 74 . | * . 15 78 . * | . 16 79 . * | . 17 80 . * | . 18 84 . * | . 19 26 . * | . 20 98 . | * . 21 14 . * . 22 17 . * | . 23 22 * | . 24 28 . | * . 25 30 . | * . 26 34 . | * . 27 37 . | *. 28 50 . * | . 29 51 . * | . 30 54 . | .* 31 56 . | * . 32 57 . | . * 33 64 . | * . 34 69 . | * . 35 75 . | . * 36 76 . | . * 37 77 . | * . 38 81 . | * . 39 90 . | . * 40 99 . * . 41 02 . * | . 42 10 . * | . 43 12 * | . 44 16 . * | . 45 19 . * | . 46 20 . * | . 47 25 . * | . 48 31 . * | . 49 36 . | * . 50 41 . | * . Qua hình 2 đa số thí sinh đều nằm trong ngưỡng cho phép chỉ có một số trường hợp vựot khỏi giới hạn. Như vậy số liệu thực tế tương đối phù hợp với mô hình Rasch . III.3.3. Phân bố khả năng trả lời đúng của thí sinh và độ đó của các câu hỏi Run One: Hoa hoc 10 -------------------------------------------------------------------------------- Item Estimates (Thresholds) 14/ 5/2004 20:29 all on hoa10 (N = 100 L = 30) -------------------------------------------------------------------------------- 4.0 | | X | | | 3.0 X | | | 2.0 | 25 | | XXX | X | | 23 X | X | 13 20 27 1.0 X | 8 18 XXXXXXX | XXX | XXXXXX | 29 XXX | 3 9 19 26 XXXXXXXXXX | 5 16 XXXXXXXXXXX | 2 10 15 .0 XXXXXXX | XXXXXXXX | XXXXXX | 12 24 XXXXXX | 1 30 XXXXXXXXX | 22 28 XXXX | 21 X | XX | -1.0 XX | X | 11 | 4 | 6 XXX | 14 | 17 | X | -2.0 | | X | | -3.0 | -------------------------------------------------------------------------------- Each X represents 1 students Hình 3 Mỗi dấu X đại diện cho một thí sinh tham gia làm trắc nghiệm. Qua hình ta thấy lượng thí sinh tập trung ở mức độ năng lực trung bình tại O là lớn nhất, chiếm số đông trong vùng từ - 1,0 đến + 1,0, số lượng câu khó ở mức độ trung bình tương đối nhiều. Câu 25 là câu khó nhất vì có ít thí sinh làm đúng nhất và câu 7 là câu dễ nhất vì hầu như ai cũng trả lời đúng. Do vậy, mô hình chung cho thấy kết quả thu được là tương đối tốt. III.3.4. Phân tích kết quả của từng câu hỏi một Bảng 1 Run One: Hoa hoc 10 -------------------------------------------------------------------------- Item Estimates (Thresholds) In input Order 14/ 5/2004 20:29 all on hoa10 (N = 100 L = 30) ------------------------------------------------------------------------- ITEM NAME |SCORE MAXSCR| THRSH | INFT OUTFT INFT OUTFT | | 1 | MNSQ MNSQ t t ------------------------------------------------------------------------- 1 item 1 | 59 99 | -.34 | .99 1.24 -.2 1.4 | | .22| | | | 2 item 2 | 42 87 | .15 | .92 .87 -1.3 -.8 | | .23| | | | 3 item 3 | 37 91 | .46 | 1.22 1.20 2.8 1.2 | | .23| | | | 4 item 4 | 77 99 | -1.27 | .85 .71 -1.1 -1.2 | | .25| | | | 5 item 5 | 39 90 | .35 | .84 .78 -2.5 -1.5 | | .23| | | | 6 item 6 | 76 96 | -1.35 | .95 1.20 -.3 .8 | | .26| | | | 7 item 7 | 88 95 | -2.61 | 1.01 .87 .1 -.1 | | .40| | | | 8 item 8 | 27 92 | .99 | 1.10 1.39 .9 1.9 | | .24| | | | 9 item 9 | 42 98 | .40 | .99 .97 -.1 -.1 | | .22| | | | 10 item 10 | 42 91 | .25 | 1.00 .95 .0 -.3 | | .22| | | | 11 item 11 | 73 99 | -1.04 | 1.00 .89 .0 -.4 | | .24| | | | 12 item 12 | 52 94 | -.18 | .89 .85 -1.7 -1.0 | | .22| | | | 13 item 13 | 24 86 | 1.04 | 1.07 1.15 .6 .8 | | .26| | | | 14 item 14 | 81 99 | -1.52 | .96 .98 -.2 .0 | | .27| | | | 15 item 15 | 43 90 | .14 | .94 .90 -1.0 -.6 | | .22| | | | 16 item 16 | 40 91 | .32 | 1.07 1.12 1.0 .8 | | .22| | | | 17 item 17 | 82 100 | -1.55 | .95 1.05 -.2 .3 | | .27| | | | 18 item 18 | 29 94 | .96 | 1.09 1.28 .9 1.5 | | .24| | | | ========================================================================== *****Output Continues**** Run One: Hoa hoc 10 -------------------------------------------------------------------------- Item Estimates (Thresholds) In input Order 14/ 5/2004 20:29 all on hoa10 (N = 100 L = 30) -------------------------------------------------------------------------- ITEM NAME |SCORE MAXSCR| THRSH | INFT OUTFT INFT OUTFT | | 1 | MNSQ MNSQ t t -------------------------------------------------------------------------- 19 item 19 | 37 91 | .46 | 1.01 .95 .2 -.2 | | .23| | | | 20 item 20 | 26 91 | 1.05 | .98 1.12 -.2 .7 | | .25| | | | 21 item 21 | 60 93 | -.59 | 1.08 1.07 1.0 .4 | | .23| | | | 22 item 22 | 58 94 | -.47 | 1.00 .95 .0 -.2 | | .22| | | | 23 item 23 | 22 94 | 1.36 | .93 .82 -.4 -.8 | | .26| | | | 24 item 24 | 54 96 | -.22 | 1.01 1.18 .2 1.1 | | .22| | | | 25 item 25 | 13 89 | 1.98 | .88 .69 -.5 -1.0 | | .32| | | | 26 item 26 | 40 97 | .44 | 1.13 1.24 1.8 1.5 | | .22| | | | 27 item 27 | 28 96 | 1.02 | .93 .88 -.6 -.6 | | .24| | | | 28 item 28 | 61 97 | -.50 | 1.02 1.00 .3 .0 | | .22| | | | 29 item 29 | 33 89 | .61 | 1.09 1.05 1.1 .3 | | .23| | | | 30 item 30 | 54 92 | -.36 | .95 .91 -.7 -.5 | | .22| ------------------------------------------------------------------------- Mean | | .00 | 1.00 1.01 .0 .1 SD | | 1.01 | .09 .18 1.0 .9 ========================================================================== Bảng 1 cho thấy các đại lượng đặc trưng có liên quan đến một câu trắc nghiệm bất kỳ: Score là số thí sinh làm đúng, Maxscr là tổng số thí sinh tham gia trả lời câu hỏi, Infit và Outfit nhận các giá trị xấp xỉ 1 là kết quả tốt. III.3.5. Khả năng trả lời của thí sinh đối với các câu hỏi. Xét một ví dụ cụ thể sau: ------------------------------- K I D M A P---------------------------- Candidate: 09 ability: .68 group: all fit: 1.23 scale: all % score: 63.33 ------------Harder Achieved ----------------------Harder Not Achieved ------ | | | | | | | | | | | | | | | | | | | | | | | | 25 | | | | | | | | | | 23(C) .......................................... | | 20 13 8 | | 18(D) 27(C) | | |XXX| 29 | | 9 | | 3(B) 19(D) 26(B) 16 10 5 ........................... 2 | | 15(D) | | | | 12(D) 24 | | 1(D) 30(B) 28 22 | | 21 | | | | | | 11 | | | | 4 | | 6(B) | | 17 14 | | | | 7 | | | | | | | | ------------Easier Achieved ----------------------Easier Not Achieved ------ ========================================================================== ability: là năng lực của thí sinh fit: sự phù hợp với mô hình Rasch . % Score: Phần trăm trả lời đúng số câu của bài trắc nghiệm với thí sinh 09 này, năng lực là 0,69 sự phụ hợp với mô hình Rasch là 1,23, phần trăm số câu làm đúng là 63,33% nghĩa là bài làm của thí sinh tương đối tốt. Các đặc trưng cho sự trả lời của mỗi thí sinh đối với bài trắc nghiệm được tổng kết ở bảng 2 dưới đây. Run One: Hoa hoc 10 ------------------------------------------------------------------------- Case Estimates In input Order 14/5/2004 20:29 all on hoa10 (N = 100 L = 30) -------------------------------------------------------------------------- NAME |SCORE MAXSCR | ESTIMATE ERROR | INFIT OUTFT INFTOUTFT | | | MNSQ MNSQ t t -------------------------------------------------------------------------- 1 09 | 19 30 | .68 .41 | 1.23 1.27 1.42 .84 2 18 | 17 21 | 1.62 .60 | 1.13 .90 .47 .09 3 21 | 18 30 | .51 .41 | .95 .86 -.29 .37 4 23 | 13 29 | -.26 .41 | .72 .65 -1.88 1.28 5 24 | 13 26 | .02 .44 | .81 .73 -1.15 .84 6 35 | 16 30 | .19 .40 | .82 .74 -1.24 .90 7 42 | 10 30 | -.81 .43 | .98 .84 -.02 .38 8 45 | 22 30 | 1.22 .44 | .98 1.23 -.02 .64 9 47 | 15 30 | .03 .40 | 1.24 1.23 1.58 .85 10 55 | 16 29 | .27 .41 | 1.25 1.67 1.62 1.96 11 59 | 16 28 | .35 .42 | 1.03 .94 .27 .07 12 65 | 10 26 | -.56 .44 | .83 .75 -.91 .72 13 66 | 12 27 | -.22 .43 | 1.06 1.02 .43 .16 14 74 | 7 25 | -1.05 .49 | 1.09 1.13 .43 .44 15 78 | 7 30 | -1.41 .47 | .93 1.21 -.18 .60 16 79 | 10 28 | -.71 .44 | .89 .80 -.54 .53 17 80 | 12 30 | -.46 .41 | .97 .88 -.12 .31 18 84 | 13 29 | -.23 .41 | .87 .78 -.76 .73 19 26 | 15 30 | .03 .40 | .95 .90 -.32 .28 20 98 | 28 30 | 3.00 .75 | 1.18 1.91 .48 1.02 21 14 | 20 30 | .85 .42 | 1.01 .90 .11 .17 22 17 | 14 28 | -.03 .42 | .90 .85 -.61 .46 23 22 | 13 30 | -.29 .41 | .77 .69 -1.54 1.11 24 28 | 17 29 | .44 .41 | 1.16 1.19 1.06 .67 25 30 | 16 30 | .19 .40 | 1.09 1.10 .68 .43 26 34 | 12 29 | -.40 .42 | 1.25 1.24 1.43 .83 27 37 | 11 30 | -.63 .42 | 1.27 1.27 1.45 .90 28 50 | 12 30 | -.46 .41 | .93 .91 -.35 .21 29 51 | 16 30 | .19 .40 | .90 .81 -.69 .60 30 54 | 18 30 | .51 .41 | 1.32 1.31 2.00 1.00 31 56 | 10 29 | -.77 .43 | 1.14 1.12 .75 .46 32 57 | 12 30 | -.46 .41 | 1.41 1.41 2.20 1.33 33 64 | 13 20 | .45 .51 | 1.07 .93 .39 .03 34 69 | 16 25 | .59 .46 | 1.12 1.04 .72 .23 35 75 | 10 19 | .22 .50 | 1.64 1.90 3.08 2.26 36 76 | 12 17 | .79 .58 | 1.61 2.13 2.11 1.75 37 77 | 14 30 | -.13 .40 | 1.11 1.06 .75 .31 38 81 | 7 30 | -1.41 .47 | 1.04 1.21 .26 .58 39 90 | 13 29 | -.23 .41 | 1.36 1.54 2.07 1.68 40 99 | 29 30 | 3.76 1.03 | 1.00 .56 .31 .22 41 02 | 20 30 | .85 .42 | .94 .82 -.28 .39 42 10 | 19 30 | .68 .41 | .88 .78 -.74 .60 43 12 | 16 30 | .19 .40 | .77 .69 -1.66 1.11 44 16 | 11 24 | -.38 .45 | .92 .93 -.44 .14 45 19 | 17 30 | .35 .40 | .84 .76 -1.13 .75 46 20 | 17 30 | .35 .40 | .91 .83 -.58 .50 47 25 | 17 30 | .35 .40 | .88 .80 -.84 .61 48 31 | 17 30 | .35 .40 | .85 .84 -1.03 .46 49 36 | 14 30 | -.13 .40 | 1.11 1.11 .72 .48 50 41 | 16 30 | .19 .40 | 1.04 1.00 .34 .09 51 58 | 14 23 | .34 .47 | .96 .86 -.19 .30 52 71 | 16 30 | .19 .40 | .88 .80 -.85 .64 53 72 | 16 30 | .19 .40 | .88 .80 -.83 .64 54 73 | 20 30 | .85 .42 | .85 .75 -.90 .61 55 83 | 12 30 | -.46 .41 | .95 .95 -.24 .07 56 93 | 14 30 | -.13 .40 | .86 .84 -.91 .50 ============================================================================ *****Output Continues**** Run One: Hoa hoc 10 --------------------------------------------------------------------------- Case Estimates In input Order 14/5/2004 20:29 all on hoa10 (N = 100 L = 30) ---------------------------------------------------------------------------- NAME |SCORE MAXSCR | ESTIMATE ERROR | INFIT OUTFT INFT OUTFT | | | MNSQ MNSQ t t ---------------------------------------------------------------------------- 57 95 | 11 30 | -.63 .42 | .97 .93 -.08 .13 58 96 | 13 30 | -.29 .41 | .97 .96 -.12 .06 59 97 | 12 30 | -.46 .41 | .99 .99 .02 .06 60 100 | 4 30 | -2.21 .58 | .96 1.28 .03 .60 61 01 | 24 30 | 1.64 .48 | .97 1.27 -.03 .64 62 04 | 23 30 | 1.42 .46 | 1.05 1.36 .31 .82 63 05 | 14 27 | .12 .43 | .85 .78 -.96 .65 64 15 | 23 29 | 1.56 .49 | 1.11 1.50 .48 .98 65 32 | 15 30 | .03 .40 | .95 .90 -.30 .26 66 33 | 15 30 | .03 .40 | .95 .90 -.28 .25 67 40 | 14 30 | -.13 .40 | .97 .92 -.12 .21 68 43 | 16 30 | .19 .40 | .97 .91 -.18 .21 69 44 | 13 30 | -.29 .41 | .93 .90 -.37 .26 70 48 | 14 30 | -.13 .40 | .93 .89 -.42 .32 71 49 | 13 30 | -.29 .41 | 1.12 1.31 .80 1.09 72 52 | 13 18 | .81 .56 | .81 .66 -.74 .55 73 53 | 8 17 | -.22 .54 | 1.27 1.26 1.22 .77 74 60 | 14 19 | .94 .56 | .80 .60 -.73 .66 75 62 | 13 18 | .74 .56 | .78 .64 -.86 .62 76 63 | 8 14 | .00 .59 | 1.13 1.11 .61 .40 77 67 | 12 30 | -.46 .41 | 1.27 1.43 1.53 1.37 78 70 | 7 10 | .41 .74 | .92 .75 -.12 .29 79 86 | 14 30 | -.13 .40 | 1.03 1.24 .23 .89 80 88 | 14 30 | -.13 .40 | 1.22 1.48 1.39 1.57 81 03 | 21 30 | 1.03 .43 | .97 1.06 -.13 .27 82 06 | 12 30 | -.46 .41 | .80 .72 -1.19 .96 83 07 | 15 30 | .03 .40 | 1.01 .98 .15 .01 84 08 | 20 30 | .85 .42 | .78 .65 -1.34 .97 85 11 | 18 30 | .51 .41 | .85 .77 -1.04 .67 86 13 | 16 30 | .19 .40 | .75 .76 -1.84 .80 87 27 | 20 30 | .85 .42 | .78 .65 -1.35 .97 88 29 | 16 29 | .30 .41 | .75 .75 -1.79 .80 89 38 | 13 28 | -.16 .42 | .74 .67 -1.69 1.14 90 39 | 17 30 | .35 .40 | .93 .96 -.44 .04 91 46 | 18 30 | .51 .41 | .92 .87 -.48 .34 92 61 | 12 30 | -.46 .41 | 1.07 1.02 .44 .17 93 68 | 11 30 | -.63 .42 | .83 .79 -.96 .63 94 82 | 9 30 | -1.00 .44 | 1.09 1.06 .46 .27 95 85 | 18 30 | .51 .41 | .93 .87 -.42 .93 97 89 | 7 30 | -1.41 .47 | 1.09 1.19 .42 .55 98 91 | 13 23 | .31 .45 | 1.16 1.20 1.03 .73 99 92 | 9 30 | -1.00 .44 | 1.06 1.07 .35 .30 100 94 | 5 30 | -1.91 .53 | 1.45 1.78 1.31 1.29 ---------------------------------------------------------------------------- Mean | | .10 | 1.01 1.01 .00 .05 SD | | .84 | .18 .30 1.00 .76 ============================================================================ Bảng 2 Trong đó Esimate là năng lực của thí sinh, error là độ khó của bài trắc nghiệm CHƯƠNG IV: KẾT LUẬN IV. Khoa học đo lường và đánh giá trong giáo dục trên thế giới và nước ta. IV.1. Trên thế giới, khoa học đo lường đã có một lịch sử ra đời (khoảng một thế kỷ) và phát triển hết sức mạnh mẽ. ở Châu Âu và đặc biệt là Mỹ, lĩnh vực khoa học này phát triển mạnh từ thời kỳ trước và sau chiến tranh thế giới thứ 2. Việc chấm bài trắc nghiệm bằng máy của IBM năm 1935, việc thành lập NCME vào thập niên 1950 và ra đời ETS (dịch vụ trắc nghiệm giáo dục) năm 1947 ngành công nghiệp trắc nghiệm đã hình thành ở Mỹ. Từ đó đến nay khoa học về đo lường tâm lý và giáo dục đã phát triển liên tục tự phê bình chỉ trích và tự điều chỉnh phát triển ngày một mạnh mẽ hơn thường xuyên hơn. Tương ứng với ngành công nghiệp trắc nghiệm đồ sộ và sự phát triển như vũ bão của ngành công nghệ thông tin, lý thuyết về đo lường trong tâm lý trong giáo dục cũng phát triển rất nhanh. Đặc biệt là với sự ra đời của thuyết ứng đáp câu hỏi đã đạt được những thành tựu quan trọng nâng cao độ chính xác của phương phaps trắc nhiệm .Ngoài ra ,trên những thành tựu của IRT và ngôn ngữ học máy tính công nghệ E- RATE chấm tự động các bài luận tiếng anh nhờ máy tính của ETS đã được triển khai nhờ mạng Internet trong năm vùa qua. Trong các kỳ thi tuyển sinh đại học mà dựa vào kết quả của các kỳ thi do các công ty ngoài Nhà nước tổ chức để xét tuyển. Có hai dịch vụ hỗ trợ TTĐH ở Hoa Kỳ là SAT (Scholastic Achievement Test) do công ty ETS (Educational Testing Services) tổ chức, và ACT (American College Test) do chương trình ACT American College Testing Program triển khai. Cả SAT và ACT thường tổ chức thi mỗi năm 4 lần, cho các học sinh ở những năm cuối bậc phổ thông trung học. Hiện naz hàng năm có khoảng 1,8 triệu thí sinh thi SAT và 1,6 triệu thí sinh thi ACT. IV.1.2. Ở Việt Nam Chúng ta đã tổ chức một mùa tuyển sinh đại học bằng trắc nghiệm khách quan và đạt được kết quả ngoài sức tưởng tượng. Ban đầu khi chúng ta tiến hành kỳ thi thửa đầu tiên tại Đà Nẵng tưởng chừng như học sinh không chấp nhận và gây nhiều dư luận cho xã hội, nhưng khi tiến hành chúng ta làm song song cả đề thi tiểu luận và đề thi trắc nghiệm cho thí sinh lựa chọn. Kết quả là có 70% số thí sinh tham dự đã chọn đề thi bằng trắc nghiệm khách quan là con số ngoài dự đoán và mong đợi của những nhà tổ chức. Lý do mà các thí sinh lựa chọn đề thi trắc nghiệm là việc chấm điểm bằng máy tính tạo sự tin tưởng và độ chính xác điểm vì khi tự luận đôi khi điểm chấm phụ thuộc vào rất nhiều các yếu tố chủ quan khác nhau. Rõ ràng tuy mới được đưa vào thử nghiệm đầu tiên nhưng trắc nghiệm khách quan đã thể hiện được ưu thế vượt trội của mình so với sử dụng phương pháp tự luận truyền thống. Và kết quả chúng ta đã lựa chọn tương đối khách quan và chính xác những người có khả năng vào đại học, trường hợp may rủi xảy ra là rất ít. Từ mùa thi tại Đà Nẵng 1996 đó tới nay chúng ta đã mở rộng ra tại nhiều tỉnh và đã áp dụng thi tuyển bằng trắc nghiệm cả trong Nam và ngoài Bắc. Đến nay phương pháp trắc nghiệm được dùng ngay trong kỳ kiểm tra học kỳ về một số môi thi học kỳ trong đại học. IV.3. Giải pháp về phướng phát triển khoa học đo lường trong giáo dục ở nước ta Chúng tôi xin đề xuất những phương hướng sau: - Tất cả giáo chức của các trường đại học cần được bồi dưỡng những hiểu biết sơ đẳng về khoa học này. - Mọi trường đại học đều nên tổ chức bộ phận nghiên cứu triển khai để áp dụng khoa học về đo lường trong giáo dục vào các hoạt động kiểm tra đánh giá kết quả học tập của sinh viên, hoạt động giảng dạy và phục vụ của giáo chức và viên chức. - Các trường đại học và viện nghiên cứu chuyên về giáo dục cần đẩy mạnh việc nghiên cứu về khoa học đo lường trong giáo dục để thấu hiểu nó, từ đó hướng dẫn áp dụng nó trong toàn hệ thống giáo dục từ mâu giáo đến sau đại học. - Tiếp đến, cần trước khai áp dụng khoa học đo lường trong giáo dục ra mọi hoạt động xã hội bên ngoài hệ thống giáo dục, vì rằng trong lương lai, với sụ phát triển của kinh tế xã hội, tất yếu việc áp dụng khoa học đó sẽ trở thành một ngành công nghiệp lớn. TÀI LIỆU THAM KHẢO 1. Lâm Quang Thiệp 2000 Đo lường và đánh giá chất lượng giáo dục 2. Lâm Quang Thiệp 1994. Những cơ sở của kỹ thuật trắc nghiệm. Bộ giáo dục và đào tạo vụ đại học 3.Dương Thiệu Tống: Trắc nghiệm và đo lường thành quả học tập (Tập 1) Trường ĐHTH Thành Phố Hồ Chí Minh xuất bản năm 1995 4. Dương Thiệu Tống: Trắc nghiệm và đo lường thành quả học tập (Tập 2) Trường ĐHTH Thành Phố Hồ Chí Minh xuất bản năm 1995 5. Cơ sở của Kỹ thuật trắc nghiệm (Trích các bài giảng của P.Griffin- Vụ Đại học, 19994) 6. Nguyễn Phụng Hoàng và Võ Ngọc Lan: Phương pháp trắc nghiệm trong kiểm tra và đánh giá thành quả học tập NXBGD.1996 7. Trần Trọng Thuỷ, Khoa học Chẩn đoán Tâm lý,NXBGD,Hà Nội, 1994. 8. Thorndike,E.L.I trodution to the Thẻoy of Meantal and Social Maesanure . New Yhork:Teacher College,Clumbia University,1904.

Các file đính kèm theo tài liệu này:

  • pdfLuận Văn- Tổng quan về phương pháp trắc nghiệm khách quan.pdf