Luận văn Xây dựng bộ câu trắc nghiệm khách quan về môn hoá học lớp 11

Nhìn vào bảng phân bố giữa năng lưc- câu hỏi (Item estimates) ta thấy mức năng lực của TS chưa được cao (r = 0.27), và sự phân bố câu hỏi là tốt (bài TN có tính ổn định cao r =0.96). Độ ổn định về mức năng lực của học sinh chưa được cao vì TS ở lớp này có học lực không đồng đều giữa các lớp (lớp 11H2 học lực rất kém so với 11E1, 11G1), HS còn bỡ ngỡ với hình thức kiểm tra này.

pdf60 trang | Chia sẻ: lylyngoc | Lượt xem: 2839 | Lượt tải: 4download
Bạn đang xem trước 20 trang tài liệu Luận văn Xây dựng bộ câu trắc nghiệm khách quan về môn hoá học lớp 11, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
ng số phép thử được gọi là tần suất. 1.2.3.2.2. Luật số lớn là gì? Khi số lượng phép thử tăng lên đủ lớn, giá trị tần suất sẽ tiến dần đến giá trị xác suất. Đây là nội dung của luật số lớn, định luật này làm cơ sở quan trọng cho mọi nghiên cứu thống kê. Ngoài ra đây còn gọi là luật về giá trị trung bình. 1.2.3.2.3. Tổng thể và mẫu Tổng thể là một tập hợp rất lớn các đối tượng dùng để xem xét các số liệu hoặc tính chất nào đó. VD: xem xét kết qủa TN trong một tổng thể gồm toàn bộ thí sinh tham dự kì thi cuối năm lớp 10. Do việc thực hiện nghiên cứu trên một tổng thể với số lượng rất lớn đối tượng thường gây nhiều khó khăn và tốn kém, nên người ta thường triển khai một số nghiên cứu trên một tập hợp con với số lượng ít hơn của tổng thể. Tập hợp các con số đó gọi là mẫu nghiên cứu. Người ta phải chọn những mẫu nghiên cứu có tính đại diện cho tổng thể để việc nghiên cứu thu được các kết quả thống kê gần với kết quả thu được từ tổng thể. 1.2.3.2.4. Phân bố tần suất Đường cong mô tả sự xuất hiện của một đăc trưng nào đó mà ta thực hiện phép đo trên một mẫu nghiên cứu được gọi là đường cong phân bố tần suất. VD: Khi tiến hành điều tra số học sinh phổ thông trung học của các tỉnh thuộc khu vực miền Bắc. Ta mô tả kết quả đo được trên một đồ thị, trục hoành biểu diễn số học sinh trong một trường (theo khoảng), trục tung biểu diễn tần suất xuất hiện của số học sinh trong khoảng nào đó. Nếu chúng ta tiến hành điều tra trên phạm vi cả nước thì ta sẽ được một đường cong có dạng giống như trên nhưng mịn và đều hơn. Khi phân bố tần suất đối với một tổng thể được gọi là phân bố xác suất. Dạng phân bố kiểu hình chuông đối xứng như trên hình vẽ được gọi là phân bố chuẩn. Các đại lượng đặc trưng để phân bố tần suất là: Giá trị trung bình của các giá trị đo được trên mẫu (gồm n cá thể). x = n xi giá trị trung bình xác định vị trí của một phân bố tần suất trên một thang đo nào đó. Độ lệch tiêu chuẩn của các giá trị đo được so với giá trị trung bình. S = )1( )( 2   n xx Khi n đủ lớn thì giá trị của S tính theo công thức trên gần với căn bậc hai của trung bình các bình phương độ lệch. Độ lệch tiêu chuẩn xác định mức độ phân tán của các số đo của đại lượng: khi độ lệch tiêu chuẩn bé đường phân bố sẽ có dạng hẹp và nhọn, còn khi độ lệch tiêu chuẩn lớn thì đường phân bố sẽ có dạng doãn và tù. Khi một mẫu không đồng nhất ta sẽ thu được đường cong phân bố lệch (lệch âm hay lệch dương). Từ đó ta có thể phát biểu luật số lớn theo cách khác: Khi kích thước của mẫu chọn càng lớn, giá trị trung bình của các đại lượng đo trên mẫu sẽ tiến gần đến giá trị trung bình đo trên tổng thể. Định lí giới hạn trung tâm Nếu một đại lượng nào đó trong một tổng thể tuân theo một phân bố bất kì, từ tổng thể đó thì khi ta chọn nhiều mẫu khác nhau và xác định một đặc trưng nào đó của mẫu, chẳng hạn là giá trị trung bình thì định lí giới hạn trung tâm có nội dung như sau: nếu kích thước của mẫu chọn đủ lớn, phân bố của giá trị trung bình của mẫu theo các mẫu được chọn là gần với phân bố chuẩn, dù rằng phân bố của tổng thể theo quy luật nào đi nữa. Hệ số tương quan Biến là một đại lượng đặc trưng nào đó nhận các giá trị khác nhau từ một cá thể này đến một cá thể khác trong một tổng thể thống kê. Số liệu thống kê thường xem xét mối quan hệ giữa các biến khác nhau. Trong trường hợp có hai biến, mối quan hệ giữa chúng thường được biểu diễn bằng hệ số tương quan. Hệ số tương quan R giữa hai biến x và y là: R = yx xy SS S . Trong đó: xS , yS là các độ lệch tiêu chuẩn của biến x và biến y, còn xyS được gọi là hiệp phương sai giữa x và y được tính theo công thức: S xy = 1 ))((   n yyxx Từ đó có thể lập được biểu thức để tính hệ số tương quan Pearson: R =           2222 )()( ).( yynxxn yxxyn Hệ số tương quan là đại lượng để đo mối quan hệ tuyến tính giữa hai biến ngẫu nhiên. Nó có giá trị phân bố trong khoảng từ -1 đến 1. R < 0 khi các giá trị cao (thấp,trung bình) của biến x tương ứng có liên hệ với các giá trị cao (thấp, trung bình) của biến y. R > 0 khi các giá trị cao (trung bình, thấp) của biến x có liên hệ với các giá trị thấp (trung bình, cao) của biến y. R = 0 khi quan hệ của các giá trị của biến x và các giá trị của biến y không tuân theo một quy luật rõ ràng nào. 1.2.3.3. Đánh giá các câu TN Phân tích các câu trả lời của TS trong một bài TN là việc làm rất cần thiết và rất hữu ích cho người soạn TN. Nó giúp cho người soạn thảo: 1) Biết được những câu nào là quá khó, câu nào là quá dễ. 2) Lựa ra các câu có độ phân cách cao, nghĩa là phân biệt được giữa HS giỏi và HS kém. 3) Biết được lí do vì sao câu TN không đạt được hiệu quả mong muốn và cần phải sửa đổi như thế nào cho tốt hơn. Một bài TN, sau khi đã được sửa đổi trên căn bản của sự phân tích như nói trên, có khả năng đạt được tính tin cậy cao hơn là một bài TN có cùng số câu hỏi nhưng chưa được thử nghiệm và phân tích. Chúng ta sẽ phân tích câu TN ở hai tiêu chuẩn đó là: Độ khó và độ phân biệt. 1.2. 3.3.1 Độ khó Khi soạn thảo xong một câu hoặc một bài TN người soạn thảo chỉ có thể ước lượng độ khó hoặc độ phân biệt của nó bằng cảm tính. Độ lớn của các đại lượng đó chỉ có thể tính được cụ thể bằng phương pháp thống kê sau lần TN thử, dựa vào kết quả thu được từ các câu và các bài TN của TS. Độ khó của câu TN được định nghĩa bằng tỉ lệ của tổng số người trả lời đúng câu TN so với tổng số người làm câu TN ấy: Tổng số TS trả lời đúng câu hỏi Độ khó p của câu thứ i= Tổng số TS trả lời câu hỏi Việc sử dụng trị số p để đo độ khó là rất có ý nghĩa. Nó thay thế cách xác định độ khó theo các đặc tính nội tại của câu TN bằng cách đếm số người làm đúng câu hỏi. Nó cũng cho thấy rõ mức độ khó dễ phụ thuộc vào cả câu hỏi, lẫn người làm câu hỏi. Ngoài ra cách định nghĩa này cũng cho ta một đại lượng chung phản ánh độ khó dễ của các bài TN thuộc các lĩnh vực khoa học khác nhau. Các câu hỏi của một bài TN thường phải có các độ khó khác nhau. Theo công thức tính độ khó như trên, rõ ràng gía trị p càng bé câu hỏi càng khó và ngược lại. Vậy p có giá trị như thế nào thì câu hỏi có thể được xem là có độ khó trung bình? Muốn xác định được khái niệm này cần phải lưu ý đến các xác suất làm đúng câu hỏi bằng cách chọn hú hoạ Một bài TN được gọi là tốt không phải là bài TN gồm toàn những câu khó hay toàn những câu dễ cả, mà là bài TN gồm những câu có mức độ khó trung bình hay mức độ khó vừa phải. Nhưng thế nào là độ khó vừa phải? Thông thường ta cho rằng một câu TN có độ khó vừa phải là câu có chỉ số khó là 50%, nghĩa là 50% học sinh làm đúng câu hỏi ấy và 50% làm sai. Nhưng muốn cho công bằng và đúng đắn hơn, ta cần phải phân biệt loại câu TN để xác định thế nào là độ khó vừa phải. Với một câu TN thuộc loại đúng-sai thì độ khó 50% chưa hẳn là độ khó vừa phải vì như ta đã biết, câu hỏi thuộc loại này chỉ gồm có hai lựa chọn, do đó sự may rủi làm đúng câu hỏi ấy là 50%. Vậy ta không thể cho 50% là chỉ số khó thíchs hợp cho loại này. Vì lí do ấy, ta cần phải lưu ý đến một yếu tố khác. Đó là tỉ lệ may rủi kì vọng. Tỉ lệ này thay đổi tuỳ theo số câu lựa chọn trong mỗi câu hỏi. Nếu câu hỏi có hai lựa chọn thì tỉ lệ kì vọng là 50%. Như vậy, độ khó vừa phải của câu hai lựa chọn này phải là trung điểm giữa tỉ lệ may rủi kì vọng và100%, nghĩa là: (100 + 50)/ 2 = 75%. Nói cách khác, câu TN loại đúng-sai có độ khó vừa phải nếu 75% TS trả lời đúng câu hỏi ấy. Theo cách tính này thì tỉ lệ kì vọng của loại câu TN có 5 lựa chọn là 100/5, tức là 20%. Vậy độ khó vừa phải của câu TN có 5 lựa chọn là (100 + 20)/ 2 = 60%. Như vậy độ khó trung bình của một bài TN n phương án chọn là: (100%+1/n)/2. Còn đối với các câu TL tự do, như loại điền khuyết, thì độ khó trung bình là 50%. Khi chọn các câu TN theo độ khó người ta thường phải loại các câu quá khó (không ai làm đúng) hoặc quá dễ (ai cũng làm đúng). Một bài TN tốt khi có nhiều câu ở độ khó trung bình. Độ khó của bài TN được xét bằng cách đối chiếu điểm số trung bình của bài và điểm trung bình lí tưởng của nó. Điểm trung bình lí tưởng của bài TN là điểm số nằm giữa điểm tối đa người làm đúng toàn bộ nhận được và điểm mà người không biết gì có thể đạt được nhờ chọn hú hoạ. Giả sử chúng ta chỉ xét đến điểm thô. VD: một bài TN 50 câu, mỗi câu có 5 phương án TL. Điểm thô tối đa là 50, điểm có thể đạt được do chọn hú hoạ là 0,2 x 50 = 10, điểm trung bình lí tưởng là (50 + 10)/ 2 = 30. Nếu điểm trung bình quan sát được trên hay dưới 30 quá xa thì bài TN ấy sẽ là quá khó hay quá dễ. Nói chung, nếu điểm trung bình lí tưởng nằm ở khoảng giữa phân bố các điểm quan sát được thì bài TN là vừa sức đối với đối tượng TS, còn khi điểm đó nằm ở phía trên hoặc dưới phân bố điểm quan sát được thì bài trắc nghiệm tương ứng là khó hơn hoặc dễ hơn so với đối tượng TS. Thông thường độ khó của một câu hỏi có thể chấp nhận được nằm trong khoảng 0.25 – 0.75; câu có độ lớn hơn 0.75 là quá dễ, có độ nhỏ hơn 0.25 là quá khó. Việc tính độ khó theo cách nêu trên được thực hiện theo lý thuyết đo lường cổ điển. Trong lý thuyết trả lời câu hỏi ( IRT) hiện đại độ khó và năng lực của thí sinh được tính bằng cách ước lượng theo các mô hình toán học xác định. 1.2.3.3.2. Độ phân biệt Trước hết chúng ta làm quen với phương pháp cổ điển đơn giản để tính độ phân biệt. Độ phân biệt của câu trắc nghiệm dùng để đo lường mức độ khác nhau giữa phản ứng của thí sinh giỏi và thí sinh kém lên câu hỏi đó. Độ phân biệt của một câu trắc nghiệm hoặc một bài trắc nghiệm liên quan đến độ khó. Thật vậy, nếu một bài trắc nghiệm dễ đến mức mọi thí sinh đều làm tốt, các điểm số đạt được chụm ở phần điểm cao, thì độ phân biệt của nó rất kém, mọi thí sinh đều có thể phản ứng như nhau đối với bài trắc nghiệm đó. Cũng vậy, nếu một bài trắc nghiệm khó đến mức mọi thí sinh đều không làm được, các điểm số đạt được chụm ở phần điểm thấp, thì độ phân biệt của nó cũng rất kém. Từ các trường hợp giới hạn nói trên có thể suy ra rằng muốn có độ phân biệt tốt thì bài trắc nghiệm phải có độ khó ở mức trung bình. Khi ấy điểm số thu được của nhóm thí sinh sẽ có phổ trải rộng. Cách tính độ phân biệt Dựa vào tổng điểm thô của từng thí sinh người ta tách từ đối tượng thí sinh ra một nhóm giỏi bao gồm 27% thí sinh đạt điểm cao từ trên xuống và nhóm kém bao gồm 27% thí sinh đạt điểm kém từ dưới lên. Gọi C là số thí sinh làm đúng câu hỏi thuộc nhóm giỏi, T là số thí sinh làm đúng câu hỏi thuộc nhóm kém, S là số lượng thí sinh của 27% tổng số, ta có biểu thức tính độ phân biệt D của câu hỏi như sau: D = (C – T)/S Người ta có thể tính theo phân biệt của một câu trắc nghiệm theo một định nghĩa khái quát hơn: đó là hệ số tương quan giữa các điểm của câu trắc nghiệm đó với tổng điểm của toàn bài trắc nghiệm xét trên mọi thí sinh làm bài trắc nghiệm ( hệ số tương quan điểm nhị phân). Hệ số tương quan có giá trị dương lớn ( gần bằng 1) nếu một thí sinh nào đó có điểm của câu trắc nghiệm cao thì điểm của toàn bài cũng cao và ngược lại. Hệ số tương quan có giá trị âm lớn ( gần bằng -1) nếu một thí sinh nào đó có điểm câu trắc nghiệm cao nhất thì điểm của toàn bài trắc nghiệm lại kém nhất, ngược lại. Hệ số tương quan bằng 0 nếu điểm của câu trắc nghiệm và điểm của toàn bài trắc nghiệm không có mối liên hệ chặt chẽ và ổn định nào cả. Nói cách khác, câu trắc nghiệm có độ phân biết tốt khi câu trắc nghiệm và toàn bài trắc nghiệm đều đo lường cùng một mục tiêu. Như vậy để tính độ phân biệt, ta có thể tính hệ số tương quan Pearson giữa điểm của câu trắc nghiệm với tổng điểm của toàn bài trắc nghiệm, sau đó kiểm nghiệm ý nghĩa của hệ số tương quan ấy. 1.2.3.4. Đánh giá bài trắc nghiệm 1.2.3.4.1. Độ tin cậy của bài trắc nghiệm Trắc nghiệm là một phép đo: dùng thước đo là bài trắc nghiệm để đo lường một năng lực nào đó của thí sinh. Độ tin cậy của bài trắc nghiệm chính là đại lượng biểu thị mức độ chính xác của phép đo nhờ bài trắc nghiệm. Có nhiều phương pháp theo khoa học thống kê để tính độ tin cậy của một bài trắc nghiệm. Một bài trắc nghiệm được xem là đáng tin cậy khi nó cho ra những kết quả có tính vững chãi. Có nghĩa là nếu làm bài trắc nghiệm ấy nhiều lần, mỗi học sinh sẽ vẫn giữ được thứ hạng tương đối của mình trong nhóm nhưng không có nghĩa là bài trắc nghiệm ấy được làm đi làm lại nhiều lần. Một bài trắc nghiệm có thể gồm rất nhiều câu hỏi và đó là một mẫu trong một ngân hàng câu hỏi dùng để khảo sát kiến thức của học sinh, do đó chúng phải chịu sai số chọn mẫu. Nếu một bài trắc nghiệm có 50 câu hỏi được ra cho học sinh, tiếp theo đó là một bài với 50 câu khác về cùng một lĩnh vực khảo sát, thì chắc chắn sẽ có những sự khác biệt giữa hai điểm số của một số học sinh. Như vậy, một điểm số duy nhất dựa trên một mẫu các câu trắc nghiệm không phải là số đo lường hoàn toàn đáng tin cậy. Có những yếu tố may rủi đóng góp vào sự thiếu tin cậy trong trường hợp các câu hỏi đúng sai và ở một mức độ ít hơn với các câu có nhiều lựa chọn. Điểm số của học sinh bao gồm trong đó một số câu trả lời đúng bằng lối phỏng đoán và một số câu làm đúng nhờ sự hiểu biết. Càng có nhiều câu phỏng đoán bao nhiêu thì người học sinh ấy càng có ít cơ may có được cùng một điểm số, nếu làm lại bài trắc nghiệm ấy lần thứ 2; do đó tính tin cậy của bài trắc nghiệm sẽ thấp nếu nhiều câu trả lời chỉ là những điều phỏng đoán. Vì yếu tố may rủi chi phối điểm số trắc nghiệm trong trường hợp này, người ta không thể xác định rằng những học sinh có điểm cao biết nhiều hơn hay giỏi hơn các học sinh có điểm thấp hơn. Do đó, nếu có nhiều học sinh đoán mò nghĩa là nhắm mắt mà đoán không cần phải suy nghĩ thì chắc chắn hệ số tin cậy sẽ thấp và điểm số trên một bài trắc nghiệm như vậy sẽ không đáng tin cậy. Nếu cho học sinh làm một bài trắc nghiệm dễ, các điểm số có khuynh hướng tập trung vào đầu mút cao của thang điểm, như vậy khó mà phân biệt được trình độ khác nhau của học sinh. Ngược lại, nếu là một bài trắc nghiệm rất khó, các điểm số sẽ tập trung vào đầu mút thấp của thang điểm, như vậy chúng sẽ che lấp tính chất khác nhau của các trình độ hiểu biết. Ngay cả khi ta cố giảm thiểu yếu tố may rủi bằng cách sử dụng loại câu điền khuyết, yếu tố chọn mẫu cũng vẫn tồn tại. Một sự khác biệt một vài điểm không thể bộc lộ sự khác biệt về thành tích. Chỉ khi nào các điểm số trắc nghiệm được trải rộng thì các điểm số ấy mới cho thấy rõ sự khác biệt về thành quả học tập. Do vậy, tính chất khó hay dễ của bài trắc nghiệm cũng ảnh hưởng đến tính tin cậy của bài trắc nghiệm. Ngoài ra, chiều dài của bài trắc nghiệm cũng ảnh hưởng đến tính tin cậy. Một bài trắc nghiệm rất ngắn không khiến cho điểm số được trải rộng ra đủ để cho ra những kết quả vững chãi. Bài trắc nghiệm càng dài thì tính tin cậy của nó càng tăng lên. Qua những yếu tố ảnh hưởng đến tính tin cậy của một bài trắc nghiệm cho ta thấy muốn đảm bảo tính tin cậy tối đa của bài trắc nghiệm ta cần phải: 1) Giảm thiểu các yếu tố may rủi. Một trong cách giảm các yếu tố may rủi là cố gắng hạn chế việc sử dụng các loại câu hai lựa chọn. 2) Viết những lời chỉ dẫn sao cho thật rõ ràng để học sinh khỏi phải nhầm lẫn. 3) Chuẩn bị trước bản chấm điểm ghi rõ các câu đúng. Nên tham khảo với các đồng nghiệp về những câu được cho là đúng, nhất là những câu thuộc loại điền khuyết. Người ta có thể tính độ tin cậy của bài trắc nghiệm bằng các cách sau đây:  Phương pháp trắc nghiệm - trắc nghiệm lại: có nghĩa là dùng một bài trắc nghiệm cho một nhóm TS làm hai lần và tính hệ số tương quan giữa hai bộ điểm. Phương pháp này co nhược điểm là: các đáp án của TS trong lần thứ hai không độc lập với lần thứ nhất, trình độ của TS trong lần thứ hai đã có sự thay đổi.  Phương pháp các bài TN tương đương: cho một nhóm TS làm hai bài TN tương đương rồi tính độ tương quan giữa hai bộ điểm số. Sẽ gây khó khăn trong việc soạn thảo các đề TN tương đương thực sự.  Phương pháp phân đôi bài TN: chính là tạo 2 bài TN tương, mỗi bài là một nửa bài TN. Để hai nửa bài thực sự tương đương, người ta sắp xếp từng cặp câu chẵn lẻ tương đương nhau để có hai bài TN một gồm các câu chẵn và một gồm các câu lẻ. Độ tin cậy của nửa bài TN bằng hệ số tương quan giữa hai bộ điểm của hai nửa bài TN, còn độ tin cậy của toàn bài TN có thể thu được khi hiệu chỉnh về tăng độ dài gấp đôi. Sự phụ thuộc của độ tin cậy của bài TN vào độ dài của nó được tính theo công thức tổng quát Spearman-Brown: r n = 1)1(  s s rn nr trong đó: r s là độ tin cậy của bài TN ngắn xuất phát, r n là độ tin cậy của bài TN có độ dài gấp n lần. Rõ ràng để hiệu chỉnh cho trường hợp bài TN có độ dài gấp đôi ta phải dùng công thức: r = 1 2 s s r r  Phương pháp Kuder-Richardson: Việc tính độ tin cậy theo phương pháp này dựa trên ý tưởng xem mỗi câu trong bài TN là một bài TN tương đương, tức là chúng có cùng điểm trung bình và cùng phương sai. Dựa vào đó chúng ta có thể tính độ tin cậy của một bài TN theo công thức Kuder-Richardson- 20 như sau: r = )1( k k (1- 2  pq ) Với: k- là số câu của bài TN p- tỉ lệ trường hợp trả lời đúng cho một câu q- tỉ lệ trường hợp trả lời sai cho một câu - phương sai của tổng điểm mọi TS đối với toàn bài TN Nhược điểm của công thức K-R-20 là phải biết độ khó p của mỗi câu TN. Nên trong trường hợp độ khó của các câu TN không khác nhau nhiều thì ta có thể dùng công thức sau: R = )1( k k               2 )1( 1  k M M Trong đó M là gía trị trung bình của điểm số bài TN. Đây chính là công thức Kuder-Richardson-21. 1.2.3.4.2 Độ giá trị Một phép đo lường bất kì chỉ có giá trị khi nó đảm bảo là phép đo đó đã đo được cái cần đo. Phép đo bởi bài TN đạt được mục tiêu là phép đo có giá trị. Hay, độ giá trị của một bài TN là đại lượng biểu thị mức độ đạt được mục tiêu đề ra cho phép đo nhờ bài TN. Nhìn từ các góc độ và sắc thái khác nhau độ giá trị thường được phân loại như sau: 1. Độ giá trị tiên đoán: một bài TN dùng để xét tuyển thường cần có độ giá trị tiên đoán, tức là bộ điểm số của nó tương quan tốt với một bài TN đánh giá hoặc các tiêu chí để đánh giá theo mục tiêu. Chẳng hạn, bộ điểm số của bài TN tuyển sinh đại học đối với một nhóm TS nào phải tương quan tốt với kết quả học tập cuối giai đoạn 1 đại học, chẳng hạn theo tiêu chí điểm trung bình của giai đoạn 1 đại học. Để nâng cao giá trị tiên đoán người ta thường không chỉ dùng một bài TN tiên đoán, mà dùng nhiều bài TN khác nhau hoặc các yếu tố khác nhau kết hợp với nhau để tiên đoán. 2. Độ giá trị đồng thời: nói lên mối quan hệ giữa điểm số của bài TN với một tiêu chí khác đồng thời, đã có sẵn và được nhiều người chấp nhận, về khả năng mà bài TN ấy muốn đo lường. Tức là bài TN đánh giá hoặc các tiêu chí để đánh giá xảy ra đồng thời với bài TN tiên đoán. 3. Độ giá trị nội dung: độ giá trị nội dung phản ánh đầy đủ các mục tiêu xác định cho môn học, bao trùm đầy đủ nội dung của môn học. Để xây dựng được một bài TN có độ giá trị về nội dung, cần phải thiết kế bài TN dựa vào toàn bộ nội dung, vào các loại trí năng mà mức kĩ năng mà môn học đòi hỏi. Để xác định độ giá trị về nội dung không thể chỉ dựa vào các tính toán thống như độ giá trị tiên đoán hoặc độ giá trị đồng thời, mà phải phân tích tỉ mỉ và công phu bài TN đối chiếu với mục tiêu và nội dung môn học. Một bài TN có thể bao trùm nhiều nội dung môn học, vì có nhiều câu hỏi, nhưng nó vẫn có thể kém giá trị vì chỉ chú trọng vào một phần nội dung nào đó mà bỏ qua các phần quan trọng khác, hay bài TN ấy xem các phần giống nhau không có sự ưu tiên cho kiến thức quan trọng 4. Độ giá trị cấu trúc: liên quan đến các loại trí năng và mức kĩ năng cần đo theo các mục tiêu cụ thể của môn học. Để có một bài trắc nghiệm có giá trị thì điều quan trọng là ta phải xác định được cái cần đo và các mục tiêu của môn học. Như vậy trước khi khảo sát trước học sinh thì người soạn TN phải suy xét và phán đoán các mức trí năng, kĩ năng sao cho phù hợp với mục tiêu môn học… Tóm lại để đánh giá một bài TN chúng ta xem xét trên hai yếu tố: độ tin cậy và độ giá trị. Một bài TN tốt thì nó phải có được yếu tố tin cậy (kết quả TN có tính vững trãi) và yếu tố giá trị (đo được cái cần đo). Một bài TN có thể đáng tin cậy mà không có giá trị, nhưng ngược lại thì không đúng. Nó có thể cho ra những điểm số đáng tin, nhưng không đo lường đúng loại thành quả học tập mà ta muốn đo lường. Tuy nhiên một bài TN không tin cậy thì không thể nào có giá trị được. Hai sắc thái khác nhau của độ tin cậy và độ giá trị là ở chỗ:độ tin cậy thì liên quan đến sự vững trãi của điểm số, trong khi tính giá trị liên quan đến mục đích của sự đo lường. 1.2.3.4.3 Các loại điểm số TN Một học sinh đạt được 50, 45, 30 điểm về bài TN toán, lý, hoá (điểm thô), nếu như vậy chúng ta sẽ không thế nào biết được “học sinh ấy” đã đạt thành tích G hay kém về môn học ấy. Điểm số nào của anh ta là trên trung bình? điểm nào cao nhất? điểm nào thấp nhất?. Vì không có chuẩn mực nào để so sánh nên các câu hỏi tương tự như vậy đều không trả lời được. Để có thể giải thích các điểm thô trên bài TN, ta cần phải có hai căn bản nào đó để so sánh chúng. Thông thường có hai lối so sánh: + So sánh với tiêu chuẩn tuyệt đối hay với độ khó về nội dung + So sánh với một nhóm được dùng làm chuẩn mực. 1) So sánh với tiêu chuẩn tuyệt đối Các điểm TN thuộc loại này được đăt trên căn bản so sánh thành quả đạt được của mỗi người với điểm số tối đa có thể đạt dược với bài TN ấy. Các điểm số của những người khác cùng làm bài TN ấy không ảnh hưởng gì đến việc xác định điểm số của bất cứ người nào trong nhóm làm TN ấy cả. a. Điểm phần trăm đúng: Điểm phần trăm đúng so sánh điểm số của người làm TN với điểm số tối đa có thể đạt được, hay nói một cách khác nhau, loại điểm số này có thể xem như là điểm số trên 1 bài TN với 100 câu hỏi. X= T 100 Đ Trong đó:X: điểm tính theo tỷ lệ % Đ: số câu TN làm đúng T: tổng số câu TN Như vậy yếu tố xác định điểm số câu TN thuộc loại này là độ khó của nội dung bài TN. b. Điểm chữ: Là loại điểm cũng căn cứ trên tỉ lệ % số câu đúng, nhưng được biểu thị bằng các mẫu tự A, B, C, D, … Cả hai loại điểm trên đều bị chỉ trích vì tính cách chủ quan và tuỳ tiện trong việc ấn định các mức điểm. 2) So sánh với nhóm làm chuẩn mực Để biết được khả năng của một người làm TN so sánh với những người khác trong nhóm làm chuẩn mực ta phải lựa chọn một nhóm chuẩn mực và thiết lập các thang bậc, sau đó từ điểm thô ta biến cải theo thang bậc trên. Ta có 2 loại điểm sau: a. Điểm bách phân: Là điểm trên thang điểm số mà ở đó có một số % trường hợp nào đó rơi vào chính điểm ấy hay ở dưới nó. Dựa vào điểm bách phân ta không những xếp hạng được TS từ thấp đến cao trong một mẫu mà còn tính đến cả cỡ của mẫu tức số người trong một mẫu. b. Điểm tiêu chuẩn: Điểm tiêu chuẩn được dùng để khắc phục nhược điểm của điểm bách phân: người ta không thể lâý trung bình của các thứ hạng bách phân nên ta không thể tính khả năng trung bình của một người làm nhiều bài TN khác nhau, hay trung bình của một nhóm người về một bài TN. Điểm tiêu chuẩn được quan điểm như là một lối phát biểu khoảng cách của điểm ấy tính từ trung bình, hay cũng có thể xem như là những điểm số đã được gán cho một trung bình và một độ lệch tiêu chuẩn nào đó. Đây là loại điểm ưa chuộng nhiều hơn trong TN và nghiên cứu. Một số loại điểm chuẩn: Điểm Z: là loại điểm chuẩn căn bản. Nó cho ta biết hiệu số (hay khoảng cách) giữa một trị số điểm thô náo đó và được trung bình trong nhóm làm bài TN. Z= S  Trong đó: X: là điểm thô nào đó  : điểm thô trung bình trong nhóm làm TN S: độ lệch tiêu chuẩn của nhóm Nhược điểm của loại điểm Z này là: một nửa số điểm Z mang điểm số âm và tất cả các điểm Z đều phải mang một hay nhiều số lẻ. Điểm tiêu chuẩn V Về căn bản, điểm tiêu chuẩn V cũng giống như điểm Z nhưng nó được quy về phân bố bình thường với trung bình là 10 và độ lệch tiêu chuẩn là 4 Công thức: V=4*Z + 10 Điểm chuẩn V khắc phục được điểm âm Để phù hợp với hệ thống điểm 11 (từ 0 đến 10) người ta chọn điểm trung bình là 5 và độ lệch chuẩn là 2, từ đây ta có điểm tiêu chuẩn mới. Điểm V (mới) =2*Z + 5 1.2.4. Lý thuyết ứng đáp câu hỏi và mô hình Rasch 1.2.4.1. Lí thuyết ứng đáp câu hỏi Lí thuyết ứng đáp câu hỏi (Item Respone Theory hay gọi tắt là IRT) của Geog Rasch đã mô hình hoá mối quan hệ giữa mức độ khả năng của một người và đáp ứng của người ấy với một câu hỏi. Vì các mức độ khả năng là những gì không thể quan sát được nên lí thuyết ứng đáp câu hỏi (IRT) cũng là một trong các mô hình được gọi là mô hình đặc điểm tiềm tàng. Khi xây dựng một mô hình toán học nói chung, để đơn giản và khả thi, bao giờ người ta cũng quan tâm đến những mối quan hệ bản chất nhất, tước bỏ bớt những yếu tố phức tạp nhưng không bản chất. Để xây dựng mô hình toán phản ánh quan hệ các mối tương tác nguyên tố TS – CH, trong lý thuyết ứng đáp CH người ta giả định sau đây: (1). Chỉ một thuộc tính hoặc một năng lực được đo bởi các câu hỏi tạo nên bài TN. Đó là giả định về thuộc tính đơn thứ nguyên. Trong thực tế thường có nhiều nhân tố ảnh hưởng lên việc làm TN( động cơ, sự hồi hộp, khả năng làm nhanh, xu hướng đón nhận, khả năng nhận thức…) ngoài năng lực chính được đo bởi bài TN. Vậy để đạt giả định về tính đến thứ nguyên cần xây dựng bài TN sao cho khu biệt được thành phần chính ảnh hưởng lên việc làm bài TN. Thành phần đó được xem là năng lực nào đó được đo bởi bài TN. Năng lực này không nhất thiết là phải cố hữu hoặc không đổi, nó có thể thay đổi theo thời gian do học tập thêm, do quên kiến thức hoặc thay đổi do các yếu tố khác. Khi giả định về đơn thứ nguyên thoả mãn, cũng sẽ có tính độc lập địa phương. Điều này có nghĩa là khi giữ không đổi năng lực ảnh hưởng lên việc làm bài TN, việc TL của TS đối với CH. Tập hợp các năng lực ấy biểu diễn một không gian năng lực tiềm ẩn đầy đủ. (2). Có một hàm đặc trưng của CH ( Iten Characteristic Function – ICF) phản ánh mối quan hệ thực giữa các biến không quan sát được (năng lực) và các biến quan sát được việc TLCH. Để xây dựng IRT người ta thừa nhận 2 định đề sau: 1) Việc trả lời của 1 TS đối với 1 CH có thể dự báo bởi năng lực của TS. 2) Quan hệ giữa việc TLCH bởi TS và năng lực làm cơ sở cho hàm đặc trưng CH ( ICC ). Hàm nói trên có đặc điểm là khi mức năng lực tăng xác suất để trả lời đúng 1 CH sẽ tăng lên. Đường cong đặc trưng CH (ICC) và đường phân bố năng lực của hai mẫu TS. Hình trên thể hiện một ICC đối với TH khi chỉ có 1 năng lực làm cơ sở để TLCH, cùng với hai hàm phân bổ năng lực của 2 nhóm TS. Ta thấy rằng: những TS có năng lực thấp hơn dù TS đó có nằm ở nhóm nào đi nữa. IRT cho phép ước lượng các sai số chuẩn của các giá trị ước lượng năng lực của 1 TS, chứ không phải là một ước lượng sai số cho mọi TS như trong lý thuyết cổ điển. 1.2.4.2. Mô hình Rasch 1.2.4.2.1. Giả thiết của Rasch về sự ứng đáp CH Giả sử ta khảo sát một mối quan hệ nguyên tố mà trong đó TSv có một mức năng lực nào đó âv nào đó về lực đo, đứng trước CHi có một độ khó ci. Theo Rasch: “ Một TS có khả năng hơn TS khác phải có một xác suất lớn hơn để trả lời đúng một CH bất kỳ, hay một câu hỏi khó hơn một CH khác, đối với bất kỳ một TS nào xác suất để TL đúng CH sau là lớn hơn so với câu hỏi trước. 1.2.4.2.2. Hàm ứng đáp câu hỏi theo Rasch Theo giả định của Rasch, xác suất của câu trả lời CHi phụ thuộc vào độ chênh lệch giữa năng lực âv của TS và độ khó i của CHi, tức là hiệu số (âv- i). Khi âv=i, rõ ràng xác suất trả lời đúng CH là 1/2 : có thể dễ dàng hiểu trạng thái này khi ước đoán xác suất thắng cuộc của hai đô vật ngang sức nhau. Khi âv<<i, xác suất trả lời đúng CH là gần bằng 0, còn khi âv>>i, xác suất trả lời đúng CH gần bằng 1. Như vậy hàm ứng đáp CH tăng đơn điệu từ 0 đến 1 khi âv-i biến đổi từ -∞ đến +∞, qua giá trị 1/2 khi âv-i = 0. Rasch đã chọn một hàm giải tích với biểu thức toán học đơn giản nhất có dáng điệu biến đổi như vậy: Pi (v) =     iv iv e e     1 Trong đó Pi (âv) là xác suất của TS có năng lực âv trả lời đúng CH có độ khó v, e là cơ sở lôgarit tự nhiên. Hình 2 biểu diễn ICC theo mô hình Rasch. Mô hình Rasch ứng với hàm ứng đáp CH dạng đơn giản nhất, chỉ chứa một tham số độ khó. Đối với mô hình một tham số người ta giả thiết các CH có độ phân biệt như nhau, do đó các ICC của các CH có dạng như nhau, chúng chỉ khác nhau ở vị trí của nó nếu biểu diễn đường cong theo trục năng lực â. 1.24.2.3. Tính bất biến Tính bất biến là hòn đá tảng của IRT, biểu hiện sự khác nhau cơ bản giữa IRT và lý thuyết trắc nghiệm cổ điển. Nội dung của tính bất biến đó là: các tham số đặc trưng cho một CH không phụ thuộc vào phân bố năng lực của các TS và các tham số đặc trưng cho một TS không phụ thuộc vào bộ CH của bàI trắc nghiệm. Để hiểu sâu hơn tính bất biến đó đên đối với IRT, có thể lập luận như sau. Đối với mô hình Rasch, từ biểu thức (1) của xác suất trả lời đúng, ta có thể xác định tỷ số các phần bù(odds): P/(1-P)= e(- ) Và từ đó: ln[P/(1-P)] = (âv -i) 1 0.5 0 P(â-) (â-) Hình 2 Nếu xuất phát từ một CH, có độ khó xác định i, đường biểu diễn của hàm ln(odds)=(â) phụ thuộc vào năng lực â là một đường thẳng cắt trục tung tại I. Tức là với các mẫu TS có các năng lực âi bất kỳ trong tổng thể TS, nếu mô hình ICC đó được thoả mãn, giá trị i thu được của CHi đang xét là duy nhất. Mặt khác, nếu xuất phát từ một TSv có năng lực xác định là âv đường biểu diễn ln(odds) = g() là một đường thẳng cắt trục tung tại - âv. Tức là với các mẫu CH có các độ khó i bất kỳ trong tổng thể CH, nếu mô hình ICC được thoả mãn, giá trị âv thu được của TSv đang xét là duy nhất. Từ lập luận trên có thể thấy rõ ràng tính bất biến đang xét chỉ đúng khi số liệu thực tế thoả mãn mô hình ICC. Nói cách khác, tính bất biến đồng nhất với tính phù hợp của số liệu thực tế với mô hình toán. Một điều cần lưu ý nữa là tính bất biến đó là tính chất của tổng thể, chứ không phải của một mẫu nào đó, vì ICC theo định nghĩa là đường hồi quy của sự trả lời CH ở một năng lực nào đó, do đó P là giá trị trung bình của mọi trả lời CH trong tổng thể các TS có một năng lực âv xác định. Đối với một mẫu TS con trong tổng thể có năng lực âv chưa chắc giá trị trung bình của moi trả lời CH trong mẫu đó đã thoả mãn mô hình ICC, hoặc nếu có một mẫu con thoả mãn thì các mẫu khác cũng chưa chắc đã thoả mãn, do đó nói chung không thể hy vọng sự bất biến xảy ra trong tất cả các mẫu cho dù mô hình phù hợp với dữ liệu của cả tổng thể. Trong thực tế ta có thể xác định mức độ bất biến khi sử dụng các mẫu số liệu, chẳng hạn xét sự tương quan của năng lực xác định được qua các ước lượng từ hai mẫu khác nhau. 1.2.4.2.4. Thang đo năng lực và điểm thực Mục đích cuối cùng của trắc nghiệm là gán một điểm số nào đó cho TS, phản ánh mức độ đạt được của TS về một năng lực nào đó được đo bởi bài trắc nghiệm. Hiển nhiên là điểm đó phải được giải thích cẩn thận và phải có giá trị đối với mục đích sử dụng. Trong khuôn khổ lý thuyết trắc nghiệm cổ đỉên người ta thường gán số câu đúng (điểm thô) cho TS, xem đó là ước lượng điểm thực của TS đối với bài trắc nghiệm. Đối với IRT mỗi TS có một năng lực bên trong â, năng lực này xác định xác suất trả lời đúng CH của anh ta, và cũng dựa trên việc TS trả lời bài trắc nghiệm để xác định năng lực của TS. Theo IRT người ta có thể ước lượng được â, va ta sẽ thấy sau này là â có mối quan hệ đơn điệu với điểm thực nếu dữ liệu thực tế phù hợp với mô hình. Bản chất của điểm thực Gọi điểm thô của TS là X, đó là ước lượng của điểm thực . Ta định nghĩa điểm thực là một biến đổi tuyến tính của điểm thô, và biểu diễn: E(X) =  Chia X cho tổng CH sẽ được điểm tỷ lệ trả lời đúng (biến đổi tuyến tính). Điểm tỷ lệ trả lời đúng có ý nghĩa cả khi chia bài trắc nghiệm ra các bài trắc nghiệm con có số câu khác nhau để đo các đối tượng khác nhau. Dù biến đổi thế nào, nhược điểm lốn của điểm X vẫn tồn tại: nó không độc lập với các CH mà một TS trả lời, và điểm biến đổi không độc lập với nhóm TS liên quan. Trong khi đó thì năng lực â có tính độc lập vừa nêu. Vì có thể so sánh các TS trả lời các bộ CH khác nhau khi dùng điểm â nên có thể xem thang điểm â là một thang điểm tuyệt đối ứng với năng lực tiềm ẩn được đo. Bản chất của thang đo mà trên đó â được xác định là gì? Thang X không là thang tỷ lệ, cũng không phải thang khoảng cách, mà có thể xem đó là thang thứ tự. Thang đo mà trên đó â được xác định cũng vậy, nhưng đôi khi có thể giải thích thang mà trên đó â được xác định như là một thang tỷ lệ “giới hạn”. Chuyển đổi sang thang điểm thực Chuyển đổi quan trọng nhất của thang điểm â là chuyển sang thang điểm thực. Gọi X là điểm thô tính theo số câu đúng: X =  n j jU 1 Trong đó Uj là các câu trả lời đúng 1 và sai 0 của một TS cho CHj. Nếu biểu diễn điểm thực là  thì theo biểu thức (2)  =E(X) =E(  n j jU 1 )= )( 1   n j jUE Nếu một biến ngẫu nhiên Y lấy giá ntrị y1 và y2 với các xác suất tương ứng là P1 và P2 thì E(Y) = y1P1 + y2P2 Vì Uj nhận giá trị 1 với xác suất Pj(â) và giá trị 0 với xác suất Qj(â) nên ta có thể biểu diễn: E(Uj) = 1.P(â) + 0.Qj(â) = Pj (â) Cuối cùng:  = )( 1   n j jP  Tức là: điểm thực của một TS có khả năng â là tổng của các đường cong đặc trưng của mọi CH trong bài trắc nghiệm, do đó điểm thực cũng được gọi là đường cong đặc trưng của bài trắc nghiệm. Cần một lần nữa nhắc lại rằng quan hệ trên chỉ đúng khi mô hình trả lời câu hỏi phù hợp với số liệu thực tế. Việc chuyển đổi từ biến năng lực â sang điểm thực có tác dụng quan trọng sau: 1) loại bỏ các giá trị âm; 2) tạo nên thang đo với các điểm từ 0 đến n (hoặc theo tỷ lệ từ 1% đến 100%), dễ giải thích; 3) có thể xác định điểm cắt, từ đó suy ngược lại điểm cắt trên thang â; 4) một tác dụng quan trọng là nếu biết trước năng lực â của một TS nào đó thì có thể tính điểm của một bài trắc nghiệm mà TS đó không làm (xem lại thí dụ về vận động viên nhảy cao đã nêu trên đây). Từ đó có thể tiên đoán điểm thực của TS hoặc tình trạng đạt hoặc không đạt đối với một bài trắc nghiệm mới. Tính chất này cồn được sử dụng để xác định các hằng số của thang điểm khi đặt các tham số của hai bài trắc nghiệm trên cùng một thang đo (equating). Chương 2: Lập dàn bài trắc nghiệm 2.1. Mục đích của bài TN Bài kiểm tra này nhằm kiểm tra những hiểu biết tối thiểu về phần Hoá hữu cơ - 11. Bên cạnh đó còn nhằm kiểm tra những chỗ mạnh chỗ yếu của học sinh, giúp học sinh phát hiện những kiến thức chưa đầy đủ qua một số câu hỏi có tính chất đòi hỏi học sinh phải hiểu rõ vấn đề, giúp học sinh khái quát được kiến thức đã học một cách toàn diện. Đánh giá năng lực thực của học sinh một cách chính xác hơn. 2.2. Phân tích nội dung môn học Bao gồm chủ yếu việc xem xét và phân biệt 4 loại học tập: (1). Những thông tin mang tính chất sự kiện mà học sinh phải nhớ hay nhận ra. (2). Khả năng và ý tưởng mà chúng ta phải giải thích hay minh hoạ (3). Những ý tưởng phức tạp mà chúng ta cần giải thích hay giải nghiã. (4). Những thông tin, ý tưởng và kĩ năng cần được ứng dụng hay chuyển dịch sang một tình huống mới. Phần này bao gồm các bước sau: Bước 1. Tìm ra những ý tưởng chính yếu của phần đó. 1) Định nghĩa - CTTQ. 2) Đồng đẳng - đồng phân. 3) Danh pháp – cấu tạo. 4) Tính chất hoá học. 5) Điều chế. Bước 2. Lựa chọn những từ, nhóm chữ và cả những ý kiến (nếu có) mà học sinh sẽ phải giải nghĩa. a) Ankan, Anken, Ankin, Ankadien, Xiclo ankan. b) Quy tắc thế và cộng. Bước 3. Phân loại hạng thông tin được trình bày a) Những thông tin nhằm mục đích giải nghĩa hay minh hoạ - Các định nghĩa. - Cấu tạo của một số chất cơ bản. b) Những khái luận quan trọng:  Quy tắc thế vào các hiđrocacbon no.  Quy tắc cộng ( Macopnhicop) vào hiđrocacbon no.  Quy tắc thế trong vòng benzen.  Tính chất hoá học đặc trưng của từng loại hợp chất Bước 4. Lựa chọn một số thông tin và ý tưởng đòi hỏi học sinh phải có khả năng ứng dụng những điều đã biết để giải quyết những vấn đề trong những tình huống mới.  Tính chất hoá học của từng hợp chất.  Cách điều chế.  Tên gọi ( danh pháp) Thiết lập dàn bài TN Kĩ năng Nội dung Nhớ Hiểu áp dụng Phân tích Tổng hợp Đánh giá (1) (2) (3) (4) (5) (6) 1. Định nghĩa 2 câu 2. CTTQ 1 câu 1 câu 2 câu 3. Danh pháp 2 câu 4. Tính chất hoá học 2 câu 1 câu 2 câu 4 câu 1 câu 5. Điều chế 5 câu 1 câu 6. Cấu tạo 3 câu 1 câu 7. Tỉ khối hơi 1 câu 2.4 Quá trình thực hiện. Bao gồm các bước sau: Bước 1: nghiên cứu nội dung kiến thức cần kiểm tra (phần ankan, xicloankan, anken, ankađien-caosu, ankin). Lập dàn bài sơ lược. Bước 2: Tạo bảng đặc trưng hai chiều và lập câu hỏi chi tiết dựa theo bảng đặc trưng hai chiều trên. Bước 3: Liên hệ với trường PTTH Hai Bà Trưng - Hà Nội để lấy mẫu kiểm tra. Bước 4: Tham khảo ý kiến của GV giảng dạy bộ môn Hoá cùng các bạn về nội dung bài kiểm tra tránh gặp phải một số sai sót (kiến thức quá khó hay quá dễ, chưa tổng quát…). Sau đó hoàn chỉnh lại các câu hỏi một cách hợp lí hơn. Bước 5: Mã hoá đề thi tạo lập 6 đề khác nhau dựa trên 29 câu hỏi đã viết. Bước 6: Tiến hành kiểm tra trên mẫu TS (các lớp 11E1, 11G1, 11H2), dưới sự giúp đỡ của cô giáo phụ trách bộ môn: Vũ Thị Liên. Bước 7: Chấm bài lấy điểm kiểm tra một tiết, thống kê số liệu. Bước 8: Nhập dữ liệu để chạy chương trình Quest. Bước 9: Phân tích và đánh giá kết quả thu được, tìm ra ưu nhược điểm của bài kiểm tra đề ra những phương pháp nhằm hạn chế các sai sót. CHƯƠNG 3: PHÂN Tích kết quả 3.1. Phân tích bài tn 3.1.1. Phân tích câu TN Việc phân tích các câu hỏi dựa vào độ khó và độ phân cách của từng câu. Độ khó của câu hỏi tuỳ thuộc vào câu đó có mấy phương án lựa chọn vì: Độ khó pi của câu hỏi = (100 + 100/ n)/ 2 Trong đó n là số phương án trả lời trong một câu hỏi. Độ khó cho ta biết được một bài TN nên để lại những câu nào và loại đi những câu nào. Ta không thể để lại những câu mà hầu hết học sinh đều làm được và cũng không thể để lại những câu mà hầu hết học sinh không làm được. Một câu TN tốt là câu TN mà có độ khó vừa phải, theo công thức trên thì với câu hỏi có 4 lựa chọn thì độ khó vừa phải là 62,5%, câu có 3 lựa chọn là 66,67% và câu loại đúng sai là 75%. Độ phân cách của câu hỏi cho ta biết câu hỏi đo có phân biệt được học sinh giỏi và học sinh kém. Nếu độ phân cách nhỏ hơn 19 thì câu có độ phân cách không tốt câu này không thể phân biệt được học sinh giỏi và học sinh kém. Độ phân cách từ 20 đến 29 có thể coi là tạm được, độ phân cách từ 30 đến 39 là khá tốt và độ phân cách từ 40 trở lên là rất tốt. Cách tính độ phân cách và độ phân biệt có thể được tính theo mục 3 trang 24. Dựa trên cơ sở đó chúng ta có nhập dữ lệu vào và chạy theo chương trình QUEST để tính độ tin cậy và độ phân biệt (xem phần phụ lục). Qua chương trình Quest kết quả cho ta 17 câu có thể chấp nhận được, trong đó có 4 câu dễ và 13 câu khó và 12 câu phải sửa đổi hoặc bỏ đi thay bằng câu khác. Ta sẽ đánh giá một số câu TN ở trên. Ta xét câu 8: (câu có độ phân biệt cao). Phản ứng sau: CH2 CH CHCH2 + HCl (tỉ lệ 1:1)  có sản phẩm chính là: C) CH2 CH 2CHCH2  A) Cl B) D) PAC A B C D STS 5 29 4 48 % 5,8 33,7 4,7 55,8 D -0,07 0,34 -0,08 -0,25 Độ phân biệt của phương án đúng là dương và có giá trị lớn D= 0,34>0,2 rất tốt, còn độ phân biệt của các phương án nhiễu là âm rất phù hợp. Nhưng độ khó của câu này cách quá xa so với độ khó trung bình 33,7 < 62,5. Như vậy có thể dùng câu này trong việc phân biệt giữa HS giỏi và HS kém. Ta xem tiếp một ví dụ nữa là câu 26:(câu tốt) Cho hai bình khí: C2H4 và C2H2 có thể nhận biết bằng cách nào? A) dd Br2 B) dd KMnO4 C) dd AgNO3/ NH3 D) Cả ba cách trên PAC A B C D STS 13 7 53 25 % 13,3 7,1 54,1 25,5 D -0,19 -0,01 0,43 -0,33 Đây là một phương án rất tốt vì: Độ phân biệt của phương án đúng dương và khá cao 0,43 và độ khó là 54,1 < 62,5 đồng thời các phương án nhiễu đều có độ phân biệt âm, rất phù hợp. CH3CHCHCH2  Cl CH3CHCHCH3   Cl Cl CH3CHCHCH2  Cl Giả sử như câu 1:(câu quá dễ). 1) Hiđrocacbon no là: A) Hiđrocacbon mà trong phân tử chỉ có liên kết đơn B) Hiđrocacbon mà trong phân tử không có liên kết đôi C) Hợp chất hữu cơ mà trong phân tử chỉ có liên kết đơn D) Hợp chất hữu cơ mà trong phân tử chỉ có liên kết  PAC A B C D STS 87 0 8 4 % 87,9 0 8,1 4,0 D 0,06 NA 0,06 0,00 Như vậy câu này có độ khó quá dễ (87,9) trong khi độ khó vừa phải của câu là 62,5%. Chính vì thế đây cũng là câu có độ phân biệt quá thấp. Các phương án lựa chọn ở đây độ nhiễu không tốt, như phương án B quá dễ nên học sinh đều dễ dàng trả lời được cần phải thay đổi lại câu hỏi này. Xét đến câu 14:(câu không tốt) 14) Hãy chọn phương trình sai khi điều chế axetilen: A) CaC2 + 2H2O  Ca(OH)2 + C2H2 B) 2CH4 1500 oC  C2H2 + 3H2 C) CH2Cl CH2Cl kiềm/rượu  C2H2 + HCl D) CaCO3 + H2O  Ca(OH)2 + C2H2 PAC A B C D STS 1 1 40 55 % 1,0 1,0 41,2 56,7 D - 0,15 0,09 0,03 -0,02 Độ khó của câu là 56,7 so với câu có 4 phương án lựa chọn thì đây cũng là một câu hơi khó. Độ phân biệt của câu hỏi là -0,02 như vậy câu này khó hơn với TS giỏi và dễ hơn với TS kém. Nguyên nhân của câu này là do khi đánh máy có sơ suất trong phương án C do đó hầu hết các TS giỏi đều chọn phương án này và có thể phương án C không được dạy ở trên lớp nên TS không biết và cũng không suy đoán ra. Xét câu 22: (không tốt) 22) Phân tử axetilen có cấu tạo: A) 4 liên kết  và 1 liên kết  B) 3 liên kết  giữa 2 nguyên tử C C) 4 nguyên tử nằm trên cùng một mặt phẳng D) 4 nguyên tử nằm trên cùng một đường thẳng và có 2 liên kết  giữa 2 nguyên tử C. PAC A B STS 58 37 % 61,1 38,9 D 0,07 -0,07 Đây là một câu hỏi có độ khó trung bình là 75% như vậy kết quả cho ta thấy là độ khó của câu này khá thấp, có nghĩa là câu này khó, nhưng lại có độ phân cách thấp D= -0,07. Cần phải xem xét lại câu 22: Đây có thể là do trong quá trình giảng GV không chú trọng cấu tạo của phân tử metan không phân tích rõ để các em đã bị lừa khi đọc qua câu hỏi. Từ kết quả phân tích cho ta những câu tốt dùng để đo năng lực của HS và những câu chưa tốt cần phải sửa hoặc bỏ đi. Qua 29 câu trên, ta thu được 17 câu có thể chấp nhận được, trong đó có 4 câu dễ (câu: 2, 20, 25, 29) và 13 câu khó (câu: 3, 4, 6, 7, 8, 9, 10, 16, 17, 21, 23, 26, 28); và 12 câu phải sửa đổi hoặc bỏ đi thay bằng câu khác. 3.1.2. Phân tích bài TN Hai đại lượng quan trọng thường được dựa vào để đánh giá một bài TN là độ tin cậy và độ giá trị. Người ta thường sử dụng hệ số tương quan để diễn tả các đại lượng trên. Bài TN này chúng ta thu được r = 0,96 chứng tỏ rằng bài kiểm tra này có độ tin cậy khá tốt. Ngoài ra chúng ta còn phải kể đến các thành phần cấu tạo của các mẫu được chọn khi tính toán thống kê như mẫu TS hoặc bài TN. Đối với bài TN này ta sẽ xét từng thành phần. Trước hết là nội dung bài TN, qua chương trình QUEST ta có kết quả sau: Trung bình (mean): 0,00 Độ lệch chuẩn (SD): 1,35 Độ tin cậy : 0,96 Như vậy độ khó trung bình của bài TN này là 0,00 với độ lệch chuẩn là 1,35. Các số thống kê hoà hợp là: Infit mean square: 0,99 Outfit mean square: 1,00 SD : 0,08 SD : 0,14 Infit t : 0,03 Outfit t : 0,08 Tiếp theo ta xét đến các số liệu của mẫu: Mean -0,33 SD 0,55 Các thông số hoà hợp với mô hình Rasch: Infit mean square : 1,01 Outfit mean square : 1,00 SD : 0,25 SD : 0,40 Infit t : -0,01 Outfit t : 0,01 Trị số kì vọng của các bình phương trung bình (mean square) xấp xỉ bằng 1 và trị số kì vọng của t xấp xỉ bằng 0 (trích theo 3, tr 133). Các số thông kê hoà hợp trên đây cho thấy rằng các điều kiện ấy đã được thoả mãn. Từ đồ thị “Item Fit Map” (xem mục lục) cho ta thấy rằng tất cả 29 câu trắc nghiệm trong bài đều hoà hợp với mô hình Rasch. Nhưng theo đồ thị “Case Fit Map” (xem mục lục) thì không phải tất cả các thí sinh tham dự đều hoà hợp với mô hình Rasch. Nói chung các thông số về mẫu và câu trắc nghiệm đều hoà hợp với mô hình Rasch. Nếu xét đến từng TS ta lấy 2 thí dụ TS 01 và TS 74. Đối với TS 01 ta có: Năng lực (ability) : 1,21 Fit : 1,62 Điểm thô (Score) :73,08 Như vậy thí sinh này có năng lực rất cao nhưng có những câu không vượt quá khả năng mà vẫn sai như câu4, 15, 17, 19, 24, 27, 28. Nguyên nhân có thể do khi học bài không kỹ, không chú ý khi cô giáo giảng bài nên không tiếp thu được đầy đủ thông tin hoặc nhìn bài bạn. TS này không phù hợp với mô hình Rasch. Đối với TS 74 ta có: Năng lực (ability) : -0,33 Fit : 0,87 Điểm thô (Score) :44,44 Đây là một TS hoà hợp với mô hình Rasch. Các câu 19, 20 là những câu dưói năng lực nhưng vẫn không làm được là có thể vì câu hỏi chưa rõ ràng, phương án trả lời chưa thoả mãn với ý của TS hoặc nhìn bài bạn. Nhìn vào bảng phân bố giữa năng lưc- câu hỏi (Item estimates) ta thấy mức năng lực của TS chưa được cao (r = 0.27), và sự phân bố câu hỏi là tốt (bài TN có tính ổn định cao r =0.96). Độ ổn định về mức năng lực của học sinh chưa được cao vì TS ở lớp này có học lực không đồng đều giữa các lớp (lớp 11H2 học lực rất kém so với 11E1, 11G1), HS còn bỡ ngỡ với hình thức kiểm tra này. Trên đây là một số phân tích về câu, mẫu và TS của bài TNKQ đối với HS khối 11(E1, G1, H2) tại trường PTTH Hai Bà Trưng Hà Nội. Qua kiểm tra và phân tích kết quả tôi xin đưa ra một số ý kiến riêng của bản thân như sau: 1) TNKQ thực sự là một phương pháp khoa học và có hiệu quả thiết thực trong việc đo lường thành quả của HS. Nó cho ta con số khá chính xác về năng lực của HS, về độ khó và độ phân cách của câu TN, về độ tin cậy của bài TN… Từ đó ta có thể định cỡ câu TN và mẫu TS để đánh giá thành quả học tập. 2) Với TNKQ ta hoàn toàn có thể kiểm tra được toàn bộ nội dung môn học, hạn chế được may rủi, đỡ tốn công chấm bài và hoàn toàn khách quan trong thi cử… 3) Phương pháp này rất tốn thời gian để soạn đề nhưng nếu có sự hiểu biết sâu sắc về lĩnh vực này (đặc biệt là các phần mềm để úng dụng) thì sẽ khắc phục được điểm yếu này. Mỗi phương pháp TN đều có ưu nhược điểm riêng của nó, không có một phương pháp nào được coi là hoàn hảo mà chỉ có cách phối hợp hiệu quả các phương pháp để tạo nên hình thức đánh giá hoàn hảo. Hiện nay hầu hết các thầy cô ở phổ thông đều cho rằng TNKQ có rất nhiều nhược điểm và không thích dùng nó để đánh gía HS. Để phổ biến rộng rãi phương pháp TNKQ thì phải có nhiều tài liệu và hình thức giảng dạy để GV thấy được những ưu nhược điểm của phương pháp này mà ứng dụng linh hoạt vào công việc dạy học của mình. Tài liệu tham khảo 1. Ph.d. Nguyễn Phụng Hoàng (chủ biên), 1996, Phương pháp trắc nghiệm trong kiểm tra và đánh giá thành quả học tập, Nhà xuất bản GD. 2. TSKHGD. dương thiệu tống, 1995, Trắc nghiệm và đo lường thành quả học tập, Bộ giáo dục và đào tạo trường ĐH tổng hợp TPHCM. 3. TSKHGD. Dương thiệu tống, 1998, Trắc nghiệm tiêu chí,Nhà xuất bản GD. 4. Bộ giáo dục và đào tạo , 1994, Những cơ sở của kĩ thuật Trắc Nghiệm, Hà Nội. 5. GS.TSKH. Lâm quang thiệp, 2003, Đo lường và đánh giá trong giáo dục, Hà Nội. Mục lục Mở ĐầU ............................................................................................................ 1 Chương 1: CƠ Sở Lí LUậN ........................................................................... 5 1.1 lịch sử những phép đo lường và trắc nghiệm ............................................. 6 1.1.1 Trên thế giới ....................................................................................... 6 1.1.2. ở nước ta .......................................................................................... 7 1.2. Các khái niệm ........................................................................................... 8 1.2.1. Trắc nghiệm là gì? ............................................................................. 8 1.2.2. Trắc nghiệm khách quan là gì? ........................................................ 12 1.2.3. Các tiêu chuẩn để đánh giá các câu TN và bài thi TNKQ ................. 24 1.2.4. Lý thuyết ứng đáp câu hỏi và mô hình Rasch ................................... 41 Chương 2: Lập dàn bài trắc nghiệm .............................................................. 48 2.1. Mục đích của bài TN .............................................................................. 48 2.2. Phân tích nội dung môn học ................................................................... 48 2.3. Thiết lập dàn bài TN ........................................................................... 49 2.4 Quá trình thực hiện. ................................................................................. 49 CHƯƠNG 3: PHÂN Tích kết quả .................................................................. 51 3.1. Phân tích bài tn ....................................................................................... 51 3.1.1. Phân tích câu TN ............................................................................. 51 3.1.2. Phân tích bài TN .............................................................................. 54 Tài liệu tham khảo .......................................................................................... 58 Kí hiệu TN : Trắc nghiệm TNKQ: Trắc nghiệm khách quan TL : Tự luận GD : Giáo dục TS : Thí sinh HS : Học sinh GV : Giáo viên TL : Trả lời CH : Câu hỏi MCQ : Câu hỏi nhiều lựa chọn

Các file đính kèm theo tài liệu này:

  • pdf2z_4401.pdf
Luận văn liên quan