Phân tích số liệu định lượng
Tiêu chuẩn là yếu tố nhiễu
Giá trịước lượng thô khác biệt với giá trị hiệu chỉnh
Các bước phân tích
Tính toán giá trịđo lường tác động (RR, OR)
Phân tầng theo yếu tố nhiễu
Phân tích trong t ừng tầng
Nếu tác động lànhư nhau , phân t ích hiệu chỉnh MH
So sánh giá trị thô và hiệu chỉnh
• ORc = ORa không c ó nhiễu
• ORc ≠ ORa có yếu tố nhiễu
36 trang |
Chia sẻ: lylyngoc | Lượt xem: 2821 | Lượt tải: 2
Bạn đang xem trước 20 trang tài liệu Phân tích số liệu định lượng, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
BỘ MÔN THỐNG KÊ Y TẾ-ĐHYTCC
PHÂN TÍCH SỐ LIỆU
ĐỊNH LƯỢNG
9/15/2010
THIẾT KẾ NGHIÊN CỨU
Các giả thuyết
Loại thiết kế
Định nghĩa đơn vị quan sát và các quan sát
Xác định các nguồn sai số
Ai sẽ là người sử dụng các báo cáo NC
9/15/2010
Các NC đều có mục đích đánh giá sự biến thiên:
Giữa các nhóm so sánh
Của nhóm nghiên cứu theo thời gian
Càng nhiều nguồn biến thiên càng nhiều khả năng
phiên giải số liệu
Hai (2) nguồn biến thiên chính:
Khác biệt giữa các cá thể
Biến thiên do đo lường
Một PP nghiên cứu tốt khống chế và giảm thiểu
được nhiều nguồn biến thiên
SỰ BIẾN THIÊN
9/15/2010
Sai số ngẫu nhiên (random error)
Không dự đoán được
Sai số hệ thống (systematic error hoặc bias)
Nghiêm trọng hơn
Có thể dẫn đến kết quả NC không chính xác
Nhiều loại
• Sai số lựa chọn (selection bias)
• Nhiễu (confounding)
• Sai số thông tin (information bias)
SAI SỐ
9/15/2010
Giúp cho người NC tập trung vào nội dung NC
Cần được đặt ra trước khi thiết kế nghiên cứu
Cần phải được chuyển sang dạng giả thuyết khoa học
Xác định biến độc lập, phụ thuộc
Đo lường chúng như thế nào?
Phiên giải các mối quan hệ như thế nào?
CÂU HỎI NGHIÊN CỨU
9/15/2010
Chủ đề NC: “Sự hài lòng của các bác sỹ lâm sàng”
Câu hỏi NC: “có sự khác nhau về sự hài lòng của
các bác sỹ ở những khoa điều trị khác nhau
không?”
Biến số:
Biến phụ thuộc: Sự hài lòng của các bác sỹ
Biến độc lập: Khoa điều trị
VÍ DỤ
9/15/2010
Giả thuyết khoa học được đổi thành:
Giả thuyết không (H0)
Đối thuyết/Giả thuyết đối (H1)
Ví dụ:
H0: Sự hài lòng như nhau
H1: Sự hài lòng khác nhau
H0: Sự hài lòng như nhau
H1: Các bác sỹ làm hệ ngoại sản hài
lòng với công việc hơn BS hệ nội nhi
Kiểm định 2 phía Kiểm định 1 phía
GIẢ THUYẾT KHOA HỌC
9/15/2010
Kiểm định thống kê : tính toán giá trị thống kê để nhằm
bác bỏ giả thuyết H0
Ví dụ:
Không đủ bằng chứng để bác bỏ H0, như vậy, chúng ta kết luận
nghiên cứu cho thấy không có mối liên quan giữa làm ở các
khoa điều trị và sự hài lòng của các bác sỹ
Hoặc
Có đủ bằng chứng để bác bỏ H0 có mối liên quan giữa việc
làm ở khoa điều nào với sự hài lòng của các bác sỹ.
GIẢ THUYẾT KHOA HỌC [CONT.]
9/15/2010
CÁC THÀNH PHẦN THIẾT KẾ
Các thành phần thiết kế ảnh hưởng tới phân tích
Đơn vị quan sát
Phương pháp chọn mẫu
Các biến đầu ra
9/15/2010
Đơn vị quan sát
Là một thành phần: người, động vật, cơ sở Y tế
Quan sát
Số lần quan sát, thu thập số liệu về một đơn vị quan sát
Nghiên cứu 1 lần:
Đơn vị quan sát = số quan sát
So sánh giữa các đơn vị quan sát
Nghiên cứu giữa các đối tượng
Nghiên cứu lặp lại:
một ĐVQS được quan sát nhiều lần
So sánh giữa các đơn vị quan sát
So sánh giữa các lần quan sát
Nghiên cứu trong/Giữa các đối tượng
ĐƠN VỊ QUAN SÁT
9/15/2010
Mẫu được chọn như thế nào?
Mẫu được chọn từ quần thể nào?
Mục đích chọn ra nhóm đại diện để nghiên cứu
Mỗi một cách chọn mẫu đều có ảnh hưởng khác nhau
đến việc ước lượng sai số chuẩn và khoảng tin cậy.
PHƯƠNG PHÁP CHỌN MẪU
9/15/2010
Xác định thông qua câu hỏi nghiên cứu
Biến thuộc loại gì:
Liên tục
Biến phân loại
• Nhị thức
• Định danh
• Thứ bậc
BIẾN ĐẦU RA
9/15/2010
1. Câu hỏi nghiên cứu là gì?
2. Thiết kế nghiên cứu là thực nghiệm hay quan sát?
3. Đơn vị quan sát là gì?
4. Phương pháp chọn mẫu như thế nào?
5. Đo lường lặp lại hay một lần?
6. Biến đầu ra là gì?
7. Biến loại gì: liên tục, phân loại?
8. Những nhóm nào được so sánh?
BẢNG KIỂM PHÂN TÍCH SỐ LIỆU
BỘ MÔN THỐNG KÊ Y TẾ-ĐHYTCC
TIẾN HÀNH
PHÂN TÍCH
9/15/2010
Nhập số liệu vào máy
Epi Info, EpiData
Làm sạch
Kiểm tra các giá trị sai sót: Mã hóa, nhập phiếu
Kiểm tra tính đồng nhất
Phân tích số liệu
QUẢN LÝ SỐ LIỆU
9/15/2010
Dựa vào mục tiêu nghiên cứu
Mô tả:
• Biến số quan trọng: định lượng/phân loại
• Quy mô, phân bố của yếu tố nghiên cứu (con người,
thời gian, địa điểm)
Phân tích/ so sánh
• Hình thành giả thuyết và kiểm định giả thuyết
• So sánh tìm sự khác biệt
• Xác định, mô tả mối liên quan và sự kết hợp
CHIẾN LƯỢC PHÂN TÍCH
9/15/2010
Bảng giả định các kết quả nghiên cứu
Thiết lập khi tiến hành thiết kế nghiên cứu
Dựa vào các biến (thông tin) trong bộ câu hỏi điều tra
Bảng
Mô tả: các nội dung mô tả
Phân tích:
• các biến dự kiến phân tích
• Kiểm định thống kê sẽ sử dụng
XÂY DỰNG BẢNG GIẢ
9/15/2010
Bảng 1: Tình trạng dinh dưỡng của trẻ
Chỉ số Loại n Tỷ lệ 95% CI
Nhẹ cân
(W/A)
Bình thường
Nhẹ
Độ 1
Độ 2
Còi cọc
(H/A)
Bình thường
Nhẹ
Độ 1
Độ 2
VÍ DỤ
9/15/2010
Bảng 2: So sánh thu nhập trung bình
Xã n TB Std. Err. Std. Dev. [KTC 95% ]
Sao Do
An Lac
Chung
t, p-value
VÍ DỤ
9/15/2010
Biến định lượng
Đo lường độ tập trung: trung bình, trung vị
Đo lường độ phân tán: phương sai, độ lệch chuẩn
Sự phân bố: chuẩn, lệch trái, lệch phải
Các giá trị ngoài khoảng (bất thường)
PHÂN TÍCH MÔ TẢ
9/15/2010
Age in month
60.0
55.0
50.0
45.0
40.0
35.0
30.0
25.0
20.0
15.0
10.0
5.0
Age in month
F
re
q
u
e
n
cy
700
600
500
400
300
200
100
0
Std. Dev = 13.69
Mean = 27.5
N = 4164.00
N 4164
Trung binh 27.48
Trung vi 25.00
SD 13.69
Minimum 3
Maximum 60
VÍ DỤ
9/15/2010
Biến phân loại
Đo lường độ tập trung: tỷ lệ
Đo lường độ phân tán: bảng phân phối tần số
PHÂN TÍCH MÔ TẢ [CONT.]
9/15/2010
Chỉ số Loại n Tỷ lệ % 95% CI
Nhẹ cân
(W/A)
Bình thường 1311 31.5 30.1 – 32.9
Nhẹ 1599 38.4 36.9 - 39.9
Độ 1 986 23.7 22.4 – 25.0
Độ 2 268 6.4 5.7 – 7.2
Còi cọc
(H/A)
Bình thường 117 2.8 2.3 – 3.4
Nhẹ 2000 48.0 46.5 – 49.6
Độ 1 1171 28.1 26.8 – 29.5
Độ 2 876 21.0 19.8 – 22.3
VÍ DỤ
9/15/2010
BIẾN ĐỊNH LƯỢNG
So sánh
Kiểm định trung bình:
• 2 trung bình độc lập : t-test
• 2 trung bình lặp lại : t –ghép cặp
• nhiều trung bình : ANOVA
Mối quan hệ không định hướng
Hệ số tương quan r
Mối quan hệ định hướng
Hồi quy tuyến tính
PHÂN TÍCH MỐI LIÊN QUAN
9/15/2010
Degrees of freedom: 2822
Ho: mean(Sao Do) - mean(An Lac) = diff = 0
Ha: diff 0
t = 13.0776 t = 13.0776 t = 13.0776
P t = 0.0000 P > t = 0.000
Group Obs Mean Std. Err. Std. Dev. [95% Conf. Interval]
Sao Do 1336 1794524 65030.55 2376953 1666950 1922097
An Lac 1488 903472 27554.39 1062900 849422.4 957521.6
combined 2824 1325018 35027.96 1861432 1256335 1393701
diff 891051.5 68135.77 757450.6 1024652
VÍ DỤ
9/15/2010
BIẾN PHÂN LOẠI
So sánh
• 2 tỷ lệ : z-test, Khi bình phương
• nhiều tỷ lệ : Khi bình phương
Mối quan hệ định hướng
Hồi quy logistics
PHÂN TÍCH MỐI LIÊN QUAN
9/15/2010
OR=7.7 (95%CI: 1,4-40,6)
Chi square=5.66, p_value=0.0173
E NE Tổng
D 12 2 14
ND 7 9 16
Tổng 19 11 30
VÍ DỤ
9/15/2010
Bệnh Không Tổng
Tốt n 7 12 19
% 36.84 63.16 100
TB n 10 5 15
% 66.67 33.33 100
Kém n 9 2 11
% 81.82 18.18 100
Tổng n 26 19 45
% 57.78 42.22 100
Chi square=6.5 p=0.039
VÍ DỤ
9/15/2010
Phân tầng
Nhiều bảng 2x2
Giá trị OR thô, hiệu chỉnh
Giá trị Khi bình phương MH
Hồi quy đa biến
PHÂN TÍCH YẾU TỐ NHIỄU
9/15/2010
i j
k l
i+j
k+l
i+k j+l
D
E
Eˉ
Dˉ
e f
g h
e+f
g+h
e+g f+h
D
E
Eˉ
Dˉ
OR1 = eh/fg OR2 = il/kj
a b
c d
a+b
c+d
a+c b+d
D
E
Eˉ
Dˉ
ORc = ad/bc
tầng 1 2
PHÂN TÍCH PHÂN TẦNG
9/15/2010
ORc = ad/bc
ORa = f(OR1, OR2), kiểm định Mantel Haenszel
Nếu ORc = ORa Không phải là nhiễu
Nếu ORc ≠ ORa, có yếu tố nhiễu
YẾU TỐ NHIỄU
9/15/2010
PHÂN TÍCH PHÂN TẦNG
30 18
70 82
48
152
100 100
D
E
Eˉ
Dˉ
ORc = ad/bc = 1.95
25 10
25 10
35
35
50 20
D
E
Eˉ
Dˉ
8
45 72
13
117
50 80
D
E
Eˉ
Dˉ
OR1 = eh/fg = 1.0 OR2 = il/kj = 1.0
Tuổi < 40 Tuổi ≥ 40
200
130 70
5
9/15/2010
PHÂN TÍCH PHÂN TẦNG
200 800
50 950
1000
1000
250 1750
D
E
Eˉ
Dˉ
ORc = ad/bc = 4.75
40 560
10 590
600
600
50 1150
D
E
Eˉ
Dˉ
160 240
40 360
400
400
200 600
D
E
Eˉ
Dˉ
OR1 = eh/fg = 6.0 OR2 = il/kj = 4.2
Tầng 1 2
2000
800 1200
9/15/2010
PHÂN TÍCH PHÂN TẦNG
ORc = ad/bc = 1.95
30 18
70 82
48
152
100 100
D
E
Eˉ
Dˉ
200
50 20
50 80
70
130
100 100
D
< 40
≥ 40
Dˉ
200
35 35
13 117
70
130
48 152
E
200
Yếu tố nhiễu có liên quan với bệnh? Yếu tố nhiễu có liên quan với phơi nhiễm?
OR = 4
≥ 40
< 40
Eˉ
OR = 9
9/15/2010
Tiêu chuẩn là yếu tố nhiễu
Giá trị ước lượng thô khác biệt với giá trị hiệu chỉnh
Các bước phân tích
Tính toán giá trị đo lường tác động (RR, OR)
Phân tầng theo yếu tố nhiễu
Phân tích trong từng tầng
Nếu tác động là như nhau, phân tích hiệu chỉnh MH
So sánh giá trị thô và hiệu chỉnh
• ORc = ORa không có nhiễu
• ORc ≠ ORa có yếu tố nhiễu
YẾU TỐ NHIỄU
9/15/2010
Chuẩn bị một bộ số liệu tốt
Làm sạch
Có bảng mã
Phân tích cụ thể, dựa vào mục tiêu
Phân tích yếu tố nhiễu
TÓM TẮT
Các file đính kèm theo tài liệu này:
- phan_tich_sl_va_bckq_1515.pdf