|
Sau khi nghiên cứu bài này, hội thảo
viên có khả năng:
(i) Hiểu được hai cách tiếp
cận trong cách tính cỡ mẫu, bao gồm khái niệm
về năng lực nghiên cứu
(ii) Biết được những yếu
tố nào ảnh hưởng đến việc tính toán
cỡ mẫu và ảnh hưởng như thế nào
(iiI) Biết được cách tính cỡ
mẫu cho những tình huống khác nhau
(iv) Biết được ảnh hưởng
của cỡ mẫu lên những khía cạnh thiết
kế khác.
(v) Ðánh giá được những vấn
đề khác của cỡ mẫu
Cỡ mẫu sẽ có ảnh hưởng
lớn đến độ chính xác của ước lượng
thống kê. Từ định lí giới hạn trung tâm chúng
ta hi vọng rằng con số trung bình được ước
lượng từ một mẫu sẽ tập trung tại
trung bình của dân số đó. Tuy vậy chúng ta cũng
biết rằng con số ước lượng sẽ không
chính xác bằng trung bình của dân số đó mà
mức độ phân tán phụ thuộc vào cỡ
mẫu: Nếu cỡ mẫu nhỏ độ phân tán
lớn, nếu cỡ mấu lớn thì độ phân tán
nhỏ và ta hi vọng số trung bình của mẫu sẽ
bằng trung bình của dân số. Người ta có
thể trình bày mức độ phân tán theo khoảng tin
cậy 95%. Nếu độ phân tán lớn thì
khoảng tin cậy 95% sẽ rộng và chúng ta khó lòng
thực sự biết được trung bình của dân
số sẽ nằm ở đâu trong khoảng này. Nói
rộng ra, nếu cỡ mẫu nhỏ chúng ta không thể
ước lượng một cách chính xác, chúng ta không
thể chứng minh sự khác biệt giữa hai nhóm là không
có ý nghĩa.
Vấn đề xác định cỡ
mẫu trong nghiên cứu khoa học là một vấn
đề quan trọng. Nếu chúng ta lấy mẫu quá
nhỏ, đến giai đoạn phân tích ta có thể
thấy được điều đó qua sự không
chính xác của uớc lượng, sự thất bại
trong chứng minh giả thuyết. Tuy vậy khi chúng ta
đã đi vào giai đoạn phân tích số liệu thì
lúc đó là quá chậm trễ để có thể
thay đổi được cỡ mẫu. Ngược
lại nếu chúng ta lấy một cỡ mẫu quá
lớn thì chúng ta rõ ràng lãng phì tiền bạc và
thời gian.
Trên cơ bản có hai cách tiếp cận
trong tính cỡ mẫu:
(a) dựa tên sự ước
lượng của một tỉ lệ, một trung bình,
hiệu số, nguy cơ tương đối
với một mức độ chính xác nhất định.
Thí dụ, để ước lượng tỉ leẹ
trẻ em trong lứa từ 12-23 tháng tuổi được
tiêm chủng đầy đủ (với độ chính xác)
trong vòng 10%. Câu hỏi chìa khóa của cách tiếp
cận này là khoảng tin cậy sẽ là bao nhiêu?
(b) Dựa trên kiểm
định giả thuyết. Thí dụ,so sánh thời gian bú
sữa mẹ hoàn toàn ở 2 nhóm có giáo dục sức
khỏe và nhóm chứng.Câu hỏi chìa khóa trong cách
tiếp cận này là xác suất kết luận sai lầm
trong kiểm định giả thuyết là bao nhiêu?
Ðộ chính xác của một ước lượng
(với khoảng tin cậy 95%) = d có nghĩa là sai số
tối đa của ước lượng là d (với
độ tin cậy 95% hay xác suất điều trên không
bị sai là 95%)
Công thức tính cỡ mẫu để
ước lượng khoảng tin cậy (1-a) của
một tỉ lệ p với sai số d là như sau:
Một thắc mắc hay nẩy sinh trong khi
nghiên cứu công thức này là trong khi chúng ta muốn nghiên
cứu ước lượng p nhưng trong khi tính toán
để tính cỡ mẫu chúng ta phải có giá trị
của tỉ lệ p! Toàn bộ logic của vấn đề
là ở chỗ chúng ta có thể ước lượng p
trước lúc nghiên cứu một cách không chính xác, sau
nghiên cứu chúng ta có thể ước lượng p
một cách chính xác hơn nhiều. Ta có thể ước
lượng p sử dụng phán đoán của chúng ta,
sử dụng những nghiên cứu trước đó,
có thể tiến hành nghiên cứu dẫn đường.
Trong trường hợp chúng ta không thể ước
đoán p, ta có thể ước đoán p =0,5, một
ước đoán an toàn nhất và sẽ cho một
cỡ mẫu an toàn nhất (lớn nhất).
Không có quy tắc cứng nhắc độ
chính xác d, điều này phụ thuộc vào mục đích
của nghiên cứu và vào tài nguyên hiện có.
Lưu ý:
- Công thức được trình bày là dành
cho phép lấy mẫu ngẫu nhiên đơn. Nếu nghiên
cứu sử dụng phương pháp lấy mẫu
cụm cần phải hiệu chỉnh tác động làm
giảm độ chính xác của việc chọn cụm
bằng cách tăng cỡ mẫu. Cỡ mẫu trong nghiên
cứu lấy mẫu cụm thường được
nhân lên với một hệ số (được gọi
là hệ số thiết kế) có giá trị từ 2 đến
4. Hệ số thiết kế có thể tính được
từ việc nghiên cứu thử. Nếu không có điều
kiện tính hệ số thiết kế có thể chọn
hệ số thiết kế là 3.
- Công thức tính cỡ mẫu trên là
dành lấy mẫu từ một dân số vô hạn hay khá
lớn. Nếu cỡ mẫu vào khoảng từ 10% dân
số trở lên, ta có thể điều chỉnh để
có cỡ mẫu nhỏ hơn.
Nhc=(N´P)/(N+P)
Với N là cỡ mẫu
chưa hiệu chỉnh, P là kích thước của dân
số đích và Nhc là cỡ mẫu sau khi đã
hiệu chỉnh.
- Chúng ta cũng nên phải trù liệu cho
những số liệu bị mất, những trường
hợp từ chối nghiên cứư bằng cách tăng
cỡ mẫu.
Giả sử chúng ta muốn so sánh hai
tỉ lệ (thí dụ tỉ lệ trẻ em được
bú sữa non trong hai nhóm bà mẹ: một nhóm được
giáo dục sức khỏe và một nhóm không). Chúng ta có
thể kiểm định xem hai tỉ lệnày có khác
nhau đáng kể hay không, nói cách khác kiểm định
xem hiệu số của hai tỉ lệ này có khác một
cách có ý nghĩa với zero khay không. Sau khi tiến hành phân
tích chúng ta có thể bác bỏ hay không bác bỏ giả
thuyết này. Về phương diện thống kê, dù khi
chúng ta bác bỏ hay không bác bỏ, chúng ta đều có
khả năng bị sai lầm: sai lầm mà chúng ta
mắc phải khi bác bỏ giả thuyết được
gọi là sai lầm loại I, sai lầm chúng ta
mắc phải khi không bác bỏ được gọi là
sai lầm loại II.
Khi kiểm định
H0: p1=p2
|
Tình huống thực p1=p2
|
Tình huống thực p1
<>p2
|
Bác bỏ giả thuyết H0
|
Sai lầm
loại 1 |
Kết luận
đúng |
Không bác bỏ giả
thuyết H0
|
Kết luận
đúng |
Sai lầm
loại II |
Lí tưởng, chúng ta muốn giảm
thiểu cả hai loại sai lầm trong nghiên cứu. Lưu
ý rằng chúng ta đã định nghĩa cái gọi là
năng lực (power) của nghiên cứu=1-sai lầm
loại II. Năng lực là xác suất đạt
được kết quả có ý nghĩa thống kê
nếu thực sự có sự khác biệt giữa p1 và
p2. Mục tiêu của chúng ta khi chọn cỡ mẫu là
nếu có sự khác biệt về lâm sàng quan trọng
giữa hai nhóm, chúng ta có cơ hội tốt để tìm
thấy sự khác biệt có ý nghĩa thống kê trong 2
nhóm. Ðiều này là một ý niệm hết sức quan
trọng trong thiết kế nghiên cứu và lí giải.
Nếu trong giai đoạn phân tích nếu kết quả là
có ý nghĩa thống kê, thì hầu hết mọi người
đều thỏa mãn. Mặt khác nếu kết quả không
có ý nghĩa thông kê thì điều này có thể xảy
ra do (a) không có sự khác biệt thực sự giữa
hai nhóm và (b) có sự khác biệt nhưng mẫu của
chúng ta không cho thấy sự khác biệt bởi vì năng
lực của mẫu thấp (cơ mẫu nhỏ) do đó
chúng ta không có kết luận rõ ràng. Do đó, nếu chúng
ta chọn mẫu để có năng lực cao và
kết quả không có ý nghĩa thống kê thì chúng ta có
thể chắc hơn về sự khác biệt.
Ðể chọn cỡ mẫu (trong trường
hợp cỡ mẫu của 2 nhóm so sánh bằng nhau), chúng
ta phải có 4 tham số
- Sai lầm loại I hay còn gọi là
mức ý nghĩa mà chúng ta muốn có trong nghiên cứu (thường
là 5%)
- Sai lầm loại II chúng ta muốn có
trong nghiên cứu (Sai lầm loại hai khoảng 10-20% tương
ứng với năng lực từ 80-90%)
- Tỉ lệ trong một nhóm cơ bản
(thí dụ tỉ lệ tiếp xúc với yếu tố
nguy cơ trong nhóm chứng của một nghiên cứu
bệnh chứng)
- Tỉ lệ trong một nhóm khác (thí
dụ tỉ lệ tiếp xúc với yếu tố nguy cơ
trong nhóm bệnh của một nghiên cứu bệnh
chứng). Đôi khi chúng ta không trình bày tỉ lệ
của nhóm này một cách cụ thể mà trình bày nguy cơ
tương đối hay tỉ số số chênh mà chúng
ta mong muốn phát hiện trong một nghiên cứu đoàn
hệ hay nghiên cứu bệnh chứng.
Công thức tính cỡ mẫu (cho mỗi nhóm)
để so sánh hai tỉ lệ p1 và p2 của hai nhóm:
- Như đã nói ở trên, cách tính
cỡ mẫu chỉ cho chúng ta một ước lượng
thô của cõ mẫu cần thiết bởi vì nó dựa
trên sự ước đoán về giá trị của thông
số, quyết định chủ quan của chúng ta
về hậu quả mà chúng ta muốn phát hiện và công
thức được sử dụng là công thức
gần đúng. Do đó con số tính ra giúp chúng ta phân
biệt giữa cỡ mẫu 50 và 100 chứ không phân
biệt cỡ mẫu 50 và 53.
- Chúng ta phải cân đối
giữa điều chúng ta mong muốn và tính khả thi.
Ðôi khi có thể dùng công thức tính cỡ
mẫu để đi ngược lại năng lực
của nghiên cứu. Thí dụ nếu chúng ta có một
kinh phí hạn chế để thực hiện một
nghiên cứu nên chỉ có một cỡ mẫu
nhất định. Chúng ta có thể tính ngược
lại từ cỡ mẫu để biết năng
lực của nghiên cứu. Nếu hóa ra năng lực
của nghiên cứu rất thấp (thí dụ như
20%) tốt nhất chung ta không nên tiến hành nghiên
cứu vì chúng ta đã nắm chắc kết
quả thất bại.
- Nếu một nghiên cứu có nhiều
mục tiêu thì cỡ mẫu đủ cho một mục tiêu
này có thể không đủ cho mục tiêu khác. Ðể tính
cỡ mẫu, tốt nhất phải chú trọng vào
biến số (hoặc những biến số quan trọng
nhất).
- Tính cỡ mẫu không khó, cái khó là
phải cung cấp những giả định của nghiên
cứu: sai lầm loại một, năng lực, sự khác
biệt mà chúng ta muốn phát hiện.
Lưu ý: Trong cách tính cỡ mẫu ước
lượng một tỉ lệ, chúng ta thấy có một
tham số Design effect. Tham số dùng để điều
chỉnh nếu chúng ta lấy mẫu theo cụm. Do đó
nếu ta lấy mẫu ngẫu nhiên đơn thì Design
effect=1. Nếu chúng ta lấy mẫu theo cụm thì
tham số này sẽ lớn hơn 1 và độ lớn
cụ thể thì phụ thuộc vào mức độ không
đồng nhất giữa các cụm.
Nếu chúng ta lấy mẫu theo cụm thì
chọn Design effect là bao nhiêu? Thông thường chúng ta có
thể tham khảo các nghiên cứu trước hoặc làm
nghiên cứu pilot để xác định mức độ
không đồng nhất. Nếu chúng ta có kinh nghiệm chúng
ta có thể dùng trực giác để phán đoán design
effect. Nếu chúng ta không có kinh nghiệm, không tìm
được tài liệu tham khảo và không thể
tiến hành nghiên cứu pilot, chúng ta chọn Design effect = 2
để có cỡ mẫu đảm bảo an toàn (Design
effect hiếm khi nào lớn hơn 2).
Thí dụ 1: Cho một nghiên cứu bệnh
chứng, sử dụng những giả định sau
để tính cỡ mẫu cho từng trường
hợp
Năng lực của nghiên cứu = 90%;
mức ý nghĩa = 5%; 1 bệnh cho một chứng
|
% chứng tiếp xúc
với yếu tố nguy cơ
|
||||
OR
|
5%
|
20%
|
50%
|
70%
|
90%
|
1.5
|
2346 |
|
|
|
|
2
|
|
244 |
|
|
|
5
|
|
|
46 |
|
|
10
|
|
|
|
50 |
|
1. Dựa trên phép tính cỡ mẫu hãy
đưa ra khuyến cáo khi nào nên dùng nghiên cứu
bệnh chứng và khi nào không.
2. Hãy tính cỡ mẫu trong một nghiên
cứu bệnh chứng có năng lực =90%, mức ý nghĩa
=5% OR= 2 và tỉ lệ tiếp xúc với yếu tố
nguy cơ là 30%. Hãy tính cỡ mẫu khi có 1 chứng: 1
bệnh; 2 chứng: 1 bệnh; 3 chứng: 1 bệnh.
Thí dụ 2: Cho một nghiên cứu đoàn
hệ, sử dụng những giả định sau để
tính cỡ mẫu cho từng trường hợp
Năng lực của nghiên cứu = 90%;
mức ý nghĩa = 5%; nhóm có tiếp xúc= nhóm không tiếp
xúc
|
tỉ
suất mắc bệnh trong nhóm không tiếp xúc
với yếu tố nguy cơ |
||||
RR |
0,1% |
1% |
5% |
15% |
30% |
1.5 |
108,904 |
|
|
|
|
2 |
|
3300 |
|
|
|
3 |
|
|
207 |
|
|
5 |
|
|
|
15 |
|
1. Dựa trên phép tính cỡ mẫu hãy
đưa ra khuyến cáo khi nào nên dùng nghiên cứu đoàn
hệ và khi nào không.
2. Hãy tính cỡ mẫu trong một nghiên
cứu bệnh chứng có năng lực =90%, mức ý nghĩa
=5% OR= 2 và tỉ suất mắc bệnh là 5%. Hãy tính
cỡ mẫu khi có nhóm không tiếp xúc = nhóm tiếp xúc;
nhóm không tiếp xúc = 2 nhóm tiếp xúc; nhóm không tiếp
xúc = 3 nhóm tiếp xúc
Thí dụ 3: Phòng y tế huyện A. muốn kiểm tra báo cáo về tỉ lệ tiêm chủng của một xã là 80% bằng cách tiến hành một cuộc điều tra (với sai số tuyệt đối dưới 5%, độ tin cậy = 95%). Nếu phòng y tế quyết định chọn mẫu bằng phương pháp chọn mẫu ngẫu nhiên thì cỡ mẫu cần thiết là bao nhiêu? Nếu chọn theo cụm thì cỡ mẫu cần thiết là bao nhiêu?
===