Các phương pháp chọn mẫu xác suất

Có hai loại phương pháp lấy mẫu chính, phương pháp chọn mẫu xác suất trong đó các đối tượng trong quần thể mục tiêu đều có cơ hội được chọn trong mẫu như nhau, và phương pháp chọn mẫu phi xác suất trong đó tập hợp mẫu được chọn trong một quy trình phi hệ thống.

Nghiên cứu lâm sàng thường liên quan đến những bệnh nhân mắc một bệnh hoặc một tình trạng nào đó. Tính tổng quát của các kết quả nghiên cứu lâm sàng dựa trên nhiều yếu tố liên quan đến giá trị bên trong và bên ngoài của các phương pháp nghiên cứu. Vấn đề phương pháp luận chính ảnh hưởng đến tính tổng quát của các kết quả nghiên cứu lâm sàng là phương pháp lấy mẫu.

Trong nghiên cứu lâm sàng, định nghĩa quần thể là một nhóm người có chung một đặc điểm hoặc một tình trạng bệnh, thường là bệnh. Nếu chúng ta đang thực hiện một nghiên cứu trên những bệnh nhân bị đột quỵ do thiếu máu cục bộ thì sẽ rất khó để bao gồm toàn bộ uần thể đột quỵ do thiếu máu cục bộ trên toàn thế giới. Rất khó để xác định vị trí của toàn bộ dân cư ở khắp mọi nơi và để có thể tiếp cận với tất cả các tầng lớp dân cư. Do đó, cách tiếp cận thực tế trong nghiên cứu lâm sàng là một phần của quần thể này, được gọi là “quần thể mẫu”. Toàn bộ quần thể đôi khi được gọi là “quần thể mục tiêu” trong khi quần thể mẫu được gọi là “quần thể nghiên cứu. Khi thực hiện một nghiên cứu, chúng ta nên coi mẫu là đại diện cho quần thể mục tiêu, càng nhiều càng tốt, với ít sai số nhất có thể và không có sự thay thế hoặc không đầy đủ.

Các loại lấy mẫu

Có hai loại phương pháp lấy mẫu chính: (1) phương pháp chọn mẫu xác suất trong đó tất cả các đối tượng trong quần thể mục tiêu đều có cơ hội được chọn trong mẫu như nhau; và (2) phương pháp chọn mẫu phi xác suất trong đó tập hợp mẫu được chọn trong một quy trình phi hệ thống không đảm bảo cơ hội như nhau cho mỗi đối tượng trong tổng thể mục tiêu. Các mẫu được chọn bằng cách sử dụng phương pháp lấy mẫu xác suất là các mẫu đại diện hơn cho quần thể mục tiêu.

Phương pháp lấy mẫu xác suất

Phương pháp lấy mẫu ngẫu nhiên đơn giản

Phương pháp này được sử dụng khi toàn bộ quần thể có thể tiếp cận được và các điều tra viên có danh sách tất cả các đối tượng trong nhóm đối tượng này. Danh sách tất cả các đối tượng trong tổng thể này được gọi là "khung lấy mẫu". Từ danh sách này, chúng tôi rút ra một mẫu ngẫu nhiên theo phương pháp xổ số hoặc sử dụng danh sách ngẫu nhiên do máy tính tạo ra.

Lấy mẫu ngẫu nhiên phân tầng

Phương pháp này là một sửa đổi của lấy mẫu ngẫu nhiên đơn giản, do đó, nó yêu cầu điều kiện của khung lấy mẫu cũng có sẵn. Tuy nhiên, trong phương pháp này, toàn bộ quần thể được chia thành các tầng lớp hoặc phân nhóm đồng nhất theo yếu tố nhân khẩu học (ví dụ: giới tính, tuổi tác, tôn giáo, trình độ kinh tế xã hội, giáo dục hoặc chẩn đoán, v.v.). Sau đó, các nhà nghiên cứu chọn rút một mẫu ngẫu nhiên từ các tầng khác nhau. Ưu điểm của phương pháp này là: (1) nó cho phép các nhà nghiên cứu thu được kích thước ảnh hưởng từ mỗi tầng riêng biệt, như thể đó là một nghiên cứu khác. Do đó, sự khác biệt giữa các nhóm trở nên rõ ràng và (2) nó cho phép lấy mẫu từ các nhóm quần thể thiểu số / ít được đại diện. Nếu các nhà nghiên cứu sử dụng phương pháp chọn mẫu ngẫu nhiên đơn giản, thì quần thể thiểu số cũng sẽ không có đại diện trong mẫu. Đơn giản, vì phương pháp ngẫu nhiên đơn giản thường đại diện cho toàn bộ tổng thể mục tiêu. Trong trường hợp này, các nhà điều tra có thể sử dụng tốt hơn mẫu ngẫu nhiên phân tầng để thu được các mẫu đầy đủ từ tất cả các tầng trong quần thể.

Lấy mẫu ngẫu nhiên có hệ thống (lấy mẫu theo khoảng thời gian)

Trong phương pháp này, các điều tra viên lựa chọn các đối tượng đưa vào mẫu dựa trên một quy tắc có hệ thống, sử dụng một khoảng thời gian cố định. Ví dụ: Nếu quy tắc là bao gồm bệnh nhân cuối cùng từ mỗi 5 bệnh nhân. Chúng tôi sẽ bao gồm những bệnh nhân có những con số này (5, 10, 15, 20, 25, ... vv.). Trong một số tình huống, không cần thiết phải có khung lấy mẫu nếu có một bệnh viện hoặc trung tâm cụ thể mà bệnh nhân đến khám thường xuyên. Trong trường hợp này, nhà nghiên cứu có thể bắt đầu ngẫu nhiên và sau đó chọn các bệnh nhân tiếp theo một cách hệ thống bằng cách sử dụng một khoảng thời gian cố định.

Lấy mẫu theo cụm (lấy mẫu nhiều tầng)

Nó được sử dụng khi việc tạo khung lấy mẫu là gần như không thể do quy mô quần thể lớn. Trong phương pháp này, quần thể được chia theo vị trí địa lý thành các cụm. Một danh sách tất cả các cụm được lập và các nhà điều tra rút ra một số lượng ngẫu nhiên các cụm để đưa vào. Sau đó, họ liệt kê tất cả các cá nhân trong các cụm này và chạy một lượt lựa chọn ngẫu nhiên khác để có được một mẫu ngẫu nhiên cuối cùng chính xác như lấy mẫu ngẫu nhiên đơn giản. Phương pháp này được gọi là nhiều giai đoạn bởi vì việc lựa chọn được thực hiện với hai giai đoạn: đầu tiên là lựa chọn các cụm đủ điều kiện, sau đó, chọn mẫu từ các cá thể của các cụm này. Một ví dụ cho điều này, nếu chúng tôi đang thực hiện một dự án nghiên cứu về học sinh tiểu học. Sẽ rất khó để có được danh sách tất cả học sinh tiểu học trên cả nước.

Phương pháp lấy mẫu phi xác suất

Lấy mẫu thuận tiện

Mặc dù là phương pháp chọn mẫu phi xác suất nhưng đây là phương pháp được áp dụng nhiều nhất và được sử dụng rộng rãi trong nghiên cứu lâm sàng. Trong phương pháp này, các nhà điều tra ghi danh các đối tượng tùy theo tính sẵn có và khả năng tiếp cận của họ. Do đó, phương pháp này nhanh chóng, ít tốn kém và tiện lợi. Nó được gọi là lấy mẫu thuận tiện khi nhà nghiên cứu lựa chọn các phần tử mẫu theo khả năng tiếp cận thuận tiện và gần gũi của chúng. Ví dụ: giả sử rằng chúng tôi sẽ thực hiện một nghiên cứu thuần tập trên bệnh nhân bị nhiễm vi rút Viêm gan C (HCV). Mẫu tiện lợi ở đây sẽ được giới hạn trong nhóm đối tượng có thể tiếp cận được đối với nhóm nghiên cứu. Đối tượng có thể tiếp cận được là những bệnh nhân HCV đang điều trị tại Bệnh viện A và Bệnh viện B. Do đó, trong thời gian nghiên cứu, tất cả bệnh nhân đến khám tại hai bệnh viện này và đáp ứng đủ điều kiện sẽ được đưa vào nghiên cứu này.

Lấy mẫu theo phán đoán

Trong phương pháp này, các đối tượng được lựa chọn theo sự lựa chọn của các điều tra viên. Nhà nghiên cứu giả định các đặc điểm cụ thể cho mẫu (ví dụ tỷ lệ nam / nữ = 2/1) và do đó, họ đánh giá mẫu phù hợp để đại diện cho quần thể. Phương pháp này bị chỉ trích rộng rãi do khả năng sai lệch bởi phán đoán của điều tra viên.

Chọn mẫu bóng tuyết

Phương pháp này được sử dụng khi quần thể không thể được định vị ở một nơi cụ thể và do đó, việc tiếp cận quần thể này là khác nhau. Trong phương pháp này, điều tra viên yêu cầu mỗi đối tượng cho phép tiếp cận với các đồng nghiệp từ cùng một quần thể. Tình trạng này thường xảy ra trong nghiên cứu khoa học xã hội, chẳng hạn, nếu chúng ta thực hiện một cuộc khảo sát về trẻ em lang thang, sẽ không có danh sách trẻ em lang thang cơ nhỡ và rất khó để xác định quần thể này ở một nơi, ví dụ như trường học / bệnh viện. Tại đây, các điều tra viên sẽ giao bản khảo sát cho một đứa trẻ sau đó yêu cầu nó đưa chúng cho đồng nghiệp của mình hoặc giao bản khảo sát cho họ

Phương pháp chọn mẫu trong nghiên cứu khoa học (NCKH)

(Nguồn: my.opera.com/xahoihoc/blog/)

Điều tra chọn mẫu có nghĩa là không tiến hành điều tra hết toàn bộ các đơn vị của tổng thể, mà chỉ điều tra trên 1 số đơn vị nhằm để tiết kiệm thời gian, công sức và chi phí. Từ những đặc điểm và tính chất của mẫu ta có thể suy ra được đặc điểm và tính chất của cả tổng thể đó. Vấn đề quan trọng nhất là đảm bảo cho tổng thể mẫu phải có khả năng đại diện được cho tổng thể chung.

Quá trình tổ chức điều tra chọn mẫu thường gồm 6 bước sau:

– Xác định tổng thể chung (ta phải xác định rõ tổng thể chung, bởi vì ta sẽ chọn mẫu từ đó)

– Xác định khung chọn mẫu hay danh sách chọn mẫu:Các khung chọn mẫu có sẵn, thường được sử dụng là: Các danh bạ điện thoại hay niên giám điện thoại xếp theo tên cá nhân, công ty, doanh nghiệp, cơ quan; các niên giám điện thoại xếp theo tên đường, hay tên quận huyện thành phố; danh sách liên lạc thư tín : hội viên của các câu lạc bộ, hiệp hội, độc giả mua báo dài hạn của các toà soạn báo…; danh sách tên và địa chỉ khách hàng có liên hệ với công ty (thông qua phiếu bảo hành), các khách mời đến dự các cuộc trưng bày và giới thiệu sản phẩm

– Lựa chọn phương pháp chọn mẫu: Dựa vào mục đích nghiên cứu, tầm quan trọng của công trình nghiên cứu, thời gian tiến hành nghiên cứu, kinh phí dành cho nghiên cứu, kỹ năng của nhóm nghiên cứu,… để quyết định chọn phương pháp chọn mẫu xác suất hay phi xác suất; sau đó tiếp tục chọn ra hình thức cụ thể của phương pháp này.

– Xác định quy mô mẫu (sample size): Xác định quy mô mẫu thường dựa vào : yêu cầu về độ chính xác, khung chọn mẫu đã có sẵn chưa, phương pháp thu thập dữ liệu, chi phí cho phép. Đối với mẫu xác suất: thường có công thức để tính cỡ mẫu; đối với mẫu phi xác suất: thường dựa vào kinh nghiệm và sự am hiểu về vấn đề nghiên cứu để chọn cỡ mẫu.

– Xác định các chỉ thị để nhận diện được đơn vị mẫu trong thực tế: Đối với mẫu xác suất: phải xác định rõ cách thức để chọn từng đơn vị trong tổng thể chung vào mẫu sao cho đảm bảo mọi đơn vị đều có khả năng được chọn như nhau.

– Kiểm tra quá trình chọn mẫu: thường kiểm tra trên các mặt sau: Kiểm tra đơn vị trong mẫu có đúng đối tượng nghiên cứu không? (vì thường mắc sai lầm ở khâu chọn đối tượng: do thu thập thông tin ở nơi không thích hợp, ở những người không thích hợp, hoặc bỏ qua thông tin của những người lẽ ra phải được phỏng vấn…). Kiểm tra sự cộng tác của người trả lời (hỏi càng dài thì sự từ chối trả lời càng lớn). Kiểm tra tỷ lệ hoàn tất (xem đã thu thập đủ số đơn vị cần thiết trên mẫu chưa) : trong phỏng vấn bằng thư có khi thư bị trả lại do không có người nhận, trong phỏng vấn bằng điện thoại có thể không tiếp xúc được với người cần hỏi vì họ không có mặt hay họ không có điện thoại.

Đi sâu vào phương pháp chọn mẫu ta có 2 phương pháp chọn mẫu cơ bản là :

1-Phương pháp chọn mẫu ngẫu nhiên (probability sampling methods):

Các phương pháp chọn mẫu xác suất

Chọn mẫu ngẫu nhiên (hay chọn mẫu xác suất) là phương pháp chọn mẫu mà khả năng được chọn vào tổng thể mẫu của tất cả các đơn vị của tổng thể đều như nhau. Đây là phương pháp tốt nhất để ta có thể chọn ra một mẫu có khả năng đại biểu cho tổng thể. Vì có thể tính được sai số do chọn mẫu, nhờ đó ta có thể áp dụng được các phương pháp ước lượng thống kê, kiểm định giả thuyết thống kê trong xử lý dữ liệu để suy rộng kết quả trên mẫu cho tổng thể chung

Tuy nhiên ta khó áp dụng phương pháp này khi không xác định được danh sách cụ thể của tổng thể chung (ví dụ nghiên cứu trên tổng thể tiềm ẩn); tốn kém nhiều thời gian, chi phí, nhân lực cho việc thu thập dữ liệu khi đối tượng phân tán trên nhiều địa bàn cách xa nhau,…

* Các phương pháp chọn mẫu ngẫu nhiên:

Chọn mẫu ngẫu nhiên đơn giản (simple random sampling):

Các phương pháp chọn mẫu xác suất

Trước tiên lập danh sách các đơn vị của tổng thể chung theo một trật tự nào đó : lập theo vần của tên, hoặc theo quy mô, hoặc theo địa chỉ…, sau đó đánh số thứ tự các đơn vị trong danh sách; rồi rút thăm, quay số, dùng bảng số ngẫu nhiên, hoặc dùng máy tính để chọn ra từng đơn vị trong tổng thể chung vào mẫu.

Thường vận dụng khi các đơn vị của tổng thể chung không phân bố quá rộng về mặt địa lý, các đơn vị khá đồng đều nhau về đặc điểm đang nghiên cứu. Thường áp dụng trong kiểm tra chất lượng sản phẩm trong các dây chuyền sản xuất hàng loạt.

Chọn mẫu ngẫu nhiên hệ thống(systematic sampling):

Các phương pháp chọn mẫu xác suất

Trước tiên lập danh sách các đơn vị của tổng thể chung theo một trật tự quy ước nào đó, sau đó đánh số thứ tự các đơn vị trong danh sách. Đầu tiên chọn ngẫu nhiên 1 đơn vị trong danh sách ; sau đó cứ cách đều k đơn vị lại chọn ra 1 đơn vị vào mẫu,…cứ như thế cho đến khi chọn đủ số đơn vị của mẫu. Ví dụ : Dựa vào danh sách bầu cử tại 1 thành phố, ta có danh sách theo thứ tự vần của tên chủ hộ, bao gồm 240.000 hộ. Ta muốn chọn ra một mẫu có 2000 hộ. Vậy khoảng cách chọn là : k= 240000/2000 = 120, có nghĩa là cứ cách 120 hộ thì ta chọn một hộ vào mẫu.

Chọn mẫu cả khối (cluster sampling):

Các phương pháp chọn mẫu xác suất

Trước tiên lập danh sách tổng thể chung theo từng khối (như làng, xã, phường, lượng sản phẩm sản xuất trong 1 khoảng thời gian…). Sau đó, ta chọn ngẫu nhiên một số khối và điều tra tất cả các đơn vị trong khối đã chọn. Thường dùng phương pháp này khi không có sẵn danh sách đầy đủ của các đơn vị trong tổng thể cần nghiên cứu. Ví dụ : Tổng thể chung là sinh viên của một trường đại học. Khi đó ta sẽ lập danh sách các lớp chứ không lập danh sách sinh viên, sau đó chọn ra các lớp để điều tra.

Chọn mẫu phân tầng (stratified sampling):

Các phương pháp chọn mẫu xác suất

Trước tiên phân chia tổng thể thành các tổ theo 1 tiêu thức hay nhiều tiêu thức có liên quan đến mục đích nghiên cứu (như phân tổ các DN theo vùng, theo khu vực, theo loại hình, theo quy mô,…). Sau đó trong từng tổ, dùng cách chọn mẫu ngẫu nhiên đơn giản hay chọn mẫu hệ thống để chọn ra các đơn vị của mẫu. Đối với chọn mẫu phân tầng, số đơn vị chọn ra ở mỗi tổ có thể tuân theo tỷ lệ số đơn vị tổ đó chiếm trong tổng thể, hoặc có thể không tuân theo tỷ lệ. Ví dụ : Một toà soạn báo muốn tiến hành nghiên cứu trên một mẫu 1000 doanh nghiệp trên cả nước về sự quan tâm của họ đối với tờ báo nhằm tiếp thị việc đưa thông tin quảng cáo trên báo. Toà soạn có thể căn cứ vào các tiêu thức : vùng địa lý (miền Bắc, miền Trung, miền Nam) ; hình thức sở hữu (quốc doanh, ngoài quốc doanh, công ty 100% vốn nước ngoài,…) để quyết định cơ cấu của mẫu nghiên cứu.

Chọn mẫu nhiều giai đoạn (multi-stage sampling):

Phương pháp này thường áp dụng đối với tổng thể chung có quy mô quá lớn và địa bàn nghiên cứu quá rộng. Việc chọn mẫu phải trải qua nhiều giai đoạn (nhiều cấp). Trước tiên phân chia tổng thể chung thành các đơn vị cấp I, rồi chọn các đơn vị mẫu cấp I. Tiếp đến phân chia mỗi đơn vị mẫu cấp I thành các đơn vị cấp II, rồi chọn các đơn vị mẫu cấp II…Trong mỗi cấp có thể áp dụng các cách chọn mẫu ngẫu nhiên đơn giản, chọn mẫu hệ thống, chọn mẫu phân tầng, chọn mẫu cả khối để chọn ra các đơn vị mẫu. Ví dụ :Muốn chọn ngẫu nhiên 50 hộ từ một thành phố có 10 khu phố, mỗi khu phố có 50 hộ. Cách tiến hành như sau : Trước tiên đánh số thứ tự các khu phố từ 1 đến 10, chọn ngẫu nhiên trong đó 5 khu phố. Đánh số thứ tự các hộ trong từng khu phố được chọn. Chọn ngẫu nhiên ra 10 hộ trong mỗi khu phố ta sẽ có đủ mẫu cần thiết.

2-Phuơng pháp chọn mẫu phi ngẫu nhiên (non-probability sampling methods):

Chọn mẫu phi ngẫu nhiên (hay chọn mẫu phi xác suất) là phương pháp chọn mẫu mà các đơn vị trong tổng thể chung không có khả năng ngang nhau để được chọn vào mẫu nghiên cứu. Chẳng hạn: Ta tiến hành phỏng vấn các bà nội trợ tới mua hàng tại siêu thị tại một thời điểm nào đó ; như vậy sẽ có rất nhiều bà nội trợ do không tới mua hàng tại thời điểm đó nên sẽ không có khả năng được chọn

Việc chọn mẫu phi ngẫu nhiên hoàn toàn phụ thuộc vào kinh nghiệm và sự hiểu biết về tổng thể của người nghiên cứu nên kết quả điều tra thường mang tính chủ quan của người nghiên cứu. Mặt khác, ta không thể tính được sai số do chọn mẫu, do đó không thể áp dụng phương pháp ước lượng thống kê để suy rộng kết quả trên mẫu cho tổng thể chung

Các phương pháp chọn mẫu phi ngẫu nhiên:

Chọn mẫu thuận tiện (convenience sampling):

Có nghĩa là lấy mẫu dựa trên sự thuận lợi hay dựa trên tính dễ tiếp cận của đối tượng, ở những nơi mà nhân viên điều tra có nhiều khả năng gặp được đối tượng. Chẳng hạn nhân viên điều tra có thể chặn bất cứ người nào mà họ gặp ở trung tâm thương mại, đường phố, cửa hàng,.. để xin thực hiện cuộc phỏng vấn. Nếu người được phỏng vấn không đồng ý thì họ chuyển sang đối tượng khác. Lấy mẫu thuận tiện thường được dùng trong nghiên cứu khám phá, để xác định ý nghĩa thực tiễn của vấn đề nghiên cứu; hoặc để kiểm tra trước bảng câu hỏi nhằm hoàn chỉnh bảng; hoặc khi muốn ước lượng sơ bộ về vấn đề đang quan tâm mà không muốn mất nhiều thời gian và chi phí.

Chọn mẫu phán đoán (judgement sampling):

Là phương pháp mà phỏng vấn viên là người tự đưa ra phán đoán về đối tượng cần chọn vào mẫu. Như vậy tính đại diện của mẫu phụ thuộc nhiều vào kinh nghiệm và sự hiểu biết của người tổ chức việc điều tra và cả người đi thu thập dữ liệu. Chẳng hạn, nhân viên phỏng vấn được yêu cầu đến các trung tâm thương mại chọn các phụ nữ ăn mặc sang trọng để phỏng vấn. Như vậy không có tiêu chuẩn cụ thể “thế nào là sang trọng” mà hoàn toàn dựa vào phán đoán để chọn ra người cần phỏng vấn.

Chọn mẫu định ngạch (quota sampling):

Đối với phương pháp chọn mẫu này, trước tiên ta tiến hành phân tổ tổng thể theo một tiêu thức nào đó mà ta đang quan tâm, cũng giống như chọn mẫu ngẫu nhiên phân tầng, tuy nhiên sau đó ta lại dùng phương pháp chọn mẫu thuận tiện hay chọn mẫu phán đoán để chọn các đơn vị trong từng tổ để tiến hành điều tra. Sự phân bổ số đơn vị cần điều tra cho từng tổ được chia hoàn toàn theo kinh nghiệm chủ quan của người nghiên cứu. Chẳng hạn nhà nghiên cứu yêu cầu các vấn viên đi phỏng vấn 800 người có tuổi trên 18 tại 1 thành phố. Nếu áp dụng phương pháp chọn mẫu định ngạch, ta có thể phân tổ theo giới tính và tuổi như sau:chọn 400 người (200 nam và 200 nữ) có tuổi từ 18 đến 40, chọn 400 người (200 nam và 200 nữ) có tuổi từ 40 trở lên. Sau đó nhân viên điều tra có thể chọn những người gần nhà hay thuận lợi cho việc điều tra của họ để dễ nhanh chóng hoàn thành công việc.

———–&&————