Tổng quan sản phẩm
Bộ dữ liệu Khảo sát mức sống dân cư Việt Nam 2020 (Vietnam Household Living Standards Survey 2020 - VHLSS 2020) - Bộ 9,399 hộ là sản phẩm thống kê toàn diện nhất về mức sống hộ gia đình Việt Nam, được Tổng cục Thống kê (GSO) thực hiện theo Quyết định số 1261/QĐ-TCTK ngày 19 tháng 8 năm 2019. Đây là bộ dữ liệu vi mô cấp độ hộ gia đình, thu thập chi tiết đầy đủ cả thông tin về thu nhập và chi tiêu của 9,399 hộ gia đình đại diện trên phạm vi toàn quốc, được điều tra trong 4 đợt vào các tháng 3, 6, 9 và 12 năm 2020.
Bộ 9,399 hộ này là phần cốt lõi của chương trình khảo sát VHLSS 2020, chiếm khoảng 20% trong tổng số 46,995 hộ được điều tra, nhưng là bộ duy nhất thu thập đầy đủ thông tin chi tiêu chi tiết, cho phép đánh giá toàn diện mức sống thực tế và tính toán chỉ số nghèo đói dựa trên mức chi tiêu. Trong khi 37,596 hộ còn lại chỉ được điều tra về thu nhập và thông tin cơ bản, bộ 9,399 hộ cung cấp bộ dữ liệu đa chiều với 38+ tệp dữ liệu bao phủ 8 nhóm nội dung chính từ nhân khẩu học, giáo dục, y tế, việc làm, đến chi tiêu, tài sản, nhà ở và các chương trình giảm nghèo.
Tính tiếp nối lịch sử: Chuỗi dữ liệu Panel từ 2002 đến 2020
Kế thừa phương pháp điều tra
VHLSS 2020 kế thừa và phát triển từ chuỗi các cuộc điều tra mức sống đã được triển khai liên tục từ năm 1993 đến nay. Đặc biệt, bộ 9,399 hộ năm 2020 là sự tiếp nối trực tiếp của chuỗi các bộ dữ liệu "9k hộ" thu thập đầy đủ thu nhập-chi tiêu đã được thực hiện đều đặn qua các năm chẵn:
Cấu trúc Panel dọc
Các bộ dữ liệu VHLSS có tính chất panel (dữ liệu bảng), cho phép theo dõi cùng một nhóm hộ gia đình qua thời gian. Cấu trúc panel đã được xác nhận tồn tại giữa các cặp năm liên tiếp: 2002-2004, 2004-2006, 2006-2008. Mỗi đợt điều tra đều bao gồm một tỷ lệ hộ từ đợt trước (rotating panel), đảm bảo tính liên tục và khả năng so sánh dọc theo thời gian.
Đối với VHLSS 2020, bộ dữ liệu bao gồm tệp muc1c.dta chuyên ghi nhận thông tin liên kết với các thành viên hộ từ đợt điều tra 2018, cho phép nghiên cứu viên theo dõi sự biến động về nhân khẩu học, việc làm và thu nhập của cùng một nhóm đối tượng.
Thiết kế mẫu nhất quán
Bộ 9k hộ duy trì thiết kế mẫu hai cấp phân tầng đã được chuẩn hóa từ năm 2002:
-
Cấp 1 (PSU): Chọn các xã/phường theo phương pháp xác suất tỷ lệ với quy mô (PPS - Probability Proportionate to Size)
-
Cấp 2 (SSU): Chọn các khu vực điều tra (Enumeration Areas - EA) trong mỗi xã/phường
-
Phân tầng: Theo 63 tỉnh/thành phố và khu vực đô thị/nông thôn (126 tầng)
-
Mẫu cơ bản: Giai đoạn 2012-2020 dựa trên khung mẫu từ Tổng điều tra dân số và nhà ở năm 2009
Trong VHLSS 2020, từ tổng số 46,995 hộ được chọn, tại mỗi khu vực điều tra (EA), 15 hộ được phỏng vấn trong đó 12 hộ chỉ thu thập thông tin thu nhập và 3 hộ thu thập đầy đủ cả thu nhập và chi tiêu. Quy trình chọn mẫu này đảm bảo tính đại diện ở cấp quốc gia, vùng kinh tế (6 vùng), đô thị/nông thôn, và cho phép ước lượng tin cậy các chỉ số mức sống.
Nội dung điều tra toàn diện
Cấu trúc 8 phần chính
Bộ dữ liệu VHLSS 2020 - Bộ 9,399 hộ được tổ chức thành 8 phần chính (Mục 1 đến Mục 8), tương ứng với 38+ tệp dữ liệu ở định dạng Stata (.dta) hoặc CSV:
Phần 1: Đặc điểm hộ gia đình và thành viên hộ
-
Mục 1A: Danh sách thành viên hộ (36,655 cá nhân) - thông tin nhân khẩu học (giới tính, tuổi, quan hệ với chủ hộ, tình trạng hôn nhân), đăng ký hộ khẩu, di cư
-
Mục 1B: Thông tin về các thành viên đã rời khỏi hộ (6,325 cá nhân) - lịch sử giáo dục, việc làm, lý do rời hộ, địa điểm hiện tại, kiều hối
-
Mục 1C: Liên kết với thành viên hộ từ đợt điều tra trước (16,776 bản ghi panel)
Phần 2: Giáo dục
-
Mục 2: Thu thập thông tin về 36,655 cá nhân - tình trạng đi học, trình độ học vấn, chi phí giáo dục (học phí, sách vở, đồng phục, đi lại), học bổng và hỗ trợ
Phần 3: Sức khỏe và chăm sóc y tế
-
Mục 3A: Tình trạng sức khỏe, khám chữa bệnh (18,213 cá nhân)
-
Mục 3B: Bảo hiểm y tế, chi phí khám chữa bệnh, mua thuốc (36,655 cá nhân)
Phần 4: Việc làm và Thu nhập (Phần quan trọng nhất)
Đây là phần phức tạp và chi tiết nhất của bộ dữ liệu, bao gồm nhiều tệp con:
-
Mục 4A: Việc làm chính và phụ - loại công việc, ngành nghề, tiền lương/công, giờ làm việc, lịch sử di cư lao động (36,655 cá nhân)
-
Mục 4B (13 tệp dữ liệu): Hoạt động sản xuất nông nghiệp, lâm nghiệp, thủy sản
-
Mục 4B0: Thông tin đất đai (11,331 hộ)
-
Mục 4B11-4B16: Sản xuất cây trồng (diện tích, sản lượng, chi phí, doanh thu)
-
Mục 4B21-4B22: Chăn nuôi (đàn vật nuôi, chi phí, doanh thu)
-
Mục 4B31-4B32: Lâm nghiệp
-
Mục 4B41-4B42: Thủy sản
-
Mục 4B51-4B52: Dịch vụ nông nghiệp
-
-
Mục 4C: Kinh doanh phi nông nghiệp (3,705 hộ) - doanh thu, chi phí, lợi nhuận
-
Mục 4D: Thu nhập khác (9,399 hộ) - kiều hối, quà tặng, trợ cấp xã hội, lãi tiền gửi
Phần 5: Chi tiêu (Đặc trưng riêng của bộ 9k hộ)
Phần này là điểm khác biệt cốt lõi giữa bộ 9,399 hộ và mẫu 37,596 hộ chỉ thu thập thu nhập:
-
-
Mục 5A1: Chi tiêu thực phẩm trong các dịp lễ tết (146,205 bản ghi)
-
Mục 5A2: Chi tiêu thực phẩm thường xuyên (279,872 bản ghi)
-
Thu thập chi tiết hàng trăm mặt hàng thực phẩm với thông tin về nguồn gốc (mua, tự sản xuất, quà tặng), số lượng, giá trị
-
-
Mục 5B: Chi tiêu phi thực phẩm
-
Mục 5B1: Chi tiêu hàng ngày/hàng tháng (111,751 bản ghi) - quần áo, giày dép, vệ sinh cá nhân, giao thông, viễn thông
-
Mục 5B2: Chi tiêu hàng năm (116,435 bản ghi) - sửa chữa nhà, lễ cưới tang, du lịch
-
Mục 5B3: Tổng hợp chi tiêu của hộ (9,399 hộ)
-
Phần 6: Tài sản lâu bền
-
Mục 6: Tài sản chính của hộ (9,399 hộ) - phương tiện đi lại, máy móc sản xuất, giá trị tài sản
-
Mục 6B: Danh sách chi tiết tài sản tiêu dùng lâu bền (116,235 bản ghi) - tivi, tủ lạnh, máy tính, điện thoại, đồ nội thất
Phần 7: Nhà ở và điều kiện sống
-
Mục 7: Đặc điểm nhà ở (9,399 hộ) - loại nhà, diện tích, vật liệu xây dựng, nguồn nước, nhà vệ sinh, hệ thống thoát nước, tiếp cận điện, internet
Phần 8: Tham gia chương trình giảm nghèo
-
Mục 8: Các chương trình hỗ trợ (9,399 hộ) - trợ cấp xã hội, vay vốn ưu đãi, các chương trình mục tiêu quốc gia
Tệp dữ liệu tổng hợp
-
hhexpe12: Tệp tổng hợp chi tiêu của hộ với 273 biến số đã được tính toán
-
ttchung: Tệp tóm tắt thông tin hộ với 126 biến tổng hợp - tổng thu nhập, tổng chi tiêu, quy mô hộ, chỉ số nghèo, nhóm thu nhập
-
wt2012new1: Tệp trọng số (weights) để ước lượng đại diện cho tổng thể
Tính cập nhật và đầy đủ của VHLSS 2020
Năm 2020: Bộ dữ liệu đầy đủ nhất trong chu kỳ 2011-2020
Từ năm 2011, VHLSS chuyển từ chu kỳ hai năm một lần sang điều tra hàng năm, nhưng với nội dung khác nhau giữa năm chẵn và năm lẻ:
-
Năm lẻ (2011, 2013, 2015, 2017, 2019): Chỉ thu thập thông tin về dân số, việc làm và thu nhập
-
Năm chẵn (2012, 2014, 2016, 2018, 2020): Thu thập đầy đủ tất cả nội dung bao gồm cả chi tiêu chi tiết
Do đó, VHLSS 2020 là bộ dữ liệu toàn diện nhất trong giai đoạn 2011-2020, cung cấp bức tranh hoàn chỉnh về mức sống dân cư sau 10 năm triển khai điều tra hàng năm.
Cập nhật phương pháp và nội dung
VHLSS 2020 được cải tiến so với các đợt trước về nhiều mặt:
1. Cập nhật mục tiêu theo SDGs
Từ năm 2016 trở đi, VHLSS chuyển từ phục vụ đánh giá Mục tiêu Phát triển Thiên niên kỷ (MDGs) sang Mục tiêu Phát triển Bền vững (SDGs) của Liên Hợp Quốc. VHLSS 2020 được thiết kế để cung cấp các chỉ số cho ít nhất 15 mục tiêu SDGs, đặc biệt:
-
SDG 1: Xóa đói giảm nghèo - tỷ lệ nghèo đa chiều, bảo trợ xã hội
-
SDG 2: Xóa đói, an ninh lương thực - tình trạng dinh dưỡng, sản xuất nông nghiệp
-
SDG 3: Sức khỏe và phúc lợi - tiếp cận dịch vụ y tế, bảo hiểm y tế
-
SDG 4: Giáo dục chất lượng - tỷ lệ đi học, chi phí giáo dục
-
SDG 5: Bình đẳng giới - phân tích theo giới tính trong tất cả các lĩnh vực
-
SDG 8: Việc làm bền vững và tăng trưởng kinh tế - tỷ lệ thất nghiệp, việc làm khu vực phi chính thức
2. Phương pháp thu thập dữ liệu
VHLSS 2020 được triển khai trong bối cảnh đặc biệt của đại dịch COVID-19, nhưng GSO vẫn duy trì phương pháp phỏng vấn trực tiếp (face-to-face interview) trong 4 đợt vào tháng 3, 6, 9 và 12 năm 2020. Đây là một thành tựu đáng chú ý khi nhiều cơ quan thống kê quốc gia trên thế giới phải tạm ngừng điều tra trực tiếp trong năm 2020.
Điều này đảm bảo:
-
Tính nhất quán phương pháp: Có thể so sánh trực tiếp với các năm trước
-
Chất lượng dữ liệu: Hạn chế sai lệch do thay đổi phương thức thu thập
-
Độ bao phủ: Không bị mất mát thông tin do chuyển sang phương pháp điện thoại hoặc trực tuyến
3. Thời điểm tham chiếu
VHLSS 2020 sử dụng kỳ tham chiếu 12 tháng cho thông tin về thu nhập và chi tiêu. Điều này có nghĩa:
-
Điều tra tháng 3/2020: Thu thập thông tin từ tháng 4/2019 - tháng 3/2020
-
Điều tra tháng 6/2020: Thu thập thông tin từ tháng 7/2019 - tháng 6/2020
-
Điều tra tháng 9/2020: Thu thập thông tin từ tháng 10/2019 - tháng 9/2020
-
Điều tra tháng 12/2020: Thu thập thông tin từ tháng 1/2020 - tháng 12/2020
Thiết kế này cho phép nắm bắt cả giai đoạn trước và sau khi COVID-19 bùng phát, cung cấp bằng chứng quan trọng về tác động của đại dịch đến mức sống hộ gia đình Việt Nam.
Tính đầy đủ và chi tiết
Bộ 9,399 hộ năm 2020 là bộ dữ liệu vi mô chi tiết nhất trong hệ thống thống kê Việt Nam về mức sống dân cư, với các đặc điểm:
Chi tiết cấp độ mặt hàng
-
Chi tiêu thực phẩm: Hơn 100 mặt hàng cụ thể (gạo, thịt các loại, rau củ, trái cây, nước giải khát, thuốc lá...)
-
Chi tiêu phi thực phẩm: Hơn 50 nhóm mặt hàng (quần áo, giày dép, thuốc men, giáo dục, giao thông, viễn thông, giải trí, nhà ở...)
-
Thu nhập: Phân tách theo nguồn (tiền lương, thu nhập nông nghiệp, kinh doanh phi nông nghiệp, kiều hối, trợ cấp)
Phân tách theo nguồn gốc
Mỗi mặt hàng chi tiêu được ghi nhận theo 3 nguồn:
-
Mua từ thị trường (ghi giá trị mua thực tế)
-
Tự sản xuất (ghi giá trị quy đổi theo giá thị trường)
-
Nhận quà tặng, trợ cấp (ghi giá trị ước tính)
Điều này cho phép tính toán chính xác mức sống thực tế của hộ, không chỉ dựa vào thu nhập tiền mặt mà bao gồm cả giá trị tiêu dùng từ sản xuất tự cung và hỗ trợ xã hội.
Chỉ số giá và điều chỉnh
Bộ dữ liệu bao gồm các biến số điều chỉnh chỉ số giá theo vùng và theo thời gian:
-
Chỉ số giá thực phẩm (regional food price index)
-
Chỉ số giá phi thực phẩm (regional non-food price index)
-
Chỉ số giá theo tháng (monthly price indices)
Các chỉ số này cho phép chuyển đổi giá trị danh nghĩa (nominal) sang giá trị thực (real), đảm bảo khả năng so sánh mức sống giữa các vùng và qua thời gian.
Mục đích sử dụng và giá trị nghiên cứu
Phục vụ hoạch định chính sách
VHLSS 2020 - Bộ 9,399 hộ được thiết kế chủ yếu để:
-
Theo dõi và giám sát mức sống: Đánh giá sự thay đổi mức sống của các nhóm dân cư theo thời gian, theo vùng địa lý, theo đô thị/nông thôn
-
Đo lường nghèo đói: Tính toán đường nghèo quốc gia, tỷ lệ nghèo và nghèo đa chiều
-
Đánh giá bất bình đẳng: Phân tích phân phối thu nhập và chi tiêu, hệ số Gini, tỷ lệ giữa 20% giàu nhất và 20% nghèo nhất
-
Giám sát Chiến lược giảm nghèo: Đánh giá hiệu quả các chương trình mục tiêu quốc gia
-
Báo cáo SDGs: Cung cấp các chỉ số theo dõi tiến độ đạt được Mục tiêu Phát triển Bền vững
Giá trị cho nghiên cứu khoa học
Bộ dữ liệu VHLSS 2020 - Bộ 9,399 hộ là nguồn tài liệu quý giá cho nghiên cứu kinh tế học, xã hội học, nhân khẩu học với nhiều ứng dụng:
1. Nghiên cứu kinh tế vi mô
-
Hành vi tiêu dùng: Phân tích cầu về hàng hóa dịch vụ, độ co giãn thu nhập, độ co giãn giá
-
Cung lao động: Nghiên cứu quyết định tham gia lực lượng lao động, lựa chọn ngành nghề
-
Kinh tế nông hộ: Hiệu quả sản xuất nông nghiệp, tác động của quy mô đất đai, công nghệ canh tác
-
Kinh doanh hộ gia đình: Đặc điểm doanh nghiệp siêu nhỏ, tiếp cận tín dụng, rào cản gia nhập thị trường
2. Nghiên cứu phúc lợi xã hội
-
Phân tích nghèo đói: Đo lường nghèo, xác định yếu tố quyết định nghèo, động thái nghèo (poverty dynamics)
-
Bất bình đẳng: Nghiên cứu phân phối thu nhập và tài sản, bất bình đẳng cơ hội
-
An sinh xã hội: Đánh giá tác động của các chương trình trợ cấp, bảo hiểm y tế, bảo hiểm xã hội
-
Di cư và kiều hối: Phân tích mô hình di cư lao động, tác động của kiều hối đến mức sống hộ nguồn
3. Nghiên cứu giáo dục và sức khỏe
-
Giáo dục: Tỷ suất sinh lợi của giáo dục, chi phí cơ hội của việc đi học, bất bình đẳng tiếp cận giáo dục
-
Sức khỏe: Nhu cầu chăm sóc y tế, rào cản tiếp cận dịch vụ y tế, chi tiêu thảm họa do chi phí y tế
4. Phân tích panel và nhân quả
Với cấu trúc panel liên kết với các năm trước (đặc biệt là 2018), bộ dữ liệu cho phép:
-
Ước lượng hiệu ứng cố định (fixed effects): Kiểm soát các yếu tố không quan sát được không thay đổi theo thời gian
-
Nghiên cứu động thái: Phân tích sự thay đổi mức sống, di động xã hội (social mobility)
-
Đánh giá tác động (impact evaluation): Khi kết hợp với các can thiệp chính sách có tính ngẫu nhiên hoặc nửa ngẫu nhiên
5. Nghiên cứu tác động COVID-19
VHLSS 2020 có giá trị đặc biệt trong việc nghiên cứu tác động của đại dịch COVID-19 đến mức sống hộ gia đình Việt Nam:
-
So sánh mức sống trước và trong đại dịch (so với VHLSS 2018)
-
Xác định các nhóm hộ chịu tác động nặng nề nhất
-
Đánh giá vai trò của các chính sách hỗ trợ trong thời kỳ khó khăn
-
Phân tích sự thay đổi trong cấu trúc chi tiêu và hành vi tiết kiệm
Tính đại diện
Bộ 9,399 hộ được thiết kế để đại diện cho:
-
Cấp quốc gia: Toàn bộ hộ gia đình Việt Nam (ước tính khoảng 23-24 triệu hộ)
-
6 vùng kinh tế: Đồng bằng sông Hồng, Trung du và miền núi phía Bắc, Bắc Trung Bộ và Duyên hải miền Trung, Tây Nguyên, Đông Nam Bộ, Đồng bằng sông Cửu Long
-
Đô thị/nông thôn: Cho phép so sánh mức sống giữa hai khu vực
Lưu ý: Bộ 9,399 hộ không đủ lớn để đại diện ở cấp tỉnh/thành phố. Muốn phân tích cấp tỉnh cần sử dụng toàn bộ mẫu 46,995 hộ, nhưng sẽ không có thông tin chi tiêu chi tiết.
Định dạng và cấu trúc dữ liệu
Định dạng tệp
Bộ dữ liệu VHLSS 2020 - Bộ 9,399 hộ được cung cấp dưới nhiều định dạng:
-
Stata (.dta): Định dạng chuẩn của GSO, bao gồm metadata đầy đủ (nhãn biến, nhãn giá trị)
-
CSV (.csv): Định dạng văn bản, dễ sử dụng với nhiều phần mềm khác nhau
-
Excel (.xls, .xlsx): Một số tệp nhỏ được cung cấp ở định dạng Excel
Khi làm việc với bộ dữ liệu này, khuyến nghị sử dụng định dạng Stata để đảm bảo metadata được giữ nguyên và thuận tiện cho phân tích kinh tế lượng.
Cấu trúc phân cấp
Dữ liệu VHLSS có cấu trúc phân cấp (hierarchical structure) với 3 cấp độ:
-
Cấp hộ (Household level): 9,399 hộ - các tệp như
muc4D,muc6,muc7,muc8,ttchung -
Cấp cá nhân (Individual level): 36,655 cá nhân - các tệp như
muc1a,muc2,muc3A,muc3B,muc4A -
Cấp giao dịch/mặt hàng (Transaction level): Hàng trăm nghìn bản ghi - các tệp như
muc5A1,muc5A2,muc5B1,muc5B2,muc6B
Mỗi tệp có khóa định danh (identifier keys) để liên kết các cấp độ:
-
tinh(mã tỉnh/thành phố) -
huyen(mã huyện/quận) -
xa(mã xã/phường) -
diaban(mã khu vực điều tra - EA) -
hoso(mã hộ gia đình) -
matv(mã thành viên hộ)
Trọng số (Weights)
Tệp wt2012new1.dta cung cấp trọng số cho từng khu vực điều tra (EA). Trọng số này cần được sử dụng khi:
-
Tính toán các chỉ số đại diện cho tổng thể (trung bình, tỷ lệ, tổng số)
-
Phân tích phân tầng (stratified analysis)
-
Ước lượng mô hình hồi quy với mẫu phức tạp
Công thức liên kết trọng số:
wt_household = wt_EA × (số hộ trong EA / số hộ được chọn)
Tài liệu hỗ trợ
Bộ dữ liệu VHLSS 2020 được cung cấp kèm theo các tài liệu hướng dẫn:
-
Báo cáo kết quả: "Kết quả Khảo sát mức sống dân cư Việt Nam 2020" do GSO xuất bản, bao gồm:
-
Bảng hỏi (Questionnaire): Các tệp Excel chứa câu hỏi gốc được sử dụng trong điều tra, thường có cả bản tiếng Việt và tiếng Anh
-
Kế hoạch điều tra: Quyết định 1261/QĐ-TCTK và văn bản kế hoạch chi tiết về phương pháp điều tra, tổ chức thực hiện
-
Danh mục mã: Bao gồm trong bảng hỏi:
-
Hướng dẫn sử dụng (User Manual): Đối với các đợt VHLSS trước (2010, 2012), có tài liệu User Manual chi tiết được phát triển bởi Institute of Statistical Mathematics (ISM) và SINFONICA. Tài liệu này cung cấp:
-
Mô tả chi tiết từng biến số
-
Hướng dẫn import dữ liệu vào R, Stata, Python
-
Ví dụ về cách tính toán các chỉ số
-
Script R để kiểm tra dữ liệu
-
So sánh với VHLSS 2022-2024
Sau VHLSS 2020, GSO tiếp tục điều tra hàng năm:
-
VHLSS 2021: Chỉ thu thập thu nhập (năm lẻ)
-
VHLSS 2023: Chỉ thu thập thu nhập (năm lẻ)
-
VHLSS 2024: Đang trong giai đoạn hoàn thiện
Do đó, VHLSS 2020 là bộ dữ liệu đầy đủ gần nhất có sẵn cho đến khi VHLSS 2022 được phát hành rộng rãi. Bộ dữ liệu này đặc biệt có giá trị để nghiên cứu tác động của COVID-19, bởi vì:
-
2020 là năm đầu tiên có tác động đại dịch
-
2018 là năm chuẩn trước đại dịch (baseline)
-
2022 là năm phục hồi sau đại dịch
Hạn chế và lưu ý khi sử dụng
Hạn chế về tính đại diện
-
Bộ 9,399 hộ không đại diện cấp tỉnh/thành phố. Muốn phân tích cấp tỉnh cần sử dụng toàn bộ mẫu 46,995 hộ (nhưng sẽ mất thông tin chi tiêu chi tiết)
-
Không bao gồm người sống trong các cơ sở tập thể (ký túc xá, nhà dưỡng lão, trại giam, doanh trại quân đội)
Vấn đề về dữ liệu thiếu (missing data)
-
Một số hộ có thể từ chối trả lời một số câu hỏi nhạy cảm (thu nhập, tài sản)
-
Thông tin hồi tưởng 12 tháng có thể bị lỗi nhớ (recall bias), đặc biệt với các khoản chi tiêu nhỏ lẻ
-
Cần kiểm tra giá trị bất thường (outliers) trước khi phân tích
Vấn đề về so sánh qua thời gian
-
Năm 2020 có điều kiện đặc biệt do COVID-19, nên cần thận trọng khi so sánh xu hướng dài hạn
-
Một số câu hỏi có thể thay đổi nhẹ giữa các đợt điều tra, cần kiểm tra bảng hỏi kỹ trước khi so sánh
-
Phương pháp tính toán một số chỉ số (như đường nghèo) có thể được điều chỉnh theo thời gian
Yêu cầu kỹ năng phân tích
Làm việc với bộ dữ liệu này đòi hỏi:
-
Kiến thức về kinh tế lượng (panel data, survey methods, complex sampling)
-
Kỹ năng lập trình với Stata, R hoặc Python
-
Hiểu biết về thiết kế mẫu phức tạp và cách sử dụng trọng số
-
Khả năng xử lý dữ liệu đa cấp (merge, append, reshape)
Kết luận
Bộ dữ liệu Khảo sát mức sống dân cư Việt Nam 2020 (VHLSS 2020) - Bộ 9,399 hộ là tài sản thống kê vô giá cho nghiên cứu về kinh tế xã hội Việt Nam. Với tính kế thừa từ chuỗi dữ liệu panel từ năm 2002, độ chi tiết vượt trội về thu nhập và chi tiêu, và khả năng phân tích đa chiều, bộ dữ liệu này là công cụ không thể thiếu cho:
-
Các nhà hoạch định chính sách trong việc thiết kế và đánh giá các chương trình giảm nghèo, phát triển nông thôn, an sinh xã hội
-
Các nhà nghiên cứu trong lĩnh vực kinh tế phát triển, kinh tế lao động, kinh tế nông nghiệp, kinh tế y tế, kinh tế giáo dục
-
Các tổ chức quốc tế theo dõi tiến độ đạt được các Mục tiêu Phát triển Bền vững (SDGs)
-
Sinh viên và nghiên cứu sinh cần dữ liệu thực tế để thực hành phân tích kinh tế lượng và hoàn thành luận văn, luận án
Đặc biệt, trong bối cảnh hậu COVID-19, VHLSS 2020 cung cấp bằng chứng quan trọng về khả năng chống chịu (resilience) của hộ gia đình Việt Nam trước cú sốc kinh tế lớn, và là cơ sở để đánh giá các chính sách phục hồi kinh tế trong những năm tiếp theo.
Với hơn 38 tệp dữ liệu, hàng trăm biến số, và khả năng liên kết với các năm trước, bộ dữ liệu VHLSS 2020 - Bộ 9,399 hộ tiếp tục khẳng định vai trò là nguồn dữ liệu chuẩn mực (gold standard) cho nghiên cứu mức sống hộ gia đình tại Việt Nam.
Chưa có đánh giá nào!
Đánh giá sản phẩm này
Đánh giá của bạn:














