HR STATISTIC
Regression analysis is a statistical tool for the investigation of relationships between variables. Multiple regression analysis deals with an arbitrarily large number of explanatory variables.
Multiple regression analysis is a statistical tool for understanding the relationship between two or more variables. Multiple regression involves a variable to be explained (dependent variable), and additional independent variable that are thought to produce or be associated with changes in the dependent variable. Multiple regression typically uses a single dependent variable and several explanatory variables (Daniel L. Rubinfeld).
For instance, Yi-Shun Wang (2007) validates a multidimensional model for assessing e-commerce systems success. The validated model consists of six dimensions: Information Quality, System Quality, Service Quality, Perceived Value, User Satisfaction and Intention to Reuse. The author found that Reuse is affected by Perceived Value and User Satisfaction, which, in turn, are influenced by Information Quality, System Quality and Service Quality. Andreas Muller (2002) tested whether the relation between income inequality and mortality found in US states is because of different levels of formal education.
– R2 statistic is a measure of the extent to which the total variation of the dependent variable is explained by the regression. A high value of R2, suggesting that the regression model explains the variation in the dependent variable well (Alan, 1993).
For instance, The analysis showed that specific factors (system quality, service quality and information quality) affected IHRM success (Duangta Duangekanong, 2020).
Trong nghiên cứu quản trị, Toán thống kê thường sử dụng trong đánh giá tác động của yếu tố nọ lên yếu tố kia. Ngày nay sử dụng toán thông kê là yêu cầu bắt buộc đối với rất nhiều công bố khoa học. Trong phần này, tôi viết về “Áp dụng toán thống kê trong nghiên cứu quản trị” theo cách đơn giản hoá vấn đề.
Một ví dụ đơn giản là chúng ta có thể áp dụng toán thống kê nhằm trả lời câu hỏi: “Chế độ đãi ngộ có tác động tới tỷ lệ nghỉ việc của người lao động hay không?”. Với câu hỏi này, khi áp dụng toán thống kê, chúng ta có thể sử dụng toán thống kê để đưa ra câu trả lời có tính thuyết phục cao.
Nghe đến toán thống kê thì nhiều người cảm thấy sợ hãi nhưng thực ra thì nó không quá đáng sợ. Để trả lời câu hỏi trên với toán thống kê, chúng ta tiến hành đánh giá chế độ đãi ngộ và tỷ lệ nghỉ việc tại các doanh nghiệp, sau đo phân tích nhằm xác định xem chế độ đãi ngộ có ảnh hưởng tới tỷ lệ nghỉ việc hay không. Ví dụ như, chế độ đãi ngộ ở doanh nghiệp A được đánh giá ở mức 2, tỷ lệ nghỉ việc ở doanh nghiệp này được đánh giá ở mức 4, chế độ đãi ngộ ở doanh nghiệp B được đánh giá ở mức 3, tỷ lệ nghỉ việc ở doanh nghiệp này được đánh giá ở mức 3, chế độ đãi ngộ ở doanh nghiệp C được đánh giá ở mức 4, tỷ lệ nghỉ việc của doanh nghiệp này được đánh giá ở mức 2… (bảng 1)
Chế độ đãi ngộ | Tỷ lệ nghỉ việc | |
Doanh nghiệp A | Mức 2 | Mức 4 |
Doanh nghiệp B | Mức 3 | Mức 3 |
Doanh nghiệp C | Mức 4 | Mức 2 |
Nhìn vào số liệu khảo sát có thể thấy, chế độ đãi ngộ tăng thì tỉ lệ nghỉ việc giảm, bằng mắt chúng ta có thể thấy mối liên hệ giữa tỷ lệ nghỉ việc và chế độ đãi ngộ của doanh nghiệp. Sử dụng toán thống kê trong nghiên cứu quản trị cũng trên nguyên tắc này, tuy vậy khi áp dụng toán thống kê chúng ta có những chỉ số để có thể nhìn nhận chính xác và đưa ra kết luận mang tính khoa học.
Chúng ta sẽ tìm hiểu chi tiết về áp dụng toán thống kê trong nghiên cứu quản trị, từ dễ đến khó, bắt đầu từ Simple Linear Regression Model.
1. Simple Linear Regression Model
Đây có thể xem là mô hình nghiên cứu định lượng đơn giản nhất và cũng có thể xem là mô hình nghiên cứu định lượng cơ bản nhất. Hiểu được chính xác mô hình này sẽ dễ dàng tiếp cận các mô hình phức tạp khác.
Để trả lời câu hỏi trên với toán thống kê, chế độ đãi ngộ và tỷ lệ nghỉ việc tại các doanh nghiệp sau đo đánh giá xem chế độ đãi ngộ có ảnh hưởng tới tỷ lệ nghỉ việc hay không. Ví dụ như, chế độ ở doanh nghiệp A ở mức 2, tỷ lệ nghỉ việc ở mức 4, chế độ doanh nghiệp B ở mức 3, tỷ lệ nghỉ việc ở mức 3, chế độ đãi ngộ ở doanh nghiệp C ở mức 4, tỷ lệ nghỉ việc ở mức 2… Nhìn vào số liệu khảo sát có thể thấy, chế độ đãi ngộ tăng thì tỉ lệ nghỉ việc giảm, bằng mắt chúng ta có thể thấy được mối liên hệ giữa tỷ lệ nghỉ việc và chế độ đãi ngộ của doanh nghiệp. Sử dụng toán thống kê trong nghiên cứu quản trị như vậy đó, tuy vậy khi áp dụng toán thống kê chúng ta có những chỉ số để có thể nhìn nhận chính xác và đưa ra kết luận mang tính khoa học.
Simple Linear Regression Model (SLRM) có thể hiểu là mô hình đánh giá tác động của một vấn đề lên vấn đề khác (ví dụ như chế độ đãi ngộ và tỷ lệ nghỉ việc đã đề cập ở trên). Để hình dung về SLRM, chúng ta sẽ tiếp tục với câu hỏi ở trên “Chế độ đãi ngộ có tác động tới tỷ lệ nghỉ việc của người lao động hay không?”. Sự khác biệt ở phần này là chúng ta không đưa ra nhận định bằng mắt mà nhận định bằng các chỉ số thống kê. Với ví dụ phần mở đầu, chúng ta rất dễ nhận biết được tác động của chế độ đãi ngộ lên tỷ lệ nghỉ việc do đây là số liệu hư cấu được chuẩn bị có chủ đích, khi phân tích số liệu thực rất khó đưa ra kết luận chính xác thông qua quan sát, khi phân tích các số liệu thực chúng ta cần sử dụng các chỉ số thống kê để nhận biết các tác động.
Số liệu khảo sát về chế độ đãi ngộ và tỷ lệ nghỉ việc tại một số doanh nghiệp được trình bày trong bảng 2.
Đãi ngộ | Nghỉ việc |
4 | 0.02 |
3 | 0.06 |
3.5 | 0.08 |
3.2 | 0.12 |
2.8 | 0.16 |
2.3 | 0.2 |
2.3 | 0.2 |
1.8 | 0.22 |
2.10 | 0.26 |
1.2 | 0.3 |
Nhìn vào bảng 2 có thể thấy, số liệu thực tế có độ nhiễu nhất định khiến chúng ta khó có thể nhận biết được bằng mắt thường, cụ thể là đôi khi chế độ đãi ngộ tăng nhưng tỷ lệ nghỉ việc vẫn tăng. Các công cụ toán thống kê giúp chúng ta nhanh chóng đưa ra kết luận. Với rất nhiều phần mềm thống kê, chúng ta chỉ đơn giản là nhập số liệu, ấn Enter và đọc số liệu. Kết quả phân tích SLRM được trình bày dưới đây (Bảng 3).
Nhìn vào kết quả phân tích có thể thấy R2 = 0.8999, giá trị này thể hiện chế độ đãi ngộ có tác động mạnh mẽ tới tỷ lệ nghỉ việc của người lao động (R2 càng gần 1 thì tác động càng mạnh). P-value được sử dụng để kiểm định giả thuyết…. Những chỉ số như vậy thường hiển thị đầy đủ trên các phần mềm thống kế nhu SPSS chẳng hạn.
Phương trình y = -0.1023x + 0.4301 giúp chúng ta tính (dự báo) được tỷ lệ nghỉ việc (y) thông qua mức đãi ngộ (x).
Có thể thấy thông qua toán thống kê, chúng ta có thể nhanh chóng đưa ra kết luận mang tính khoa học.
2. Multiple Linear Regression Model
Cũng giống như SLRM đã trình bày ở trên, tuy vậy, đối với Multiple Linear Regression Model chúng ta có thể cùng lúc đánh giá tác động của nhiều yếu tố tới một yếu tố. Ví dụ như tác động của Chế độ đãi ngộ tài chính và Quyền tự chủ trong công việc tới tỷ lệ nghỉ việc của người lao động.
Đối với các nghiên cứu quản trị thì Multiple Linear Regression Model được sử dụng phổ biến hơn so với SLRM, tuy vậy thì về mặt kỹ thuật, sự khác biệt chủ yếu ở quá trình nhập số liệu nghiên cứu. Phương trình hồi quy và các chỉ số thống kê được phần mềm như SPSS hiển thị đầy đủ.
3. Nghiên cứu thực tế
Khi nghiên cứu thực tế, rất nhiều nghiên cứu quản trị sử dụng Multiple Linear Regression Model, tuy vậy, người ta thường không khảo sát với một câu hỏi mà thường khảo sát với một hệ thống câu hỏi. Ví dụ như khi đánh giá về quyền tự chủ trong công việc, người ta sẽ không hỏi một câu như “Anh chị đánh giá quyền tự chủ trong công việc như thế nào?” mà người ta sẽ sử dụng một số câu hỏi như trong ví dụ dưới đây (đánh giá theo thang Likert).
+ Tôi có thể làm tốt công việc được giao
+ Đôi khi tôi cảm thấy không thể làm chủ công việc được giao (câu hỏi ngược)
+ Tôi có thể giải quyết mọi vấn đề liên quan tới công việc
+ Tôi nhận thấy công việc thực sự khó khăn (câu hỏi ngược)
+ Tôi nhân thấy tôi là người giỏi nhất có thể giải quyết các vướng mắc trong công việc
+ Giải quyết khó khăn trong công việc với tôi rất khó khăn (câu hỏi ngược)
4. Cronbach alpha
Như đã nói ở trên, khi nghiên cứu thực tế, người ta thường đo lường các vấn đề quản trị thông qua hệ thống các câu hỏi. Để đánh giá xem hệ thống các câu hỏi đánh giá một vấn đề có tốt không người ta sử dung hệ số Cronbach alpha. Thường người ta chọn Cronbach alpha > 0.7, người ta có thể loại bớt một số thang đo để đảm bảo hệ số Cronbach alpha (phần mềm như SPSS sẽ tự tính và đưa ra lựa chọn.
5. Report
Biographic information was collected on age, sex, salary, sector (profit or nonprofit), industry, length of employment with current employer, and number of employees in organization (Richard E. Kopelman et al., 2012).
(Đang cập nhật)