Tải bản đầy đủ (.docx) (28 trang)

thảo luận nhóm TMU kinh tế lượng lý thuyết về phân tích hồi quy nghiên cứu các nhân tố tác động đến tổng chi tiêu hàng tháng của sinh viên đại học thương mại

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (635.43 KB, 28 trang )

MỤC LỤC

1.1.

Giới thiệu khái quát về đề tài nghiên cứu
 Nghiên cứu các nhân tố tác động đến tổng chi tiêu hàng tháng của sinh

viên Đại học Thương Mại.
 Xuất phát từ thực tế hiện nay, khi nhu cầu và mức chi tiêu cho đời sống
của sinh viên ngày một tăng. Bài toán cân đối chi tiêu đối với mỗi sinh
viên luôn là vấn đề được quan tâm. Do đó, nhóm thực hiện đề tài nghiên
cứu với mong muốn giúp sinh viên có cái nhìn toàn diện nhất để đảm bảo
chi tiêu một cách hợp lý và khoa học.
1.2.
Mục tiêu nghiên cứu
 Chỉ ra các yếu tố tác động đến tổng chi tiêu hàng tháng của sinh viên
 Giải thích mối quan hệ giữa các yếu tố tác động đến tổng chi tiêu hàng
tháng của sinh viên
 Đo lường mức độ tác động của các yếu tố, thể hiện yếu tố nào là yếu tố tác
động nhất tới tổng chi tiêu hàng tháng của sinh viên
 Đưa ra mô hình hồi quy, từ đó kết luận và đưa ra giải pháp giúp sinh viên
1.3.

có kế hoạch chi tiêu hợp lý.
Đối tượng và phạm vi nghiên cứu
 Đối tượng nghiên cứu: Các nhân tố tác động đến tổng chi tiêu trung
bình hàng tháng của sinh viên Đại học Thương Mại.
 Phạm vi nghiên cứu:
+ Phạm vi không gian: Trường Đại học Thương Mại với các sinh viên từ
năm nhất đến năm 4.
+ Phạm vi thời gian: Tháng 7 năm 2019.



CHƯƠNG 2: CƠ SỞ LÝ THUYẾT
1

1


2.1. Lý thuyết về phân tích hồi quy
2.1.1. Mô hình hồi quy nhiều biến:

Mô hình hồi quy tổng thể (PRF)

Hàm hồi quy mẫu (SRF)

Yi=.

.



Yi: là giá trị của biến phụ thuộc Y.



: hệ số chặn.



: hệ số của biến giải thích ().




:






: Ước lượng của hoặc
E(Y/Xij),(, i= ).
: Ước lượng của hệ số hồi
quy tổng thể (j = ).

sai số ngẫu nhiên.

Các giả tiết cơ bản của mô hình hồi quy nhiều biến
• Các biến giải thích () không phải là biến ngẫu nhiên, giá trị của chúng là xác

định.
• Kỳ vọng toán của các sai số ngẫu nhiên Uj bằng không

E (Uj) = E (X/Uj) = 0 với i
• Cov (Ui, Uj) = E (Ui,Uj) =
• Hạng ma trận X bằng k: rg (X) = k

Giả thiết này có nghĩa giữa các biến Xj không có hiện tượng cộng tuyến hay các cột
của ma trận X độc lập tuyến tính.
• Uj ~ N (0, )



Phương pháp bình phương nhỏ nhất
Ŷi = + X i + i

Trong đó, và là các ước lượng không chệch của các hệ số hồi quy β1 và β2 và i là hệ số
không chệch của sai số ui.
Các tính chất của ước lượng OLS
• Đường hồi quy đi qua điểm trung bình ( , 2,…, k), tức là
=.
• Giá trị trung bình của các giá trị i được xác định theo hàm hồi quy mẫu bằng
giá trị trung bình của biến phụ thuộc, tức là = Ŷi =
Tổng các phần dư của hàm hồi quy mẫu bằng 0: ei = 0
Các phần dư ei không tương quan với Ŷi tức là eiŶi = 0
• Các phần dư ei không tương quan với Xji tức là eiXji = 0 (j =



2

2

)


Với giả thiết của MHHQ tuyến tính cổ điển thì các ước lượng bình phương nhỏ nhất là
các ước lượng hiệu quả của βj ( với j =

)

2.1.1. Ước lượng bằng phương pháp bình phương nhỏ nhất


; ;
;.
Tìm sao cho min

Trong đó, là ma trận phụ hợp của ma trận

2.1.2. Khoảng tin cậy và kiểm định giả thuyết về các hệ số hồi quy
2.1.2.1.
Khoảng tin cậy của các hệ số hồi quy

-



~ N (, Var ()), với j =. Do chưa biết mà phải thay bằng ước lượng không chênh
lệch nên

 : ~ T (n-k), j =
 Từ đó, khoảng tin cậy đối xứng của với mức ý nghĩa α là:

{– se (); + se ()}
Kiểm định giả thuyết về các hệ số của hồi quy tổng thể

2.1.2.2.

Bài toán: Với mức ý nghĩa α. Kiểm định giả thuyết về βj theo một trong 3 bài
toán sau:
Bài toán 1


Bài toán 2

Bài toán 3

Giải:

3

Cách 1:
3


• Chọn tiêu chuẩn kiểm định:

T=
Nếu đúng thì
• Với mức ý nghĩa

Bài toán 1

Bài toán 2

Bài toán 3

Xác định
phân vị
)

Miền bác
bỏ


• Tính giá trị thực nghiệm: t =
• So sánh t với Wα ⇒ kết luận theo quy tắc kiểm định
• Kết luận chung


Cách 2:
Kiểm định theo p-value:
P-value < α bác bỏ giả thuyết , tức là hệ số hồi quy không có ý nghĩa thống kê.

Ngược lại, nếu P-value > α thì ta không có cơ sở bác bỏ giả thuyết , tức là các hệ số hồi
quy có ý nghĩa thống kê.
2.1.3. Kiểm định giả thuyết đồng thời
2.1.3.1.
Hệ số xác định bội
- Định nghĩa 1: Hệ số xác định bội được định nghĩa:
- Trong thực tế, ta có thể sử dụng:
- Định nghĩa 2: Hệ số xác định bội đã điều chỉnh = 1 – (1 – R2)
2.1.3.2.


4

Kiểm định giả thuyết đồng thời
Xét giả thuyết: ↔
TCKĐ: nếu Ho đúng thì F
4






Miền bác bỏ: Wα =
Nếu => Bác bỏ H0, chấp nhân H1

2.1.4. Phân tích hồi quy và dự báo
2.1.4.1.
Dự báo giá trị trung bình

Với độ tin cậy cho trước, dự báo được giá trị trung bình của Y:
 Ước lượng điểm của E (Y / X0) là:
 Xây dựng thống kê:
 Khoảng tin cậy của E (Y/X0) là:
2.1.4.2.
Dự báo giá trị cá biệt

Với độ tin cậy cho trước, ta cần dự báo giá trị cá biệt của Y khi các biến độc lập X 2,
X3, …, Xk nhận các giá trị tương ứng là X20, X30,…, Xk0.



Ước lượng điểm của Y0 là :
Xây dựng thống kê:



Khoảng tin cậy của Y0 là:

2.2.
Các khuyết tật của mô hình

2.2.1. Hiện tượng phương sai sai số thay đổi
2.2.1.1.
Bản chất
- Vi phạm giả thiết : ()
- Tức là ()
2.2.1.2.
Nguyên nhân
- Do bản chất mối quan hệ giữa các biến kinh tế.
- Do kỹ thuật thu nhập xử lí số liệu
- Do con người học được hành vi trong quá khứ
- Một nguyên nhân khác là mô hình định dạng sai, mô hình hồi quy không
- Đúng (dạng hàm sai, thiếu biến quan trọng, chuyển đổi dữ liệu không đúng).
2.2.1.3.
Hậu quả
- Các ước lượng bình phương nhỏ nhất (OLS) vẫn là các ước lượng tuyến tính

không chệch nhưng không còn là hiệu quả.
- Kết quả của bài toán ước lượng và kiểm định giả thuyết về các hệ số hồi quy

không còn đáng tin cậy (các khoảng tin cậy và kiểm định giả thuyết thông thường
dựa trên phân phối t và F sẽ không còn đáng tin cậy nữa. Do vậy, nếu chúng ta áp
dụng các kỹ thuật kiểm định giả thuyết thông thường sẽ cho ra kết quả sai)

5

5


- Kết quả dự báo không còn hiệu quả nữa khi sử dụng các ước lượng OLS có


phương sai không nhỏ nhất.
2.2.1.4.
Phát hiện hiện tượng phương sai sai số thay đổi
 Phương pháp đồ thị phần dư
• Ước lượng mô hình hồi quy gốc thu được →
• Vẽ đồ thị theo chiều tăng của Xij nào đó (hoặc )
• Nhận xét: Nếu Xij biến động mà cũng biến động tăng, giảm theo các
dạng hình b, c, d, e thì mô hình có phương sai sai số thay đổi, còn mô
hình a thi phương sai sai số là thuần nhất.

 Kiểm định Park

Park đưa ra giả thiết


Vì thường chưa biết nên thay thế bởi ước lượng của nó là
=


6

Bước 1: Ước lượng hồi quy gốc để thu được các phần dư
Bước 2: Ước lượng hồi quy
6


=
Nếu có nhiều biến giải thích thì ước lượng hồi quy này với từng biến giải thích hoặc
với



Bước 3: Kiểm định giả thiết

Nếu bị bác bỏ thì kết luận có phương sai của sai số thay đổi
Tiêu chuẩn kiểm định:
T=
Dựa vào hoặc P – giá trị để kiểm định giả thiết:
+ Nếu P – giá trị < => Bác bỏ H0, chấp nhận H1 và kết luận phương sai của sai số
thay đổi
+ Nếu P – giá trị > => Bác bỏ H1, chấp nhận H0 và kết luận không có phương sai của
sai số thay đổi
 Kiểm định Glejser

Hồi quy mô hình gốc để thu đươc phần dư . Hồi quy một trong các mô hình:
+ |
+ |
+ |
+ |
+ |
+ |+
• Kiểm định giả thiết: .
• Với TCKĐ: T = Nếu H0 đúng T ̴
• Dựa vào hoặc P – giá trị để kiểm định giả thiết:


+ Nếu P – giá trị < => Bác bỏ H0, chấp nhận H1 và kết luận phương sai của sai số
thay đổi
+ Nếu P – giá trị > => Bác bỏ H1, chấp nhận H0 và kết luận không có phương sai của
sai số thay đổi.
 Kiểm định White

• Ước lượng mô hình gốc bằng phương pháp OLS được phần dư .
• Ước lượng mô hình phụ bằng phương pháp OLS tìn được hệ số xác định bội
• BTKĐ:
7

7


• Với TCKĐ: χ = n.
• Dựa vào W_α hoặc P – giá trị để kiểm định giả thiết:
+

Nếu P – giá trị < α => Bác bỏ H0, chấp nhận H1 và kết luận phương sai của

sai số thay đổi
+ Nếu P – giá trị > α => Bác bỏ H1, chấp nhận H0 và kết luận không có
phương sai của sai số thay đổi.
 Kiểm định dựa trên biến phụ thuộc
• Giả thuyết: .
• Thay => thu được
• Bài toán kiểm định:
• Tiêu chuẩn kiểm định: Nếu đúng thì ~
• Dựa vào W_α hoặc P – giá trị để kiểm định giả thiết:
+

Nếu P – giá trị < α => Bác bỏ H0, chấp nhận H1 và kết luận phương sai của

sai số thay đổi
+ Nếu P – giá trị > α => Bác bỏ H1, chấp nhận H0 và kết luận không có
phương sai của sai số thay đổi.

2.2.1.5.
Khắc phục hiện tượng
 TH1: Khi đã biết.
• Xét MH ban đầu: (1) với đã xác định.
• Chia cả 2 vế mô hình (1) cho ta có :

(2)



Mô hình (2) có phương sai sai số không đổi:
Vậy (2) không có hiện tượng phương sai sai số thay đổi:



Xét mô hình:
(1)

Giả sử: Var ( =


Chia cả 2 vế của (1) cho :
(2)

8

8


Trong đó:

, , ,
Var ( = 1
Vậy mô hình không còn hiện tượng phương sai sai số thay đổi
GLS là phương pháp sử dụng OLS trong mô hình sau khi thay đổi biến để các giả
thiết được thỏa mãn. WLS là kỹ thuật đặc biệt của GLS.
 TH2: Khi chưa biết:

Xét mô hình ban đầu: (1)
Mô hình có hiện tượng PSSS ngẫu nhiên thay đổi và giá trị của nó chưa biết:
Var ( =
-

Giả thiết 1: PSSS ngẫu nhiên tỷ lệ với biến giải thích:

Var (==
Chia cả 2 vế của mô hình (1) cho ta có:
+ (4)
Mô hình (4) có phương sai sai số ngẫu nhiên không đổi:
Var (Var (
Ước lượng mô hình (4) bằng phương pháp WLS với trọng số thu được các ước lượng
BLUE.
-

Giả thiết 2: PSSS ngẫu nhiên tỷ lệ với bình phương của biến giải thích:

Var ( = =
Chia cả 2 vế của mô hình (1) cho ta có:
(3)
Mô hình (3) có PSSS ngẫu nhiên không đổi:
Var () = Var (=

Ước lượng mô hình (3) bằng phương pháp WLS với trọng số = thu được các ước lượng
tuyến tính, không chệch tốt nhất (BLUE).
9

9


Giả thiết 3: PSSS ngẫu nhiên tỷ lệ với bình phương kỳ vọng có điều kiện phụ

-

thuộc:
Var
Hồi quy mô hình gốc thu được
Thay
-

Giả thuyết 4: Dạng hàm sai

Thay đổi sang dạng hàm khác
2.2.2. Tự tương quan
2.2.2.1.
Bản chất
 Vi phạm giả thiết:

Cov
Tức là: Cov
 Tự tương quan bậc 1:

(6.1) AR (1)

-

Tự tượng quan bậc p:
(6.2) AR (p)

2.2.2.2.
Nguyên nhân
- Khách quan:

+ Tính quán tính của biến ngẫu nhiên.
+ Hiện tượng mạng nhện.
+ Tính “trễ” của các địa lượng kinh tế.
- Chủ quan: Kỹ thuật thi thập số liệu hay sai lầm khi thiết lập mô hình (bỏ biến, dạng

hàm sai...).
2.2.2.3.
Hậu quả
- Các ƯL BPNN là các ƯL tuyến tính, không chệch nhưng không còn là ước lượng
-

hiệu quả của .
Phương sai ước lượng được các bình phương nhỏ nhất thông thường là lệch và thông
thường là thấp hơn giá trị thực của phương sai, do đó, giá trị của thống kê T được
phóng đại lên nhiều lần.

10

10



-

Các kiểm định t và F nói chung không đáng tin cậy.
cho ước lượng lệch của thực, và trong một số trường hợp nó dường như ước lượng

-

thấp
R2 có thể là độ đo không đáng tin cậy cho R2 thực
Các phương sai và sai số tiêu chuẩn của dự đoán đã tính được cũng có thểkhông hiệu
quả.

=> Khoảng tin cậy và kết quả kiểm định không còn ý nghĩa.
Phát hiện hiện tượng tự tương quan

2.2.2.4.

 Kiểm định d (Durbin – Waston)

Ước lượng mô hình hồi quy gốc thu được
BTKĐ:
Với TCKĐ: d=
Miền bác bỏ (Với n, biến giải thích k’ = k – 1 tìm được dL và dU)






(1)


(2)

(3)

(4)

(5)

Tự tương quan

Không có kết

Không có tự

Không có kết

Tự tương quan

dương

luận

tương quan

luận

âm

0


dL

dU

4 – dU

4 – dL

4

 Kiểm định B-G (Breush-Godfrey)

Mô hình.
Giả sử
• Bằng phương pháp OLS, ước lượng mô hình ban đầu để nhận được các phần dư ,

và ước lượng mô hình để thu được hệ số xác định bội .
• BTKĐ:
<=>
• TCKĐ: Nếu H0 đúng thì
• Nếu P – giá trị < => Bác bỏ H 0 , chấp nhận H 1 và kết luận mô hình có tự tương

quan.
2.2.2.5.

Khắc phục tự tương quan
Bài toán: Giả sử MH gốc

11


11


Có xảy ra hiện tượng TTQ bậc 1. Khắc phục hiện tượng trên:
 TH1: Khi cấu trúc tự tương quan đã biết:




Xét MH:
Với cấu trúc TTQ:
Phương pháp sai phân tổng quát
(1)

(2)



Thay vì ước lượng mô hình (1) sẽ ước lượng mô hình (2). Để thu được kết quả
mô hình ban đầu cần biến đổi:

 TH2: Khi cấu trúc tự tương quan chưa biết:

Dựa vào thống kê d:
d
(3)

Thay vì ước lượng mô hình (1) sẽ ước lượng mô hình (3). Để thu được kết quả mô hình ban
đầu cần biến đổi:


2.2.3. Đa cộng tuyến
2.2.3.1.
Bản chất
- Đa cộng tuyến hoàn hảo:

++…+
-

Đa cộng tuyến không hoàn hảo:
++…+

2.2.3.2.
Nguyên nhân
- Do bản chất của các mối quan hệ giữa các biến độc lập.
12

12


- Mô hình dạng đa thức.
- Mẫu không mang tính đại diện.
2.2.3.3.
Hậu quả
- Nếu xảy ra đa cộng tuyến hoàn hảo: không xác định

Se
-

Nếu xảy ra đa cộng tuyến hoàn hảo:

+ Se rất lớn.
+Khoảng tin cậy của rộng.
+Tỷ số T= mất ý nghĩa.
+Dấu của khác so với thực tế.
+Kết quả ước lượng khá nhạy khi có sự thay đổi nhỏ trong mẫu.

2.2.3.4.


Phát hiện hiện tượng đa cộng tuyến

Phương pháp cao, chỉ số t thấp.
Hiện tượng đa cộng tuyến xảy ra khi:
+
+ Tồn tại
Kết luận: Có xảy ra đa cộng tuyến.

Ngược lại, nếu không thỏa mãn 1 trong hai điều kiện trên thì không xảy ra hiện tượng.


Phương pháp nhân tử phóng đại phương sai (VIF)

VIF = , Nếu VIF >10 thì xảy ra đa cộng tuyến


Phương pháp hồi quy phụ.
Chọn một biến để hồi quy theo các biến giải thích còn lại để thu được
BTKĐ:

• CKĐ:

Nếu đúng thì F



:
Dựa vào hoặc P – giá trị để kiểm định giả thiết:
13

13


+ Nếu P – giá trị < => Bác bỏ H0 , chấp nhận H1 và kết luận mô hình có đa cộng
tuyến
+ Nếu P – giá trị > => Bác bỏ H1, chấp nhận H0 và kết luận mô hình không có đa
cộng tuyến.


Phương pháp tương quan cặp giữa các biến giải thích cao

Nếu  hệ số tương quan cặp cao
Suy ra: Có cơ sở để khẳng định: mô hình có đa cộng tuyến giữa
2.2.3.5.

Khắc phục đa cộng tuyến
- Thu thập thêm số liệu mới:
+ Nếu có hiện tượng đa cộng tuyến thì có thể chọn lại mẫu. Phương án này có thể
sử dụng chi phí cho việc lấy mẫu khác ở mức độ chấp nhận được.
+ Đôi khi chỉ cần thu nhập thêm số liệu, tăng cỡ mẫu có thể làm giảm tính nghiêm
+


trọng trong đa cộng tuyến.
Bỏ biến:
Khi mô hình có hiện tượng đa cộng tuyến nghiêm trọng thì cách “đơn giản nhất”

+

là bỏ biến ra khỏi mô hình.
Có 2 cách để chọn biến loại khỏi mô hình:

C1: Loại khỏi mô hình biến có tỷ số t thấp nhất.
C2: Lần lượt bỏ từng biến, hồi quy mô hình và chọn mô hình có hệ số cao nhất.
-

Sử dụng sai phân cấp 1:

Xét mô hình 3 biến với số liệu theo thời gian:

Tại thời điểm (t-1) có mô hình:

Trừ vế với của 2 mô hình trên khi đó ta có:

=>
Mô hình này là mô hình sai phân cấp 1.
14

14


Thực tế cho thấy mô hình sai phân cấp 1 đã giảm được đáng kể mức độ đa cộng tuyến
của mô hình gốc.

2.2.4.

Tính phân phối chuẩn của sai số ngẫu nhiên

Để kiểm định có phân phối chuẩn hay không ta có thể dùng bằng cách sử dụng kiểm
định Jarque-Bera (JB).
]
Trong đó S là hệ số bất đối xứng, K là độ nhọn. Trong trường hợp tổng quát K và S
được tính như sau:




+
+

Với n khá lớn JB có phân bố xấp xỉ (2). Xét cặp giả thiết
sẽ bị bác bỏ nếu JB >, trường hợp ngược lại không có cơ sở bác bỏ
Hoặc dựa vào P_ giá trị:
P_ giá trị >, Chấp nhận H0, đồng thời bác bỏ H1.
P_ giá trị <, chấp nhận H1, đồng thời bác bỏ H0

CHƯƠNG 3: VẬN DỤNG
3.1.
Xây dựng mô hình hồi quy:
3.1.1 Bảng số liệu:

15

15



Bảng 3.1

Trong đó: Y là tổng chi tiêu (triệu đồng/tháng)
X là tổng thu nhập (triệu đồng/tháng)
Z là tổng chi cho tiền thuê trọ (triệu đồng/tháng)
16

16


T là tổng chi cho tiền ăn uống (triệu đồng/tháng)

Mean
Median
Maximum
Minimum
Std. Dev.
Skewness
Kurtosis
Jarque-Bera
Probability
Sum
Sum Sq. Dev.
Observations

Y
2.754762
2.500000

6.000000
1.000000
1.023433
1.300180
5.812443
25.67549
0.000003
115.7000
42.94405
42

X
3.764286
3.500000
7.000000
1.200000
1.524886
0.582065
2.359147
3.090307
0.213279
158.1000
95.33643
42

Z
0.840476
0.900000
2.000000
0.000000

0.466335
0.090621
3.771821
1.099974
0.576957
35.30000
8.916190
42

T
1.161905
1.000000
2.500000
0.300000
0.525428
0.804941
3.382368
4.791375
0.091110
48.80000
11.31905
42

Bảng 3.2
Thông kê mô tả các biến số trong mô hình nghiên cứu ở bảng 3.2 với các giá trị
được liệt kê như giá trị trung bình (mean), giá trị lớn nhất (maximum), giá trị nhỏ nhất
(minimum), độ lệch chuẩn (Std. Dev.), độ nghiêng (Skewness), độ nhọn (Kurtosis),
tổng bình phương các phần dư (Sum Sq. Dev)….
Từ bảng trên ta thấy tổng chi tiêu hàng tháng của sinh viên cao nhất là 6 triệu
đồng, thấp nhất là 1 triệu đồng và trung bình chi tiêu hàng tháng là 2,754762 triệu

đồng. Tổng thu nhập hàng tháng của sinh viên cao nhất là 7 triệu và thấp nhất là 1,2
triệu đồng, trung bình thu nhập hàng tháng là 3,764286 triệu đồng. Tổng chi tiêu cho
tiền trọ hàng tháng của sinh viên cao nhất là 2 triệu đồng, thấp nhất là 0 triệu đồng, đây
là những bạn có nhà ở gần trường hoặc ở nhà người thân. Tổng chi cho ăn uống lớn
nhất là 2.5 triệu đồng, nhỏ nhất là 0,3 triệu đồng, trung bình là 1,161905 triệu đồng.
Như vậy nhìn vào con số lớn nhất và số liệu trung bình có thể thấy, mức chi tiêu hàng
tháng của sinh viên là khá cao. Các nhân tố đưa ra có khả năng tác động đến biến giải
thích.

3.1.2.

Mô hình hồi quy mẫu:

Dependent Variable: Y
Method: Least Squares
17

17


Date: 07/08/20 Time: 21:14
Sample: 1 42
Included observations: 42
Variable

Coefficient

Std. Error

t-Statistic


Prob.

C
X
Z
T

0.820123
0.247770
-0.431251
1.174294

0.190374
0.105564
0.165660
0.288376

4.307964
2.347116
-2.603233
4.072099

0.0001
0.0242
0.0131
0.0002

0.840262
0.827651

0.424877
6.859791
-21.54357
66.62991
0.000000

Mean dependent var
S.D. dependent var
Akaike info criterion
Schwarz criterion
Hannan-Quinn criter.
Durbin-Watson stat

R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
F-statistic
Prob(F-statistic)

Bảng 3.3: Kết quả phân tích hồi quy

Mô hình hồi quy mẫu:
3.2.
Phát hiện và khắc phục khuyết tật của mô hình:
3.2.1.
Phương sai sai số thay đổi:
a. Phát hiện hiện tượng phương sai sai số thay đổi


Sử dụng Kiểm định White
Với mức ý nghĩa α=0.05
BTKĐ
Kết quả eview:
Heteroskedasticity Test: White
F-statistic
Obs*R-squared
Scaled explained SS

2.421154
17.01412
9.140642

Prob. F(9,32)
Prob. Chi-Square(9)
Prob. Chi-Square(9)

Test Equation:
Dependent Variable: RESID^2
Method: Least Squares
Date: 07/08/20 Time: 22:06
Sample: 1 42
Included observations: 42

18

18

0.0317
0.0485

0.4244

2.754762
1.023433
1.216361
1.381853
1.277020
1.935664


Variable

Coefficient

Std. Error

t-Statistic

Prob.

C
X^2
X*Z
X*T
X
Z^2
Z*T
Z
T^2
T


0.166878
-0.060622
0.006952
0.338855
0.091496
-0.128038
0.013549
0.173773
-0.329320
-0.515843

0.410020
0.079125
0.142848
0.441847
0.206352
0.198008
0.347916
0.280659
0.708607
0.518928

0.407000
-0.766149
0.048666
0.766905
0.443398
-0.646629
0.038943

0.619158
-0.464743
-0.994055

0.6867
0.4492
0.9615
0.4488
0.6605
0.5225
0.9692
0.5402
0.6453
0.3277

R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
F-statistic
Prob(F-statistic)

0.405098
0.237782
0.165348
0.874876
21.70279
2.421154
0.031724


Mean dependent var
S.D. dependent var
Akaike info criterion
Schwarz criterion
Hannan-Quinn criter.
Durbin-Watson stat

0.163328
0.189391
-0.557276
-0.143545
-0.405627
2.205911

Bảng 3.4

Từ bảng Eviews, ta thấy:
Thống kê F-statistic có P_value=0.0317<0.05
Bác bỏ

, chấp nhận

Kết luận: Mô hình có hiện tượng phương sai sai số thay đổi.
b. Khắc phục hiện tượng PSSS thay đổi

Xét mô hình
KĐGT :
Xét trường hợp
Giả thiết :


chưa biết
(

là hằng số dương)

Với mỗi i chia cả 2 vế của mô hình gốc cho

19

19

(với

), ta được:


Mô hình có

Trong đó, biến phụ thuộc là :

Các biến độc lập là:

,

,

.

Kết quả thực hiện eview:

Dependent Variable: Y
Method: Least Squares
Date: 07/09/20 Time: 14:44
Sample: 1 42 IF X<>0
Included observations: 42
Weighting series: 1/SQR(X)
Weight type: Inverse standard deviation (EViews default scaling)
Variable

Coefficient

Std. Error

t-Statistic

Prob.

C
X
Z
T

0.778004
0.268214
-0.322072
1.065335

0.175560
0.094190
0.146003

0.269646

4.431557
2.847584
-2.205926
3.950862

0.0001
0.0071
0.0335
0.0003

Weighted Statistics
R-squared
0.840141
Adjusted R-squared 0.827521
S.E. of regression
0.394251
Sum squared resid
5.906476
Log likelihood
-18.40139
F-statistic
66.57005
Prob(F-statistic)
0.000000

Mean dependent var
S.D. dependent var
Akaike info criterion

Schwarz criterion
Hannan-Quinn criter.
Durbin-Watson stat
Weighted mean dep.

2.586247
0.557489
1.066733
1.232225
1.127393
2.001042
2.416046

Unweighted Statistics
R-squared
Adjusted R-squared
S.E. of regression
Durbin-Watson stat

0.836478
0.823568
0.429881
2.091917

Mean dependent var
S.D. dependent var
Sum squared resid

2.754762
1.023433

7.022313

Bảng 3.5

Thực hiện kiểm định White để kiểm tra lại mô hình còn xảy ra hiện tượng phương sai
sai số hay không
Heteroskedasticity Test: White
F-statistic

20

1.286439

Prob. F(9,32)

0.2821

20


Obs*R-squared
Scaled explained
SS

11.15871

Prob. Chi-Square(9)

0.2650


5.967957

Prob. Chi-Square(9)

0.7431

Bảng 3.6

Từ bảng Eveiw ta thấy:
Thống kê F-statistic có P _value =0.2821>0.05
 Chấp nhận
, bác bỏ
.
 Mô hình không còn hiện tượng phương sai sai số thay đổi.

Kết luận: Vậy mô hình đã khắc phục thành công hiện tượng phương sai sai số thay đổi.
3.2.2.

Đa cộng tuyến:

Sau khi chạy Eview ta thu được kết quả sau:
Dependent Variable: Y
Method: Least Squares
Date: 07/09/20 Time: 14:44
Sample: 1 42 IF X<>0
Included observations: 42
Weighting series: 1/SQR(X)
Weight type: Inverse standard deviation (EViews default scaling)
Variable


Coefficient

Std. Error

t-Statistic

Prob.

C
X
Z
T

0.778004
0.268214
-0.322072
1.065335

0.175560
0.094190
0.146003
0.269646

4.431557
2.847584
-2.205926
3.950862

0.0001
0.0071

0.0335
0.0003

Weighted Statistics
R-squared
0.840141
Adjusted R-squared 0.827521
S.E. of regression
0.394251
Sum squared resid
5.906476
Log likelihood
-18.40139
F-statistic
66.57005
Prob(F-statistic)
0.000000

Mean dependent var
S.D. dependent var
Akaike info criterion
Schwarz criterion
Hannan-Quinn criter.
Durbin-Watson stat
Weighted mean dep.

2.586247
0.557489
1.066733
1.232225

1.127393
2.001042
2.416046

Unweighted Statistics
R-squared
Adjusted R-squared
S.E. of regression
Durbin-Watson stat

0.836478
0.823568
0.429881
2.091917

Mean dependent var
S.D. dependent var
Sum squared resid

2.754762
1.023433
7.022313

Bảng 3.5

Nhận thấy R = 0.840141 >0.8 => R cao
|t|>2
Vậy chưa có kết luận gì về hiện tượng đa cộng tuyến của mô hình.
Phát hiện hiện tượng đã cộng tuyến dựa vào sự tương quan giữa các biến độc lập:
2


21

2

21


X
Z
T

X
1.000000
0.367709
0.880454

Z
0.367709
1.000000
0.154764

T
0.880454
0.154764
1.000000

Nhận thấy hệ số tương quan giữa cặp biến X,T : |r (X, T)| =0.880454 >0.8
=> mô hình có xảy ra đa cộng tuyến giữa X và T.
Kết luận: Mô hình có hiện tượng đa cộng tuyến.



Khắc phục đa cộng tuyến( phương pháp lấy sai phân cấp 1)

Ta có mô hình ban đầu:

Phương trình trên đúng với i thì cũng đúng với i-1



Lấy sai phân cấp 1

Bảng lấy sai phân cấp 1 sau khi đã khắc phục :
Dependent Variable: Y-Y(-1)
Method: Least Squares
Date: 07/12/20 Time: 08:17
Sample: 1 42 IF X<>0
Included observations: 41

22

Variable

Coefficient

Std. Error

t-Statistic

Prob.


C
X-X(-1)
Z-Z(-1)
T-T(-1)

-0.012392
0.385139
-0.566109
1.176734

0.084799
0.092781
0.143855
0.281598

-0.146131
4.151065
-3.935265
4.178770

0.8846
0.0002
0.0004
0.0002

22


R-squared

Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
F-statistic
Prob(F-statistic)

0.872213
0.861852
0.542693
10.89708
-31.01239
84.18177
0.000000

Mean dependent var
S.D. dependent var
Akaike info criterion
Schwarz criterion
Hannan-Quinn criter.
Durbin-Watson stat

0.024390
1.460099
1.707922
1.875099
1.768798
2.711025

Bảng 3.7

Bảng kiểm tra lại tương quan giữa các biến:
X-X(-1)

Z-Z(-1)

T-T(-1)

X-X(-1)

1.000000

0.124885

0.755532

Z-Z(-1)

0.124885

1.000000

-0.296198

T-T(-1)

0.755532

-0.296198

1.000000


=0,755532 < 0,8
=> Mô hình không còn đa cộng tuyến giữa X và T
Mô hình hồi quy mẫu sau khi khắc phục hiện tượng:

3.3.

 Mô hình hồi quy tổng thể

 Mô hình hồi quy mẫu



: cho biết các biến độc lập giải thích được 87.2213 % sự biến động của các biến
phụ thuộc

 Ý nghĩa của hệ số hồi quy mẫu

: Khi tổng chi tiêu cho tiền trọ và tổng chi tiêu cho ăn uống không đổi, tổng thu
nhập tăng lên 1 triệu / tháng thì tổng chi tiêu trung bình sẽ tăng lên triệu đồng.
: Khi tổng thu nhập và tổng chi tiêu cho ăn uống không đổi, tổng chi tiêu cho tiền
trọ tăng lên 1 triệu đồng/ tháng thì tổng chi tiêu trung bình sẽ giảm đi triệu đồng.
: Khi tổng thu nhập và tổng chi cho tiền trọ không đổi, tổng chi tiêu cho ăn uống
tăng lên 1 triệu đồng/tháng thì tổng chi tiêu trung bình sẽ tăng lên 1.176734 triệu.
23

23


3.4.


Ước lượng các hệ số hồi quy:

Bài toán: Với độ tin cậy 95%, hãy ước lượng các hệ số hồi quy
 Ước lượng


Chọn thống kê:

Khoảng tin cậy của

Với độ tin cậy 95%, ta có kết quả eviews:
Coefficient Confidence Intervals
Date: 07/12/20 Time: 11:45
Sample: 1 42 IF X<>0
Included observations: 41

95% CI
Variable

Coefficient

Low

High

C

-0.012392


-0.184210

0.159427

X-X(-1)

0.385139

0.197147

0.573130

Z-Z(-1)

-0.566109

-0.857587

-0.274630

T-T(-1)

1.176734

0.606162

1.747306

Bảng3.8
Dựa vào bảng kết quả trên, ta có:

Ước lượng :
Khoảng tin cậy của : (0.197147; 0.573130)
Với độ tin cậy 95%, ta có thể nói rằng khi tổng chi tiêu cho tiền trọ và chi tiêu cho
ăn uống không thay đổi, tổng thu nhập của sinh viên tăng lên 1 triệu đồng thì tổng
chi tiêu trung bình có thể giảm nhiều nhất là 0.197147 triệu đồng hoặc tăng nhiều
nhất là 0.573130 triệu đồng.
Ước lượng :
24

24


Khoảng tin cậy của : (-0.857587; -0.274630)
Với độ tin cậy 95%, ta có thể nói rằng, khi tổng thu nhập và tổng chi tiêu cho ăn
uống không thay đổi, tổng chi tiêu cho tiền trọ tăng lên 1 triệu đồng thì tổng chi
tiêu trung bình có thể giảm nhều nhất là 0.857587 triệu đồng hoặc giảm ít nhất là
0.026504 triệu đồng.
Ước lượng :
Khoảng tin cậy của ; (0.606162; 1.747306)
Với độ tin cậy 95%, ta có thể nói rằng, khi tổng thu nhập và tổng chi tiêu cho tiền
trọ không thay đổi, tổng chi tiêu cho ăn uống tăng lên 1 triệu đồng thì tổng chi tiêu
trung bình có thể giảm nhiều nhất là 0.606162 triệu đồng hoặc tăng nhiều nhất là
1.747306 triệu đồng.
3.5.

Kiểm định các hệ số hồi quy:
a, Bài toán: Với mức ý nghĩa 5%, hãy kiểm định giả thuyết: tổng thu nhập không
ảnh hưởng đến tổng chi tiêu trung bình của sinh viên.
Với mức ý nghĩa 5%, ta cần kiểm định:
Dựa vào bảng : Ta có P-value của = 0.0002 < 0.05 => Bác bỏ H0, chấp nhận .

Tức là hệ số có ý nghĩa thống kê.
Kết luận: Với mức ý nghĩa 5%, ta có thể nói rằng tổng thu nhập có ảnh hưởng
đến tổng chi tiêu trung bình của sinh viên.
b, Bài toán: Với mức ý nghĩa 5%, hãy kiểm định giả thuyết: tổng chi cho tiền trọ
không ảnh hưởng đến tổng chi tiêu trung bình của sinh viên.
Với mức ý nghĩa 5%, ta cần kiểm định:
Dựa vào bảng : Ta có P-value của = 0.0004 < 0.05 => Bác bỏ H0, chấp nhận .
Tức là hệ số có ý nghĩa thống kê.
Kết luận: Với mức ý nghĩa 5%, ta có thể nói rằng tổng chi cho tiền trọ có ảnh
hưởng đến tổng chi tiêu trung bình của sinh viên.
c, Bài toán: Với mức ý nghĩa 5%, hãy kiểm định giả thuyết: tổng chi cho ăn uống
không ảnh hưởng đến tổng chi tiêu trung bình của sinh viên.
Với mức ý nghĩa 5%, ta cần kiểm định:
Dựa vào bảng : Ta có P-value của = 0.0002 < 0.05 => Bác bỏ H0, chấp nhận .
Tức là hệ số có ý nghĩa thống kê.
Kết luận: Với mức ý nghĩa 5%, ta có thể nói rằng tổng chi cho ăn uống có ảnh

hưởng đến tổng chi tiêu trung bình của sinh viên.
3.6.
Kiểm định giả thuyết đồng thời:
25

25


Xem Thêm

×