Hướng dẫn mô hình dự báo thông dụng: AR MA ARIMA; Khi dự báo dữ liệu đơn, tức là dữ liệu không có sự tương quan của các dữ liệu khác, thì mô hình dự báo như ar ma arima là vô cùng chính xác, bởi vậy trong hướng dẫn này chúng tôi sẽ hướng dẫn các 3 mô hình dự báo thông dụng này.
Mô hình dự báo thông dụng
Phần mềm thống kê Grelt là gì ?
Grelt là một phần mềm thống kê miễn phí và mã nguồn mở được sử dụng để thực hiện các phân tích thống kê trong nghiên cứu khoa học. Tên Grelt viết tắt cho “Graphical Exploration of Data Analysis Results Using Lucid Thinking”, nghĩa là khám phá đồ họa kết quả phân tích dữ liệu bằng tư duy rõ ràng.
Grelt cung cấp nhiều tính năng, bao gồm khả năng thực hiện các kiểm định thống kê cơ bản và phân tích đa biến, khảo sát dữ liệu, tạo biểu đồ, phân tích hồi quy, tạo báo cáo và xuất dữ liệu.
Grelt được phát triển bởi trường Đại học A Coruña tại Tây Ban Nha và hiện đã được sử dụng rộng rãi trong cộng đồng nghiên cứu khoa học, đặc biệt là trong các lĩnh vực như y học, sinh học, và kinh tế học. Grelt được phát hành dưới giấy phép GNU GPL và có thể tải xuống miễn phí từ trang web của nó.
Mô hình AR(p)
Mô hình AR là một trong những mô hình dự báo thời gian phổ biến trong kinh tế học và thống kê. AR viết tắt cho “Autoregressive” (tự hồi quy), và mô hình AR giả định rằng giá trị của chuỗi thời gian tại một thời điểm phụ thuộc vào các giá trị trước đó của cùng chuỗi thời gian.
Mô hình AR được biểu diễn bằng phương trình:
y_t = c + phi_1*y_{t-1} + phi_2*y_{t-2} + ... + phi_p*y_{t-p} + epsilon_t
Ở đây, y_t là giá trị của chuỗi thời gian tại thời điểm t, c là hằng số, phi_1, phi_2,…, phi_p là các tham số hồi quy của mô hình, p là số lượng giá trị trước đó mà mô hình sử dụng để dự báo giá trị hiện tại, và epsilon_t là sai số ngẫu nhiên tại thời điểm t.
Để sử dụng mô hình AR để dự báo giá trị tại một thời điểm trong tương lai, ta có thể sử dụng giá trị thực tế của chuỗi thời gian trước đó để ước tính các tham số hồi quy của mô hình và sau đó áp dụng mô hình để dự báo giá trị tại thời điểm mong muốn. Mô hình AR có thể được mở rộng để bao gồm các biến giải thích bổ sung hoặc để xử lý các vấn đề phức tạp hơn, như mô hình ARIMA (Autoregressive Integrated Moving Average) hay mô hình VAR (Vector Autoregression).
Mô hình MA(q)
Mô hình MA là một trong những mô hình dự báo thời gian phổ biến trong kinh tế học và thống kê. MA viết tắt cho “Moving Average” (trung bình di động), và mô hình MA giả định rằng giá trị của chuỗi thời gian tại một thời điểm phụ thuộc vào các sai số ngẫu nhiên của chuỗi thời gian tại các thời điểm trước đó.
Mô hình MA được biểu diễn bằng phương trình:
y_t = c + epsilon_t + theta_1*epsilon_{t-1} + theta_2*epsilon_{t-2} + ... + theta_q*epsilon_{t-q}
Ở đây, y_t là giá trị của chuỗi thời gian tại thời điểm t, c là hằng số, epsilon_t là sai số ngẫu nhiên tại thời điểm t, theta_1, theta_2, …, theta_q là các tham số hồi quy của mô hình, và q là số lượng sai số ngẫu nhiên trước đó mà mô hình sử dụng để dự báo giá trị hiện tại.
Để sử dụng mô hình MA để dự báo giá trị tại một thời điểm trong tương lai, ta có thể sử dụng giá trị thực tế của chuỗi thời gian trước đó để ước tính các tham số hồi quy của mô hình và sau đó áp dụng mô hình để dự báo giá trị tại thời điểm mong muốn. Mô hình MA có thể được mở rộng để bao gồm các biến giải thích bổ sung hoặc để xử lý các vấn đề phức tạp hơn, như mô hình ARMA (Autoregressive Moving Average).
Mô hình ARIMA(p,i,q)
Mô hình ARIMA (Autoregressive Integrated Moving Average) là một trong những mô hình dự báo thời gian phổ biến trong kinh tế học và thống kê. Mô hình ARIMA kết hợp cả hai mô hình AR (tự hồi quy) và MA (trung bình di động) với một thành phần tích hợp (I) để xử lý dữ liệu không ổn định.
Mô hình ARIMA được biểu diễn bằng phương trình:
ARIMA(p,d,q) = AR(p) + I(d) + MA(q)
Trong đó, p là số lượng giá trị trước đó của chuỗi thời gian mà mô hình AR sử dụng để dự báo giá trị tại một thời điểm, d là mức độ tích hợp của chuỗi thời gian (tức số lần phải lấy sai số giữa các giá trị để đưa dữ liệu về trạng thái ổn định), và q là số lượng sai số ngẫu nhiên trước đó của chuỗi thời gian mà mô hình MA sử dụng để dự báo giá trị hiện tại.
Để sử dụng mô hình ARIMA để dự báo giá trị tại một thời điểm trong tương lai, ta có thể sử dụng giá trị thực tế của chuỗi thời gian trước đó để ước tính các tham số hồi quy của mô hình và sau đó áp dụng mô hình để dự báo giá trị tại thời điểm mong muốn. Mô hình ARIMA có thể được sử dụng để xử lý các vấn đề phức tạp hơn, như chuỗi thời gian không ổn định hay xu hướng phức tạp của dữ liệu.
Các tìm {p, i, q}
Tìm i
Số i là số bậc của dữ liệu khi dừng.
Trong thống kê và kinh tế học, một chuỗi thời gian được gọi là dừng (stationary) nếu các giá trị thống kê của chuỗi thời gian như trung bình, phương sai và tương quan giữa các giá trị không thay đổi theo thời gian. Tức là, chuỗi thời gian không có xu hướng tăng hoặc giảm đáng kể, không có dao động giữa các giá trị cách nhau quá lớn, và không có mô hình tăng trưởng khác biệt giữa các khoảng thời gian khác nhau.
Chuỗi thời gian dừng là quan trọng vì nó giúp đơn giản hóa phân tích chuỗi thời gian và tạo ra các dự báo chính xác hơn. Nếu chuỗi thời gian không dừng, ta cần phải xử lý xu hướng và dao động để có thể dự báo chính xác các giá trị trong tương lai.
Một cách để xác định nếu một chuỗi thời gian dừng là sử dụng các kiểm định như Augmented Dickey-Fuller (ADF) hoặc Kwiatkowski-Phillips-Schmidt-Shin (KPSS). Kiểm định ADF kiểm tra xem một chuỗi thời gian có chứa xu hướng hay không, trong khi kiểm định KPSS kiểm tra xem một chuỗi thời gian có đủ ổn định để dự báo hay không.
Trước hết, thì chúng ta xem dữ liệu gốc của chúng ta như thế nào ?
Để có “chắc ăn” chúng ta dùng kiểm định để kiểm tra xem sao?
Variables > Unit root test
test without constant
including 2 lags of (1-L)FDI
model: (1-L)y = (a-1)*y(-1) + ... + e
estimated value of (a - 1): 0.043311
test statistic: tau_nc(1) = 1.71244
asymptotic p-value 0.9795
1st-order autocorrelation coeff. for e: -0.019
lagged differences: F(2, 50) = 5.648 [0.0061]
Ta có P-value > 0.05 => Dữ lại của chúng ta không Dừng ở bậc gốc nha, với kết quả như thế này thì chúng ta có cùng nhận xét với đồ thị trên. Tiếp theo thì chúng ta cần kiểm định khi sai phân bậc 1 thì dữ liệu ra sao ?
Giờ thì thêm kiểm định nữa xem sao ?
test without constant
including one lag of (1-L)d_FDI
model: (1-L)y = (a-1)*y(-1) + ... + e
estimated value of (a - 1): -1.60702
test statistic: tau_nc(1) = -7.20538
asymptotic p-value 5.367e-12
1st-order autocorrelation coeff. for e: 0.001
Ta có P-value < 0.05 => Dữ liệu đã dừng ở sai phân bậc 1 => i =1
Tìm p q
Ta dùng đồ thị Correlogram để xét
Ta kích hoạt chương trình theo đường dẫn
Variable > correlogram
Ta nhìn thấy cột màu xanh nào vượt qua mức giới hạn ( màu cam) thì ta chọn lag đó.
Nhìn vào đồ thị trên thì ta dễ dàng nhận được p=1 và q=1
Giờ ta đã có mô hình arima(1,1,1)
Dự báo thôi.
Mô hình dự báo tự hồi quy (AR)
Ước lượng mô hình tự hồi quy AR
Model > Univarirate> Arima | forecast
Mean Error 0.047892
Root Mean Squared Error 0.5377
Mean Absolute Error 0.41654
Mean Percentage Error -4.2284
Mean Absolute Percentage Error 18.944
Theil's U2 0.92836
Mô hình dự báo trung bình di động MA(1)
Kết quả cho ta được như sau:
Mean Error 0.0090349
Root Mean Squared Error 0.83142
Mean Absolute Error 0.68872
Mean Percentage Error -18.217
Mean Absolute Percentage Error 36.263
Theil's U2 1.2373
Mô hình dự báo arima
Mean Error -0.02519
Root Mean Squared Error 0.45563
Mean Absolute Error 0.34111
Mean Percentage Error -6.7052
Mean Absolute Percentage Error 16.585
Theil's U2 0.68479
Kết luận
Trong 3 mô hình dự báo trên, thì từng trường hợp, nhưng phần lớn kết quả cho arima lúc nào cũng có kết quả chính xác hơn. Nếu chúng ta kết hợp thêm tính mùa vụ vào trong dự báo arima thì còn cho ra kết quả chính xác hơn nữa.
Và đặc biệt là chúng ta còn kết hợp thêm các chương trình máy học vào, thì kết quả càng chính xác hơn nữa.
Dịch vụ làm dự báo trong kinh doanh
“Chào mừng đến với dịch vụ làm dự báo trong kinh doanh tốt nhất của chúng tôi!
👋Phân tích định lượng | 👩🎓10 Điểm |
👨🍼Cung cấp số liệu | 🧑💻Nhanh |
✍️Khảo sát thị trường | 🎒Chất lượng |
🕵️♂️Phân tích nghiệp vụ | 👠Uy Tín |
🙌Phân tích kinh doanh | 🧑🎓Điểm 10 |
Chúng tôi là một đội ngũ chuyên gia dự báo với kinh nghiệm lâu năm trong việc cung cấp các giải pháp dự báo chất lượng cao cho khách hàng trong nhiều lĩnh vực khác nhau. Chúng tôi sử dụng các phương pháp và công nghệ tiên tiến nhất để giúp các doanh nghiệp phát hiện ra các xu hướng và biến động trên thị trường, từ đó giúp họ đưa ra các quyết định kinh doanh thông minh và hiệu quả.
Dịch vụ của chúng tôi bao gồm cả dự báo ngắn hạn và dài hạn, dự báo xu hướng và biến động thị trường, dự báo nhu cầu sản phẩm và dịch vụ, và nhiều hơn nữa. Chúng tôi sử dụng các mô hình và phương pháp dự báo đa dạng, bao gồm mô hình ARIMA, SARIMA, VAR, LSTM, và nhiều mô hình khác, để đáp ứng nhu cầu dự báo của khách hàng.
Với dịch vụ của chúng tôi, khách hàng sẽ nhận được các báo cáo dự báo chất lượng cao với những thông tin và phân tích chi tiết, giúp họ đưa ra quyết định kinh doanh đúng lúc và đúng cách. Chúng tôi cam kết cung cấp dịch vụ tốt nhất và giá cả hợp lý để đảm bảo sự hài lòng của khách hàng.
Hãy liên hệ với chúng tôi ngay hôm nay để được tư vấn và báo giá miễn phí!”
Pingback: Hướng dẫn mô hình dự báo thông dụng: AR MA ARIMA - Phân tích kinh doanh chuyên nghiệp
Pingback: LAG: Độ trễ dữ liệu thống kê trong kinh tế lượng - Phân tích nghiệp vụ