SỬ DỤNG TRÍ TUỆ NHÂN TẠO GIẢI BÀI TOÁN THỜI ĐIỂM DỪNG TỐI ƯU TRONG ĐẦU TƯ TÀI CHÍNH

Phạm Văn Khánh1, Nguyễn Thành Trung2,
1 Viện Toán học và Khoa học ứng dụng (TIMAS), Trường Đại học Thăng Long
2 Học viên cao học Phân tích dữ liệu QH-2018.T.CH, Khoa Toán – Cơ – Tin, Đại học Khoa học Tự nhiên

Nội dung chính của bài viết

Tóm tắt

rong bài báo này, chúng tôi trình bày một công cụ cao cấp của Trí tuệ nhân tạo, học tăng cường để thử nghiệm trong đầu tư cổ phiếu. Trí tuệ nhân tạo về cơ bản gồm có học máy, học sâu và học tăng cường.
Học tăng cường sử dụng các lý thuyết toán học như quy hoạch động, quá trình quyết định Markov để cải tiến hành động trở nên tối ưu hơn. Học tăng cường có rất nhiều thuật toán khác nhau. Trong bài báo này, chúng tôi sử dụng thuật toán Zap Q-Learning để áp dụng trong việc đầu tư 30 mã cổ phiếu của thị trường chứng khoán Việt Nam. Chúng tôi thu được kết quả khá khiêm tốn: sau khi chiết khấu phần lãi suất ngân hàng, thì lợi nhuận còn khoảng 3%.

Chi tiết bài viết

Tài liệu tham khảo

[1] Chen, S., Devraj, A. M., Busic, A., Meyn, S., (2019), Zap Q-Learning for Optimal Stopping Time Problems, arXiv:1904.11538v3.
[2] Choi, D. and Van Roy, B., (2006), A generalized Kalman filter for fixed point approximation and efficient temporal-difference learning, Discrete Event Dynamic Systems: Theory and Applications, 16(2):207–239.
[3] Sutton, R. S. and Barto, A. G., (2018), Reinforcement Learning: An introduction, The MIT Press, Cambridge, Massachusetts.
[4] Tsitsiklis, J. N. and Van Roy, B., (1999), Optimal stopping of Markov processes: Hilbert space theory, approximation algorithms, and an application to pricing high-dimensional financial derivatives, IEEE Trans. Automat. Control, 44(10):1840–1851.
[5] Đặng Hùng Thắng, (2007), Giáo trình xác suất: Quá trình ngẫu nhiên và tính toán ngẫu nhiên, NXB Đại học quốc gia Hà Nội, Hà Nội.
[6] Nguyễn Duy Tiến, (2000), Các mô hình xác suất và ứng dụng: Phần I – Xích Markow và ứng dụng, NXB Đại học quốc gia Hà Nội, Hà Nội.