SỬ DỤNG TRÍ TUỆ NHÂN TẠO GIẢI BÀI TOÁN THỜI ĐIỂM DỪNG TỐI ƯU TRONG ĐẦU TƯ TÀI CHÍNH
Nội dung chính của bài viết
Tóm tắt
rong bài báo này, chúng tôi trình bày một công cụ cao cấp của Trí tuệ nhân tạo, học tăng cường để thử nghiệm trong đầu tư cổ phiếu. Trí tuệ nhân tạo về cơ bản gồm có học máy, học sâu và học tăng cường.
Học tăng cường sử dụng các lý thuyết toán học như quy hoạch động, quá trình quyết định Markov để cải tiến hành động trở nên tối ưu hơn. Học tăng cường có rất nhiều thuật toán khác nhau. Trong bài báo này, chúng tôi sử dụng thuật toán Zap Q-Learning để áp dụng trong việc đầu tư 30 mã cổ phiếu của thị trường chứng khoán Việt Nam. Chúng tôi thu được kết quả khá khiêm tốn: sau khi chiết khấu phần lãi suất ngân hàng, thì lợi nhuận còn khoảng 3%.
Chi tiết bài viết
Từ khóa
Trí tuệ nhân tạo, Học tăng cường, Thời điểm dừng tối ưu, Đầu tư tài chính, Xích Markov
Tài liệu tham khảo
[2] Choi, D. and Van Roy, B., (2006), A generalized Kalman filter for fixed point approximation and efficient temporal-difference learning, Discrete Event Dynamic Systems: Theory and Applications, 16(2):207–239.
[3] Sutton, R. S. and Barto, A. G., (2018), Reinforcement Learning: An introduction, The MIT Press, Cambridge, Massachusetts.
[4] Tsitsiklis, J. N. and Van Roy, B., (1999), Optimal stopping of Markov processes: Hilbert space theory, approximation algorithms, and an application to pricing high-dimensional financial derivatives, IEEE Trans. Automat. Control, 44(10):1840–1851.
[5] Đặng Hùng Thắng, (2007), Giáo trình xác suất: Quá trình ngẫu nhiên và tính toán ngẫu nhiên, NXB Đại học quốc gia Hà Nội, Hà Nội.
[6] Nguyễn Duy Tiến, (2000), Các mô hình xác suất và ứng dụng: Phần I – Xích Markow và ứng dụng, NXB Đại học quốc gia Hà Nội, Hà Nội.