SỬ DỤNG TRÍ TUỆ NHÂN TẠO GIẢI BÀI TOÁN THỜI ĐIỂM DỪNG TỐI ƯU TRONG ĐẦU TƯ TÀI CHÍNH

Phạm Văn Khánh; Nguyễn  Thành Trung

PDF

Số xuất bản: Tập 1 Số 1 (2021)

Chuyên mục: KHOA HỌC QUẢN LÝ VÀ QUẢN LÝ-KINH TẾ

Ngày xuất bản: 30/11/2021

Lượt xem 1137

Lượt tải xuống 730

Trích dẫn bài báo

Phạm, V. K., & Nguyễn , T. T. (2023). SỬ DỤNG TRÍ TUỆ NHÂN TẠO GIẢI BÀI TOÁN THỜI ĐIỂM DỪNG TỐI ƯU TRONG ĐẦU TƯ TÀI CHÍNH. Tạp chí Khoa học Thăng Long: Khoa học Ứng dụng, 1(1), 15-27. https://science.thanglong.edu.vn/index.php/vola/article/view/7

Định dạng trích dẫn:

SỬ DỤNG TRÍ TUỆ NHÂN TẠO GIẢI BÀI TOÁN THỜI ĐIỂM DỪNG TỐI ƯU TRONG ĐẦU TƯ TÀI CHÍNH

Phạm Văn Khánh¹, Nguyễn Thành Trung^2,
¹ Viện Toán học và Khoa học ứng dụng (TIMAS), Trường Đại học Thăng Long
² Học viên cao học Phân tích dữ liệu QH-2018.T.CH, Khoa Toán – Cơ – Tin, Đại học Khoa học Tự nhiên

Tóm tắt

rong bài báo này, chúng tôi trình bày một công cụ cao cấp của Trí tuệ nhân tạo, học tăng cường để thử nghiệm trong đầu tư cổ phiếu. Trí tuệ nhân tạo về cơ bản gồm có học máy, học sâu và học tăng cường.
Học tăng cường sử dụng các lý thuyết toán học như quy hoạch động, quá trình quyết định Markov để cải tiến hành động trở nên tối ưu hơn. Học tăng cường có rất nhiều thuật toán khác nhau. Trong bài báo này, chúng tôi sử dụng thuật toán Zap Q-Learning để áp dụng trong việc đầu tư 30 mã cổ phiếu của thị trường chứng khoán Việt Nam. Chúng tôi thu được kết quả khá khiêm tốn: sau khi chiết khấu phần lãi suất ngân hàng, thì lợi nhuận còn khoảng 3%.

Từ khóa

Trí tuệ nhân tạo, Học tăng cường, Thời điểm dừng tối ưu, Đầu tư tài chính, Xích Markov

Tài liệu tham khảo

[1] Chen, S., Devraj, A. M., Busic, A., Meyn, S., (2019), Zap Q-Learning for Optimal Stopping Time Problems, arXiv:1904.11538v3.
[2] Choi, D. and Van Roy, B., (2006), A generalized Kalman filter for fixed point approximation and efficient temporal-difference learning, Discrete Event Dynamic Systems: Theory and Applications, 16(2):207–239.
[3] Sutton, R. S. and Barto, A. G., (2018), Reinforcement Learning: An introduction, The MIT Press, Cambridge, Massachusetts.
[4] Tsitsiklis, J. N. and Van Roy, B., (1999), Optimal stopping of Markov processes: Hilbert space theory, approximation algorithms, and an application to pricing high-dimensional financial derivatives, IEEE Trans. Automat. Control, 44(10):1840–1851.
[5] Đặng Hùng Thắng, (2007), Giáo trình xác suất: Quá trình ngẫu nhiên và tính toán ngẫu nhiên, NXB Đại học quốc gia Hà Nội, Hà Nội.
[6] Nguyễn Duy Tiến, (2000), Các mô hình xác suất và ứng dụng: Phần I – Xích Markow và ứng dụng, NXB Đại học quốc gia Hà Nội, Hà Nội.

Thanh bên bài viết

Nội dung chính của bài viết

Tóm tắt

Từ khóa

Chi tiết bài viết

Tài liệu tham khảo