BankQ Advisor là một chatbot tư vấn tài chính thông minh sử dụng mô hình ngôn ngữ lớn Qwen3-4B được fine-tuned với kỹ thuật LoRA và tích hợp RAG (Retrieval-Augmented Generation).
BankQ Advisor là một chatbot tư vấn tài chính thông minh sử dụng mô hình ngôn ngữ lớn Qwen3-4B được fine-tuned với kỹ thuật LoRA và tích hợp RAG (Retrieval-Augmented Generation) để cung cấp dịch vụ tư vấn tài chính mobile. Tích hợp call API để lấy thông tin người dùng và xử lý quyết định yêu cầu từ phía người dùng (Ví du: kích hoạt thẻ, báo cáo tài chính, phân tích rủi ro).
Ưu điểm mô hình:
Nhẹ nhưng đủ mạnh: 4B tham số → chạy được trên 1 GPU phổ thông (T4/V100 ~16GB) với QLoRA; suy luận nhanh, phù hợp realtime chat.
Đa ngôn ngữ/tiếng Việt ổn: Qwen 3 có chất lượng tốt ở các ngôn ngữ châu Á; fine-tune thêm giúp văn phong CSKH tiếng Việt tự nhiên, lịch sự.
Bộ tokenizer tốt cho tiếng Việt: ít vỡ từ, độ dài prompt/đáp ứng hiệu quả → tiết kiệm token và RAM.
Hỗ trợ Chat template + function-calling/tool-use: tiện cắm RAG, call API (lấy giao dịch, hạn mức, trạng thái thẻ).
Tương thích PEFT: QLoRA→ chi phí fine-tune thấp, có thể dùng 4-bit/8-bit optimizer (paged_adamw_8bit) để tiết kiệm bộ nhớ.
Latency / TCO: 4B → thời gian đáp ứng ngắn, chi phí serving rẻ; dễ scale theo số phiên.
Mở & linh hoạt triển khai on-prem: thuận lợi cho dữ liệu nhạy cảm ngân hàng, kiểm soát rò rỉ dữ liệu.
* Lưu ý: Demo chưa thể hiện được hết chức năng bởi trong quá trình phát triển và xử lý lỗi, nhưng chắc chắn sẽ hoàn thiện trong thời gian tới.
80%