VNPT đóng góp kết quả nghiên cứu AI trên dữ liệu Việt tại các hội nghị quốc tế

Công nghệ AI hiện phát triển mạnh trên quy mô toàn cầu, song phần lớn các mô hình và tập dữ liệu huấn luyện hiện nay vẫn được xây dựng dựa trên ngữ cảnh, ngôn ngữ và hành vi người dùng tại các quốc gia phát triển. Tuy nhiên, khi ứng dụng các mô hình đó tại Việt Nam lại có thể gặp sai lệch, hạn chế khả năng hiểu ngôn ngữ, văn hóa, cơ địa người Việt và đặc thù tại Việt Nam.

Việc xây dựng và nghiên cứu AI dựa trên dữ liệu Việt Nam vì thế mang ý nghĩa chiến lược, vừa giúp các hệ thống AI có thể ứng dụng hiệu quả tại Việt Nam, vừa bảo đảm chủ quyền dữ liệu và bảo mật quốc gia.

Hiện nay, hệ sinh thái nghiên cứu AI trong nước cũng đã bắt đầu chuyển dịch để hội nhập quốc tế. Một số tập đoàn công nghệ lớn trong nước đã có các công trình nghiên cứu được công bố tại những hội nghị AI hàng đầu thế giới, được đánh giá cao về tính mới, độ tin cậy và giá trị thực nghiệm – những tiêu chí cốt lõi phản ánh năng lực khoa học và khả năng cạnh tranh toàn cầu.

Điển hình, với định hướng nghiên cứu, ứng dụng AI vào các bài toán đặc thù của Việt Nam, triển khai theo các tiêu chuẩn quốc tế, đội ngũ kỹ sư AI của VNPT cũng đã có nhiều công trình được công bố tại các hội nghị trí tuệ nhân tạo uy tín toàn cầu.

Giải quyết các bài toán thực tiễn từ dữ liệu Việt Nam

Trong lĩnh vực AI xử lý hình ảnh y tế, nhóm nghiên cứu của VNPT phối hợp cùng các bác sĩ Bệnh viện Nội tiết Trung ương Hà Nội đã công bố kết quả tại MICCAI 2025, diễn ra từ 23–27/9/2025 tại Hàn Quốc. Đây là hội nghị quốc tế hàng đầu về AI và thị giác máy tính trong y học, tập trung vào sử dụng công nghệ AI để phân tích hình ảnh y khoa.

Nghiên cứu tập trung vào ứng dụng AI trong chẩn đoán ung thư tuyến giáp, được thực hiện với dữ liệu từ gần 10000 người bệnh tại 3 miền đất nước trong suốt 4 năm. Bộ dữ liệu được gắn nhãn bởi chính các chuyên gia, bác sĩ đầu ngành, xác thực bằng mô bệnh học và chuẩn hóa định dạng nhằm bảo đảm độ tin cậy lâm sàng.

VNPT đóng góp kết quả nghiên cứu AI trên dữ liệu Việt tại các hội nghị quốc tế- Ảnh 1.

VNPT công bố nghiên cứu phát triển hệ thống AI chẩn đoán ung thư tuyến giáp.

Nghiên cứu này đóng vai trò nền tảng cho việc phát triển các hệ thống hỗ trợ chẩn đoán tự động phù hợp với đặc thù dân số và điều kiện y tế trong nước, giúp nâng cao độ chính xác, rút ngắn thời gian chẩn đoán, giảm tải cho bác sĩ, đồng thời mở rộng khả năng tiếp cận dịch vụ y tế chất lượng cao đến các tuyến cơ sở. Với quy mô lớn và độ chuẩn hóa cao, dự án là nguồn dữ liệu huấn luyện và đánh giá quan trọng cho các mô hình AI trong chẩn đoán hình ảnh y khoa, giúp nâng cao độ chính xác trong phát hiện và phân loại tổn thương tuyến giáp tại Việt Nam.

Đưa tiếng Việt lên bản đồ AI xử lý ngôn ngữ toàn cầu

Trong khi các ngôn ngữ phổ biến như tiếng Anh hay tiếng Trung sở hữu nguồn dữ liệu phong phú, tiếng Việt vẫn nằm trong nhóm ngôn ngữ có tài nguyên hạn chế, khiến việc phát triển các mô hình AI ngôn ngữ trở nên thách thức hơn. Trước thực tế đó, các kỹ sư AI của VNPT đã tập trung nghiên cứu và phát triển các mô hình ngôn ngữ và cảm xúc tiếng Việt. Các nghiên cứu này cũng được đội ngũ công bố tại hội nghị EMNLP 2025 diễn ra từ ngày 4-9/11/2025 tại Trung Quốc – hội nghị AI hạng A* của thế giới về xử lý ngôn ngữ tự nhiên (NLP).

VNPT đóng góp kết quả nghiên cứu AI trên dữ liệu Việt tại các hội nghị quốc tế- Ảnh 2.

EMNLP 2025 là hội nghị AI hạng A* của thế giới về xử lý ngôn ngữ tự nhiên (NLP)

Các công trình này ứng dụng những kỹ thuật học máy tiên tiến như chuyển giao ngữ nghĩa và học cảm xúc đa tầng, nhằm nâng cao khả năng hiểu ngữ cảnh, cảm xúc và sắc thái tiếng Việt – vốn là những yếu tố phức tạp và ít được mô hình hóa trong các bộ ngữ liệu quốc tế. Nhờ đó, ngôn ngữ Việt ngày càng hiện diện rõ nét hơn trong cộng đồng nghiên cứu NLP toàn cầu, mở ra khả năng xây dựng mô hình ngôn ngữ mạnh, giàu bản sắc và phù hợp với người Việt.

VNPT đóng góp kết quả nghiên cứu AI trên dữ liệu Việt tại các hội nghị quốc tế- Ảnh 3.

Đội ngũ kỹ sư AI của VNPT công bố nghiên cứu AI xử lý giọng nói tại ICASSP 2025.

Song song đó, tại hội nghị ICASSP 2025 diễn ra từ ngày 6-11/4/2025 tại Ấn Độ - hội nghị xếp hạng A1 trong lĩnh vực AI xử lý giọng nói, nhóm nghiên cứu của VNPT đã giới thiệu kỹ thuật chuyển đổi giọng nói (voice conversion) ứng dụng trong tổng đài thông minh và trợ lý ảo tiếng Việt. Phương pháp này sử dụng học đối kháng miền (domain adversarial training) giúp mô hình hoạt động ổn định ngay cả khi dữ liệu huấn luyện hạn chế hoặc đến từ nhiều nguồn khác nhau, nâng cao tự nhiên hóa giọng nói và khả năng cá nhân hóa trải nghiệm giao tiếp.

Những nỗ lực trên không chỉ mở rộng không gian ứng dụng của AI bản địa, mà còn đặt nền móng cho hạ tầng ngôn ngữ số tiếng Việt – yếu tố thiết yếu để phát triển các sản phẩm và dịch vụ thông minh "Make in Vietnam".

Từ nghiên cứu đến ứng dụng – xây dựng năng lực làm chủ AI

Các công trình nghiên cứu được công bố quốc tế là bước trung gian quan trọng trong chuỗi giá trị AI của VNPT, nơi tri thức khoa học được chuyển hóa thành sản phẩm thực tế. Những mô hình và bộ dữ liệu nói trên hiện được ứng dụng trong nhiều lĩnh vực như nhận dạng tiếng nói tiếng Việt, thị giác máy tính phục vụ giao thông, y tế, trợ lý ảo hành chính công, và gần đây là các AI Agent cho khối ngân hàng – tài chính.

Các AI Agent này được xây dựng trên nền tảng mô hình ngôn ngữ tiếng Việt và công nghệ hiểu ngữ cảnh hội thoại, giúp tự động hóa quy trình hỗ trợ khách hàng, tư vấn sản phẩm tài chính, hỗ trợ xác thực giao dịch, đồng thời bảo đảm yêu cầu cao về bảo mật và tuân thủ dữ liệu – yếu tố đặc biệt quan trọng trong lĩnh vực tài chính – ngân hàng.

VNPT đóng góp kết quả nghiên cứu AI trên dữ liệu Việt tại các hội nghị quốc tế- Ảnh 4.

Cách tiếp cận "từ nghiên cứu đến triển khai" tạo nền móng phát triển AI có chủ quyền cho Việt Nam.

Những công trình nghiên cứu được công bố tại các hội nghị quốc tế của đội ngũ khoa học Việt Nam, trong đó có VNPT, cho thấy năng lực nghiên cứu trong nước đang từng bước tiệm cận chuẩn mực toàn cầu. Quan trọng hơn, đây là bước đi khởi đầu cho mục tiêu lớn hơn của quốc gia: hình thành năng lực làm chủ công nghệ AI có chủ quyền, dựa trên dữ liệu, ngôn ngữ và tri thức của chính người Việt.

Cách tiếp cận "từ nghiên cứu đến triển khai" cho thấy năng lực gắn kết giữa khoa học và ứng dụng, khi tri thức AI dần được tích hợp vào các bài toán đặc thù của Việt Nam, góp phần hình thành nền công nghiệp AI bản địa thay vì chỉ nhập khẩu công nghệ. Mỗi công trình nghiên cứu, mỗi mô hình AI dựa trên dữ liệu Việt được phát triển, chính là một viên gạch trong nền móng của hệ sinh thái tri thức AI Việt Nam – nơi các giá trị khoa học, công nghiệp và văn hóa được hội tụ.

Con đường đi tới năng lực AI có chủ quyền đòi hỏi sự kết nối giữa các nhà nghiên cứu, doanh nghiệp và các cơ quan hoạch định chính sách, để tri thức khoa học được chuyển hóa thành năng lực sản xuất và sáng tạo của quốc gia. Những nỗ lực ban đầu của các nhóm nghiên cứu Việt Nam đang cho thấy Việt Nam hoàn toàn có thể bước vào kỷ nguyên AI không chỉ bằng sự tiếp thu, mà bằng năng lực sáng tạo của chính mình.