Các bộ môn và phòng thí nghiệm

Phòng Thí nghiệm Công nghệ Tri thức

Data Science and Knowledge Technology Laboratory

Tháng Mười Hai 6

Lịch sử hình thành và phát triển

Phòng Thí nghiệm Công nghệ Tri thức (KTLab), thuộc Khoa Công nghệ Thông tin, Trường Đại học Công nghệ, Đại học Quốc gia Hà Nội, được thành lập theo quyết định số 1070/QĐ-TCHC ngày 15 tháng 11 năm 2010. Tiền thân của KTLab là nhóm nghiên cứu Khai phá dữ liệu và ứng dụng hoạt động từ năm 1998 đến 2006, sau đó phát triển thành Phòng Thí nghiệm vệ tinh “Công nghệ Tri thức và An toàn dữ liệu” (SIS-KTLab) trong giai đoạn 2006 – 2010. Ngay từ khi thành lập, KTLab đã xác định mục tiêu trọng tâm là thúc đẩy các dự án nghiên cứu về khoa học dữ liệu và công nghệ tri thức, đồng thời mở rộng hợp tác với doanh nghiệp. Đội ngũ nòng cốt của KTLab hiện nay gồm 3 phó giáo sư, 7 tiến sĩ và 6 thạc sĩ, là những chuyên gia có kinh nghiệm trong các lĩnh vực như khai phá dữ liệu, trí tuệ nhân tạo, và xử lý ngôn ngữ tự nhiên. Phòng thí nghiệm cũng duy trì một mạng lưới hợp tác viên đông đảo là các cựu thành viên đang công tác trong và ngoài nước, tiêu biểu như Giáo sư Nguyễn Hùng Sơn (Đại học Warsaw), và Phó Giáo sư Nguyễn Cẩm Tú (Đại học Nam Kinh). Song song với phát triển nội lực, KTLab không ngừng mở rộng mạng lưới hợp tác quốc tế với các nhóm nghiên cứu mạnh trên thế giới như nhóm của GS. Nigel Collier (Đại học Cambridge, Anh), GS. Hady Lauw (Đại học SMU, Singapore), GS. Nguyễn Lê Minh (Viện JAIST, Nhật Bản) và nhiều viện, trường uy tín khác. Mạng lưới này đã góp phần quan trọng trong việc đào tạo hàng chục cán bộ trẻ xuất sắc. Về đóng góp cho cộng đồng, KTLab đã tiên phong tổ chức Trường hè về Khai phá dữ liệu (2016) và tham gia tổ chức nhiều hội nghị uy tín như KSE, INLG, và VLSP. Trải qua hơn hai thập kỷ cống hiến, người trưởng phòng sáng lập, PGS.TS. Hà Quang Thụy, đã được phong tặng danh hiệu Nhà giáo Ưu tú và nhận Huân chương Lao động hạng III. Về tập thể, KTLab đã vinh dự nhận Bằng khen của Thủ tướng Chính phủ (2022), 4 Bằng khen của Bộ Giáo dục và Đào tạo và 4 Bằng khen của Giám đốc Đại học Quốc gia Hà Nội, cùng nhiều năm liền đạt danh hiệu tập thể lao động xuất sắc.

Công tác đào tạo

Công tác đào tạo là một trong những nhiệm vụ trọng tâm và là điểm sáng trong hoạt động của KTLab. Phòng thí nghiệm tham gia tích cực vào việc giảng dạy, đào tạo các chương trình cử nhân, thạc sĩ và tiến sĩ thuộc chuyên ngành Hệ thống thông tin. Các cán bộ của KTLab đã trực tiếp hướng dẫn hơn 200 khóa luận tốt nghiệp, trong đó có nhiều khóa luận được đánh giá xuất sắc, và góp phần đào tạo, bồi dưỡng gần 10 thủ khoa đầu ra của Trường. Chất lượng đào tạo được khẳng định qua thành công của sinh viên, nhiều người đã nhận được các giải thưởng, học bổng danh giá như Honda YES hay học bổng Vingroup. Sau khi tốt nghiệp, một lực lượng lớn cựu sinh viên đã tiếp tục con đường học thuật tại các quốc gia có nền khoa học phát triển như Nhật Bản, Singapore, Hoa Kỳ, Vương quốc Anh, và Đức. Nhiều cựu sinh viên, cán bộ của KTLab hiện cũng đang nắm giữ các vị trí quan trọng tại các tập đoàn công nghệ hàng đầu thế giới như Microsoft, Amazon, Pinterest, và Shopee. Ở bậc sau đại học, KTLab đã trở thành cái nôi đào tạo cho hơn 60 thạc sĩ và hơn 20 nghiên cứu sinh. Nhiều tiến sĩ trưởng thành từ phòng thí nghiệm hiện đang giữ các vị trí chủ chốt tại các trường đại học và viện nghiên cứu trong nước. Hoạt động nghiên cứu khoa học trong sinh viên được đặc biệt chú trọng, với kết quả là hai giải nhì và một giải ba cấp Bộ Giáo dục và Đào tạo, một giải nhất cấp Đại học Quốc gia Hà Nội, cùng hàng chục giải thưởng tại các cuộc thi khoa học quốc tế như WIDS, CLEF, BioNLP, COLIEE, và BioCreative. Bên cạnh đó, các cán bộ của KTLab cũng là tác giả và đồng tác giả của nhiều giáo trình, tài liệu học tập quan trọng như “Khai phá dữ liệu” (2013) và “Khai phá dữ liệu Web” (2009).

Công tác nghiên cứu

Nghiên cứu khoa học và phát triển công nghệ luôn là thế mạnh cốt lõi của KTLab, được duy trì bền bỉ thông qua hoạt động seminar khoa học hàng tuần từ năm 1998. Các hướng nghiên cứu chính của phòng thí nghiệm bao gồm khai phá dữ liệu, học máy, học sâu, xử lý ngôn ngữ tự nhiên, phân tích dữ liệu y sinh, phân tích dữ liệu pháp luật, và phân tích kinh doanh. Các nghiên cứu về trí tuệ nhân tạo, mô hình ngôn ngữ lớn (LLMs) và các hệ thống trợ lý ảo song hành với “Nhóm công nghệ về trí tuệ nhân tạo”, đặc biệt là các sản phẩm chiến lược như “Mô hình ngôn ngữ lớn tiếng Việt” và “trợ lý ảo”. Hướng nghiên cứu về phân tích và khai phá dữ liệu lớn đáp ứng mục tiêu của “Nhóm công nghệ điện toán đám mây và dữ liệu lớn”, trong khi các nghiên cứu về phân tích dữ liệu y sinh học, thiết kế protein và kháng thể của các nhà khoa học như ThS. Cấn Duy Cát lại gắn kết chặt chẽ với “Nhóm công nghệ y – sinh học tiên tiến”. Từ 2015 đến 2025, KTLab đã và đang chủ trì, tham gia nhiều đề tài, dự án tiêu biểu như dự án VINIF “Nghiên cứu và phát triển nền tảng tự động phân tích và hiểu khách hàng” (2019-2021), đề tài cấp nhà nước “Nghiên cứu thiết kế, chế tạo thiết bị phát hiện, phòng chống xâm nhập mạng máy tính” (2020) thuộc nhóm công nghệ về an ninh mạng, và các đề tài cấp ĐHQG về “Tích hợp tri thức dạng xác suất” (2023) và “Tóm tắt đa văn bản tiếng Việt” (2022). Từ các nghiên cứu này, nhiều sản phẩm khoa học công nghệ đã được phát triển, nổi bật là nền tảng phân tích khách hàng DeepCustomer, hệ thống giám sát mạng xã hội VNU-SMM, Trợ lý ảo cho người Việt VAV, máy tìm kiếm thực thể VietSeek/Vinahoo, cùng các bộ công cụ mã nguồn mở như JVNTextPro, FlexCRFs, GibbsLDA++. Về công bố khoa học, các cán bộ của KTLab như PGS.TS. Phan Xuân Hiếu, TS. Trần Mai Vũ, TS. Lê Hoàng Quỳnh, và TS. Vương Thị Hải Yến đã có hàng trăm công trình được đăn tải trên các tạp chí Q1, Q2 uy tín như IEEE Transactions on Knowledge and Data Engineering, Bioinformatics, Neurocomputing, ACM Transactions on Knowledge Discovery from Data (TKDD), và tại các hội nghị hàng đầu thế giới như EMNLP, NAACL, WWW, và ECML-PKDD, khẳng định vị thế tiên phong trong lĩnh vực công nghệ tri thức tại Việt Nam.

Đội ngũ giảng viên

Giảng viên hiện tại

  1. PGS.TS. Phan Xuân Hiếu (hieupx@vnu.edu.vn) – Trưởng PTN
    Hướng nghiên cứu chính: Khai phá dữ liệu (Data Mining, Text mining); Trí tuệ nhân tạo, xử lý ngôn ngữ tự nhiên và ứng dụng (AI, NLP and applications); Phân tích kinh doanh (Business analytics).

 

  1. PGS.TS. Hà Quang Thụy (thuyhq@vnu.edu.vn) – Nguyên Bí thư Đảng uỷ, nguyên Phó Hiệu trưởng Trường Đại học Công nghệ, nguyên Trưởng PTN sáng lập
    Hướng nghiên cứu chính: Khai phá dữ liệu (Data mining, Text/Web mining, Process mining, Recommender systems); Phân tích mạng xã hội (Social network analysis); Khoa học dịch vụ (Service science).

 

  1. PGS. TS. Trần Trọng Hiếu (hieutt@vnu.edu.vn)
    Hướng nghiên cứu chính: Tích hợp tri thức; Đàm phán dựa trên ngữ nghĩa; Suy luận tự động; Các hệ đa tác tử; Biểu diễn tri thức.

 

  1. TS. Trần Mai Vũ (vutm@vnu.edu.vn)
    Hướng nghiên cứu chính: Khai phá dữ liệu (Data mining, Text mining, Social media data mining); Xử lý ngôn ngữ tự nhiên (NLP), Ứng dụng học máy xây dựng các hệ thống hỗ trợ ra quyết định trong kinh doanh (Machine learning-powered business data analytics and decision-making support systems).

 

  1. TS. Lê Hoàng Quỳnh (lhquynh@vnu.edu.vn)
    Hướng nghiên cứu chính: Khai phá dữ liệu và ứng dụng (Data mining and applications); Học sâu (Deep learning), học đa mô thức (Multimodal learning), xử lý ngôn ngữ tự nhiên (Natural Language Processing) cho các ngôn ngữ ít tài nguyên như tiếng Việt; Các ứng dụng trong lĩnh vực y sinh học; Phân tích kinh doanh.

 

  1. TS. Vương Thị Hải Yến (yenvth@vnu.edu.vn)
    Hướng nghiên cứu chính: Xử lý ngôn ngữ tự nhiên trong lĩnh vực pháp lý (Legal Natural language processing), Khai phá lập luận và biểu diễn tri thức (Argument mining and knowledge representation), Symbolic AI kết hợp học máy cho suy luận và hỗ trợ giải thích. (Symbolic AI integrated with machine learning for reasoning and explain ability), Học máy cho các ứng dụng công nghiệp (Machine Learning for Industrial Applications).

 

  1. TS. Vương Thị Hồng (hongvt57@vnu.edu.vn)
    Hướng nghiên cứu chính: Học máy, khai phá dữ liệu, khai phá dữ liệu chuỗi (Machine learning, data mining, sequential data mining), Mô hình học sâu cho nhận dạng hoạt động của con người dựa trên dữ liệu cảm biến (Deep learning models for human activity recognition based on sensor data), Hệ thống giám sát và quản lý cơ sở hạ tầng cầu (Bridge monitoring and management system).

 

  1. ThS. Cấn Duy Cát (catcd@vnu.edu.vn)
    Hướng nghiên cứu chính: Học máy đa mô thức cho dự đoán bệnh và phát hiện chỉ dấu sinh học đáng tin cậy, kết hợp dữ liệu lâm sàng, hình ảnh y khoa và tín hiệu độ phân giải cao. Mô hình hóa tín hiệu vi sinh – miễn dịch (flow cytometry, chuyển động nano) và thiết kế protein, kháng thể bằng các phương pháp tính toán tiên tiến. Ứng dụng mô hình ngôn ngữ lớn trong sinh báo cáo lâm sàng và xử lý ngôn ngữ tự nhiên y sinh.

 

  1. ThS. Nguyễn Thị Cẩm Vân (vanntc@vnu.edu.vn)
    Hướng nghiên cứu chính: Học máy đa phương thức (Multimodal Machine Learning): Nhận diện cảm xúc trong hội thoại (Emotion Recognition in Conversation), Phân tích tình cảm (Sentiment Analysis), và Cải thiện độ vững chắc của học đa phương thức (Robustness in Multimodal Learning).

 

  1. ThS. Phạm Thị Quỳnh Trang (trangptq@vnu.edu.vn)
    Hướng nghiên cứu chính: Học liên tục(Continual learning), Xử lý ngôn ngữ tự nhiên trong y sinh học (Biomedical Natural Language Processing)

 

  1. ThS. Nguyễn Quốc An (annq@vnu.edu.vn)
    Hướng nghiên cứu chính: Xử lý ngôn ngữ tự nhiên (Natural Language Processing): Tóm tắt văn bản dựa vào đồ thị (Graph-based Summarization), Hỏi đáp (Question Answering), Căn chỉnh cụm từ đơn ngữ (Monolingual Phrase Alignment).

 

  1. ThS. Nguyễn Huy Sơn (huyson@vnu.edu.vn)
    Hướng nghiên cứu chính: Trí tuệ nhân tạo đáng tin cậy (Trustworthy AI), Hệ thống gợi ý (Recommender Systems) và Trí tuệ nhân tạo cho chăm sóc sức khỏe (AI for Healthcare)

 

  1. ThS. Nguyễn Hải Long (long.nh@vnu.edu.vn)
    Hướng nghiên cứu chính: Ứng dụng AI trong miền luật pháp (AI and Law), mô hình ngôn ngữ lớn, mô hình nền tàng (LLMs and Foundation model) và AI trong Vật lý – ứng dụng trong phân tích và khai phá tín hiệu cảm biến (physical AI – Applications in Sensor Signal Analysis and Exploration).

© VNU-UET-Faculty of Information Technology. All rights reserved.