个人简介:
王洪亚,东华大学计算机科学与技术学院教授、博士生导师,中国计算机学会数据库专委会委员,上海市计算机学会数据库专委员委员。主要研究方向为新型数据库系统(向量数据库、流数据库和实时数据库)、机器学习、随机与近似算法等。在VLDB、WWW、TC、TPDS、CIKM、DASFAA、ICMR、ICME、PG等数据库、信息检索和机器学习领域的高水平会议与期刊发表论文30余篇。主持国家自然科学基金项目两项、 CCF 华为胡杨林基金数据库专项“基于openGauss的向量近邻搜索技术研究与实现”一项、上海市自然科学基金两项;参与国家“核高基”专项“大型通用数据库管理系统与套件研发及产业化”等项目的研发工作。授权国家发明专利2项。
报告摘要:
近年来,语言大模型(LLM, Large Language Module)的出现和快速发展引起了学术界和工业界的广泛关注。虽然大模型在文本创作等应用领域取得了惊人的效果,但在垂直领域服务中的知识深度、准确度和时效性有限。为了解决这一问题,学界和业界目前普遍的共识是利用向量数据库结合大模型和自有知识资产,构建垂直领域的智能服务。向量数据库是能够持久存储高维向量数据,并提供高效相似度搜索功能的数据管理引擎的统称,其性能很大程度上取决于底层的最近邻搜索技术。报告将全面介绍(1)向量数据库的发展现状;(2)高维空间最近邻搜索技术(位置敏感哈希算法、近邻图搜索算法与乘积量化算法)的最新研究进展;(3)向量数据库在电力数据检索和知识问答平台的应用。
时间:6月11日13:30
地点:1号学院楼140