浪潮云申请一种知识库管理系统的文档智能解析方法专利,能对文本进行可视化输出
金融界2025年4月10日消息,国家知识产权局信息显示,浪潮云信息技术股份公司申请一项名为“一种知识库管理系统的文档智能解析方法”的专利,公开号 CN 119783787 A,申请日期为2024年11月。
专利摘要显示,本发明公开一种知识库管理系统的文档智能解析方法,涉及人工智能大模型多模态分析领域;包括:步骤1:根据文档扩展名初步识别文档格式,根据文档格式的类型进行相应的解析:分别针对pdf、docx、doc以及txt文档格式进行文本解析,其中针对pdf文档格式,提取pdf文档格式中文本和图像;针对docx文档格式,根据docx文档格式的压缩包按照文档的自然顺序进行解析,提取文本和图片;针对doc文档格式,识别并提取doc文档格式中所有文本信息;针对txt文档格式识别并处理字符编码提取各种语言和符号 步骤2:利用大模型对解析完成的文本进行处理:将文本进行分割并进行向量化处理,将文本转换为大模型能够理解的数值形式,并将转换的文本存储于知识库,用于信息检索、数据分析和知识发掘,步骤3:同时对文本进行可视化输出。
天眼查资料显示,浪潮云信息技术股份公司,成立于2015年,位于济南市,是一家以从事软件和信息技术服务业为主的企业。企业注册资本36214.8272万人民币,实缴资本36214.8269万人民币。通过天眼查大数据分析,浪潮云信息技术股份公司共对外投资了89家企业,参与招投标项目2101次,财产线索方面有商标信息22条,专利信息3244条,此外企业还拥有行政许可11个。
本文源自:金融界
作者:情报员