孟夏时节传捷报,智慧档案启新程!江苏联著实业股份有限公司与四川省档案馆联合申报的《"DeepSeek + 语义分析" 双擎驱动:档案开放审核敏感信息智能识别、摘录与归类的创新研究》,成功入选 2025 年度国家档案局科技项目立项名单。作为档案信息化领域的创新研究方向,该项目以 "双引擎技术融合 + 全流程智能处理" 为核心,着力破解传统审核难题,为档案开放审核工作注入科技新动能。

针对档案开放审核中效率低、政策适配难、决策依据模糊等核心问题,项目创新构建 "DeepSeek 大模型 + 语义分析" 双引擎技术体系,实现三大突破性进展:
精准识别:从 "经验判断" 到 "数据驱动"
依托百万级敏感特征库与智能算法,系统可实现敏感信息的原文级定位与精准摘录,准确率超 95%。区别于传统关键词匹配的粗粒度筛选,该技术支持手写体、竖排繁体、表格等复杂形态档案的智能解析,通过语义分析修正 OCR 识别错误(如 "己 / 已 / 巳" 智能区分),确保敏感信息完整捕获,推动审核从 "经验依赖" 转向 "数据支撑"。
动态适配:政策调整下的智能响应
构建覆盖党政、民生、经济等多领域的多层级敏感语料库与分类体系,支持政策动态调整后的快速二次审核。当开放政策更新时,系统自动匹配历史摘录的敏感信息,仅对需调整部分进行复核,即可有效解决长期政策适配难题。
可解释性:审核结论的内容级追溯
通过语义分析与 DeepSeek 大模型协同作业,系统输出带具体原文依据的审核结论。例如,针对 "人事任免" 类敏感信息,可精确摘录 "2015 年 3 月张三任某局副局长" 等完整语句,并保留上下文语义场景,为开放决策提供清晰逻辑支撑,彻底改变 "只给结论不给理由" 的传统模式。
四川省档案馆:深厚审核经验筑牢实践根基
作为国家一级档案馆,主导《档案开放审核标准化体系研究》等国家级课题,馆藏资源超 130 万卷。其深耕档案开放审核领域形成的业务规则、专家智库及百万件真实审核案例,为项目提供了坚实的实践土壤。特别是在敏感信息判定标准、审核流程规范化等方面的深厚积淀,确保技术研发紧密贴合实际业务需求。
联著实业:十二年语义技术赋能智慧档案
联著实业深耕人工智能语义工程 12 年,累计获得38 项发明专利、54 项软件著作权,构建了覆盖档案全生命周期的智能处理技术体系。公司服务全国 100余家档案馆,自主研发的 "语义分析 + 大模型" 技术已在江苏、内蒙古等地实现千万级档案高效处理,技术成熟度与落地能力获行业高度认可。此次联合申报,是联著实业 "技术研发 + 场景应用" 双轮驱动战略的又一次里程碑实践。
项目计划于 2025 年 3 月启动,2027 年 6 月完成验收,聚焦三大核心目标打造行业标杆:
技术标准化:制定内容级审核操作规范
形成覆盖敏感信息识别、摘录、归类的全流程实施规范,明确 "个人信息"" 行政决策 ""经济数据" 等敏感类型的判定规则与处理流程,为全国档案部门提供统一的智能化审核操作指南,推动审核工作从 "粗放式" 向 "精细化" 转型。
知识共享化:建设动态更新的亿级语料库
构建行业首个动态敏感语料库,收录百万级敏感信息条目,按类型、时间、来源等多维度标注,支持 AI 模型训练与政策分析。未来将通过 API 接口实现行业共享,助力提升全行业敏感信息处理能力,形成档案领域的 "智能审核知识库"。
应用示范化:打造档案数字化转型模板
探索大模型与档案业务深度融合的技术路径,研发国内首套 "智能识别 - 精准摘录 - 动态适配" 一体化系统,实现单份档案审核耗时从数十分钟压缩至数分钟以内,推动档案开放率实现显著提升。项目成果将作为 "四川经验" 向全国推广,为档案数字化转型提供可复制的技术方案。
此次国家级项目的立项,是联著实业在档案智能化领域的又一重大突破。我们将与四川省档案馆紧密协作,以技术创新赋能档案治理现代化,打造 "看得准、溯得清、调得快" 的智能审核体系,助力档案资源安全有序开放,为推进档案事业高质量发展贡献联著力量!
期待项目结出丰硕成果,共同见证人工智能与档案事业深度融合的全新篇章!