400-028-4501

公司动态

Company Dynamics

了解我们的最新资讯动态

做档案开放审核,为什么神经网络不靠谱?

        

2023年初以来,ChatGPT成为现象级互联网应用,已从写诗、作画,开始向档案、金融、传媒、医疗等信息资源行业挺进。


ChatGPT使用的生成式预训练转换器(Generative Pre-trained Transformer,简称GPT)技术,本质上是一种神经网络机器学习语言模型。


深度神经网络是对理想化人脑的模拟,但它并非是“万金油”,在落地应用上有许多局限。比如档案开放审核,在政策、技术、安全、成本等方面都无法切实满足档案馆需求。


01
合法性&可解释性

《国家档案馆档案开放办法》规定,自形成之日起已满二十五年,但符合法律规定情形的国家档案馆的档案,可以延期向社会开放。国家档案馆应当结合职责权限和馆藏档案实际,会同档案形成单位或者移交单位依法依规确定延期向社会开放档案的具体标准和范围,并出具延期理由


深度神经网络通过对大量已开放鉴定的海量电子档案开放鉴定成果的输入,训练出一个开放鉴定算法模型,利用该模型作出哪些该开放、哪些不该开放的简单区分判断绝大多数都无法给出具体的控制理由,每一件档案都仍需人工复核,根本无法切实减轻档案馆档案工作人员的工作量


联著档案智能开放审核系统,能自动对原始档案和档案著录信息进行同步鉴定,针对馆藏档案逐件逐字逐句全文审核,根据系统检测结果逐条出贴切的控制理由并标记检测状态,“开放可信度算法”可进一步减少人工复核工作量。系统平均每日可审核1.5万件档案,相较人工审核效率提升30倍以上,准确率达95%以上。


图片
02
及时性&可积累性

各档案馆的馆藏档案种类繁杂、数量庞大大、全宗类型多、保存历史跨越时期长,这些因素使得档案开放审核的规则需要具备灵活性,要根据档案的内容、性质、重要性等因素及时调整规则。


斯蒂芬·沃尔弗拉姆在《这就是ChatGPT》中解释道“神经网络的基本思想是提供大量的‘输入→输出’样例以供‘学习’(也就是训练)”,无论是大规模或小规模知识迁移与更新,都需要重新训练;面对新的应用领域,需要补充训练耗时长且训练效果未知


图片

基于联著语义工程技术的AI可根据知识和需求进行设计和开发,以适应不同的任务和环境,无需重复训练,只需配置补充新的语义规则就可立即生效,可根据客户的差异需求灵活删减审核标准。在不到两年时间里,联著建立的档案开放审核语义知识库,容量较初期成长5倍有余,迭代33个版本,正日趋完善中


03
安全性

特殊的行业属性,使得档案行业必须将数据安全性放在第一位。


神经网络大规模训练的“黑箱模型”,前提是必须通过大规模的数据训练来捕捉经验,而档案馆可提供训练的样本资源有限。因此,以神经网络技术为支撑无法开发出成熟的档案智能开放审核产品

图片

联著自主知识产权的语义工程技术的AI,无需大量样本进行人工标注预训练,从而实现即插即用、快速迭代联著实业《基于语义分析的档案智能开放审核系统》成功入选“2023可信AI案例”知识计算应用优秀案例


04
经济适用性

人工智能的实际应用总是需要考虑多方面的问题,包括技术性能、使用成本等。


神经网络训练成本巨高、动辄上亿。目前训练神经网络主要还是使用 GPU 或 TPU,英伟达的各种高端 GPU 价格昂贵,云计算上的高性能计算也不便宜。以谷歌云为例,Tesla V100 每小时 2.48 美元、Tesla P100 每小时 1.46 美元,谷歌 Colab 免费提供的 Tesla T4 GPU 每小时也要 0.95 美元。也就是说,只有以谷歌、Facebook 等巨头为首的大型公司似乎才玩得起,这种算力上的碾压是普通企业单位无法抗衡的。


走语义工程之路就是一条真正可持续的道路。基于语义工程的理性AI既可以节省算力,也可以解决落地应用问题。利用语义工程实现中文语义结构化能够大大节省神经网络训练的算力成本;以“积少成多”模式赶超神经网络训练模式,规避后续重复训练的成本。

图片

截至目前,联著档案智能开放审核系统累计审核档案件数突破2000+万件,1000+个全宗,服务副省级以上国家综合档案馆6家,合作“全国示范数字档案馆”10家,各级国家综合档案馆80余家。


大批优质稳定的客户资源的积累,既是对联著技术实力的肯定,也是对联著服务质量的赞誉。


感谢所有支持联著的伙伴们,联著将继续发挥自身优势,不断创新进取,未来还将为客户提供智能辅助编研、智能辅助校核、智能档案剪裁等更多更优质的智能化产品和服务,助力各档案馆档案信息化建设。


来源参考:

1.《XLNet训练成本6万美元,顶5个BERT,大模型「身价」惊人》

https://mp.weixin.qq.com/s/KmadSY9mkq30OJvZVHdlqQ

2.《Sam Altman:这是我见过的对ChatGPT原理的最佳解释》

https://mp.weixin.qq.com/s/cpLDPDbTjarU0_PpBK_RDQ




在线客服
返回顶部
返回底部