• 图片新闻
  • 天图简讯
  • 业界动态
  • 公告栏
  • 媒体报道
  • 预决算公开

您当前所在的位置是:首页>>新闻资讯>>业界动态

河北省首创题录数据自动抽取技术 标准文献题录数据提速6倍
发布时间:2016-04-04

日前,由省标准化研究院开发的“标准文献题录数据自动加工系统”成功通过验收并投入使用,系统中的“标准文献题录数据自动抽取技术”为全国首创。系统将为企业提供更便捷、更优质、更个性化的服务,积极推动标准服务政府管理和经济社会发展。

省标准化研究院文献中心主任施建介绍,“标准文献题录数据自动加工系统”自动从经过文字识别处理的标准原文中抽取题录数据,自动输入到著录页面,部分字段内容可自动判断赋值。在自动抽取数据的同时,系统实时对数据进行自动校验,一旦出现错误字段,将标示为红框,提示工作人员修改、审核。工作人员可手工选取标准内容信息,点击字段标签,由系统自动抽取输入。

在项目验收阶段,题录数据自动加工和人工加工对比试验结果显示,两种方式完成时间相差最少为5分钟,最多为52分钟。借助自动加工,平均速度提高了6倍。

在提高加工效率的基础上,省标准化研究院文献中心在原有的标准号、名称、发布日期等27个标准题录加工字段的基础上,新增标准部分序号、发布单位、归口单位等30个字段,为读者准确搜索文献提供了更多方便。

施建介绍,进入河北省标准院“标准图书馆”网站,将同一标准的检索结果与其他标准信息服务网进行比较可以发现,其他网站或仅提供标准号、中文名称等不足10个题录字段,或列出了某些字段却不能提供链接。该网站则提供了附录、提出单位、起草人、检验机构等差异化字段,并提供详情链接。

企业可获精准海量信息。在标准GB7718-2011显示页面点击“被如下标准引用”,不仅可显示引用该标准的15项标准,还可显示每项标准详情,为读者提供的不仅有GB7718-2011的相关信息,还有一个围绕该标准的庞大数据群。

省标准化研究院院长苏永谦表示,“标准文献题录数据自动加工系统”利用大数据技术,逐步实现标准内容数据展示加工、标准编写、标准分析比对等方面的智能化,推动标准文献服务走向更深、更广的崭新“蓝海”。

新闻来源:《河北日报》  2016年04月01日