CNKI学术图片
中国
学术搜索
CNKI学术图片

《 CNKI学术图片知识库》整合国家各类制图规范和标准,以及规范的出版物中对图片类型的定义与描述,制定出一套图片内容分类体系

标签:

《 CNKI学术图片知识库》整合国家各类制图规范和标准,以及规范的出版物中对图片类型的定义与描述,制定出一套图片内容分类体系,是本产品做为知识库产品的独有特点之一。

1、 图片元数据

CNKI学术图片知识库所包含用来表述图片信息的15个数据项,包括图片中文标题、图片英文标题、图片说明、图片关键词、图词、一级分类、二级分类、图片尺寸、图片大小、图片清晰度。

2、 抽取字段

对于所有图片元数据项中,由程序从原文献中抽取出来的信息为抽取字段,例如图片标题等。

3、 标引字段

对于所有图片元数据项中,由程序或人工标引,用于进一步描述图片信息的字段,例如图片关键词等。

4、 抽取错误率

某抽取字段,数据项抽取错误的数据项数量与该数据项总数量的比率。

抽取项错误率=(抽取错误的数据项数量/数据项数量)×100%

抽取错误包括文字、范围、数据计算、完整性等方面的错误,只要与原文不相符合的信息即视为抽取错误。数据项内容为单值的,计为一项;数据项内容为多值的,则按值的数量计算项数,例如,一张图片有4张同文图片,则计为4 项。

5、 抽取信息有效率

某抽取字段,信息有效的数据项与该数据项总数量的比率。

抽取信息有效率=(抽取信息有效的数据项数量/数据项数量)×100%

有些抽取出来的数据项,虽然抽取正确,但是未能很好地反映图片内容,或图片内容本身质量不好,对于用户来说价值不大,可以定义为该数据项信息有效性较低,对这种数据项进行统计,可计算该数据项的信息有效率。

6、 标引正确率

某标引字段,数据项标引正确的数据项数量和数据项数量的比率。

标引错误率=(标引错误的数据项数量/数据项数量)×100%

标引数据项项基本反映图片主题,无原则性错误,则计为标引正确。数据项内容为单值的,计为一项;数据项内容为多值的,则按值的数量计算项数,例如,一张图片有4 个关键词,则计为4 项。

7、 标引一致度

某标引字段,数据项标引一致的数据项数量与数据项数量的比率。

标引一致度=(元数据标引一致的数据项数量/数据项数量)×100%

标引一致度反映同类别图片标引一致的程度。同类别的图片,被标引的关键词、类别等数据项应保持一致。

相关导航

暂无评论

暂无评论...