利用上图家谱人名等开放数据,十余项创新作品挖掘历史人文数据新价值

摘要:历史人文数据可以这样应用

为期5个月的上海图书馆2018开放数据应用开发竞赛近日收官,经评审,在全国17个省、自治区、直辖市的110支团队提交的作品中,产生了一等奖1名、二等奖2名、三等奖3名、优秀奖4名、最佳人气奖1名及人气奖7名。

上海图书馆开放数据应用开发竞赛由上海图书馆(上海科学情报研究所)、文化部公共文化研究上海图书馆基地主办,自2016年起已举办三届。今年竞赛数据依旧聚焦历史人文,除上图开放数据种类大幅增加外,还首次联合CADAL项目管理中心、哈佛大学计量社会学系、复旦大学图书馆、广州搜韵文化发展有限公司四家单位,为竞赛提供600万种历史人文数据。

上海图书馆在原有5万余种家谱元数据、24万余种名人手稿及档案元数据和开放数据平台中的姓氏、人、地、时、机构等数据的基础上,新增63万余种古籍元数据,“人名规范库”的数据从6万余人增加到84万余人,另提供1万5千余种藏印数据,涉及到著名藏书家近400人;CADAL 项目管理中心开放数据为17万条民国图书元数据、8千条墓志元数据;哈佛大学计量社会学系开放数据为中国历代人物传记资料库(CBDB)中近42万条人物信息;复旦大学图书馆开放数据为其民国期刊数据库的8万余条元数据;广州搜韵文化发展有限公司开放数据为75万首历代诗词、30余万条相关词条用韵参考、100余万条古人诗例用韵参考以及约150万条对仗词汇参考。

竞赛吸引了大批对历史人文数据感兴趣的高等院校、科研院所、IT企业及数据爱好者。今年,竞赛共收到来自全国17个省、自治区、直辖市的110支团队共324人报名,有13支团队曾报名参加过往届竞赛。相比较2017年竞赛,报名团队数量增加了55%、参赛人数增长了66%,年龄最小的参赛者仅有13岁。参赛者中,在校生占48%,除计算机专业外,还涉及情报学、金融统计、地理信息、城市设计、数学、艺术等专业,研究生占比40%,并首次有初中生组队参赛。非在校生占52%,包括IT人员、图情工作者、研究人员、设计师、教师、自由职业者等。

入围获奖的10支团队分别来自上海、北京、河南、山西四省市,6支队伍来自大学、科研机构及图书馆,并有2支团队连续两年获得奖项。

获得一等奖的作品《寻踪 遇见》来自中国医学科学院医学信息研究所,该作品以“寻踪雪泥鸿爪印迹,遇见千古风流人物”为寓意,以旅游、学习、图书馆三大应用场景为切入点,利用OCR识别、实体识别、语音播放、可视化等技术,关联多个外部数据源,形成追踪和探寻名家足迹的知识探索平台,全方位解读和呈现历史人文知识。

来自上海大学团队的二等奖作品《民国百花》将民国人物、手稿档案数据与近年来在年轻群体中较为流行的“语C”(语言Cosplay,语言角色扮演)结合,让用户通过语言角色扮演的方式了解民国人物,融合人文知识与娱乐社交。

另一个获得二等奖的作品《原印鉴章》采用人工智能加计算机视觉的方式鉴章,并以拍照搜索加解读的模式帮助欣赏者了解古书画收藏流传的基本常识及背后的动人故事。

来自北京师范大学的最佳人气奖作品《树人者——二十世纪中华教育名家精粹》对人物关系进行了结构化和图谱化展示,助力教育史研究。

三等奖《风华诗韵APP》提供从秦朝至当代的海量诗词内容的搜索查询功能,并加入自动创作藏头诗模块、诗人关系图谱,以动态图谱的形式展现出唐朝各个时期诗人之间的诗词关系,并提供对仗词搜索功能帮助用户作诗。

同获三等奖的作品《时迹》将古籍数据、人物传记、人文科普、风雅诗词等数字化知识数据,通过不同主题的关联应用,形成以人为核心、地点为轨迹、时间为循迹线索,为用户提供方便易用、具有一定可视化效果的多源知识融合移动应用。评审专家还对多项作品的后续公益孵化提出了建议。

三年来,上海图书馆开放数据应用开发竞赛吸引了全国多地创客。这些创客以研究人员、历史人文爱好者及普通大众为目标用户,设计制作了众多优秀移动应用产品原型。未来,上海图书馆将形成更加广泛的开放数据平台,丰富数据内容、种类和数量,并进一步形成数据开放、数据应用、公益孵化三位一体的开放数据服务模式,不断挖掘图书馆及其他文化机构历史人文开放数据背后所蕴藏的巨大价值。

发表评论
留言与评论(共有 0 条评论)
   
验证码:

相关文章

推荐文章

'); })();