删除或更新信息,请邮件至freekaoyan#163.com(#换成@)

南京百年人物数据集

本站小编 Free考研考试/2022-01-02


摘要&关键词
摘要:人物数据集是信息化时代历史人物研究的重要基础。本数据集以《民国南京学术人物传》《中华民国史·人物传》和《南京简志》为主要数据源,包含136位自民国至今(即1912年至今)在政治、教育、科技、文学和艺术等领域具有重大影响力的南京籍和客籍历史人物信息,包含人物的通用名称、别名、生卒时间、出生地、经历、人物关系等数据项。本数据集可为南京历史人物信息查询和统计、人物关系可视化和分析及人物生平地图制作等研究提供数据基础,促进南京历史文化的深入挖掘和利用。
关键词:历史GIS;人物数据库;时空数据;历史文化;南京

Abstract & Keywords
Abstract:?Profile data is the basis for studies of historical figures in this information age. This study draws sources from published materials including Biography of Academic Figures in Nanjing During the Republic of China, History of the Republic of China, Volume of People, and Concise Chronicles of Nanjing. The dataset records the profile information of 136 natives and non-native residents with great influence in the history of Nanjing, from the fields of politics, education, science and technology, literature and art. It contains such data items as the figure’s common name, alias, date of birth and death, birthplace, experience, and social ties. This dataset can provide bases for wide-ranging research concerning historical figure query and statistics, social tie visualization and analysis, life map generation, and so on, in a way to promote an in-depth mining and utilization of Nanjing history and culture.
Keywords:?historical GIS;?profile of figures;?spatio-temporal data;?historical culture;?Nanjing

数据库(集)基本信息简介
数据库(集)名称南京百年人物数据集
数据作者郭畅,胡迪,杜晓晗,李岱蔚,杨逸尘,程星华
数据通信作者胡迪(hud316@gmail.com)
数据时间范围1912–2020年
地理区域中国江苏省南京市
数据量136条,136个
数据格式*.xlsx,XML
数据服务系统网址http://www.sciencedb.cn/dataSet/handle/937
基金项目国家自然科学基金(41771421、41601421);江苏高校品牌专业建设工程资助项目。
数据库(集)组成数据集由136位南京杰出历史人物的信息数据组成,包括通用名称、别名、出生时间、出生地点、逝世时间、逝世地点、人物经历、人物关系等数据项。Excel格式文档供普通用户使用,XML格式文档供专业用户使用。

Dataset Profile
TitleA dataset of centennial figures in the history of Nanjing
Data authorsGuo Chang, Hu Di, Du xiaohan, Li daiwei, Yang yichen, Cheng xinghua
Data corresponding authorHu Di(hud316@gmail.com)
Time range1912–2020
Geographical scopeNanjing City, Jiangsu Province
Data volume136 rows, 136 documents
Data format*.xlsx,XML
Data service system<http://www.sciencedb.cn/dataSet/handle/937>
Sources of fundingNational Nature Science Foundation of China (41771421, 41601421); Top-notch Academic Programs Project of Jiangsu Higher Education Institutions (TAPP).
Dataset compositionThe dataset consists of profile data of 136 outstanding historical figures in Nanjing, including common name, alias, date of birth, place of birth, date of death, place of death, experiences, social ties, etc. The data are stored in Excel and XML formats for ordinary and professional uses, respectively.



引 言
古往今来,历史人物一直是历史研究者们关注和研究的重要对象[1]。研究历史人物有助于再现历史舞台,对历史进行再诠释,从而达到鉴古、察今、知来的目的。历史人物的活动受客观社会环境制约,因此,历史人物的生平经历不单是个人的历史,而是包含了一定时空范围内的社会政治和文化背景的大历史[2]。历史人物的数据通常收录于书籍报刊等纸质资料中,零散且更新速度缓慢,难以有效地进行相关深入研究[3]。随着科技的发展,人物数据库应运而生,它对在某一方面乃至多个方面对人类社会做出特殊贡献的典型人物的相关信息进行集中的数字化管理[4]。建立人物数据集能够以人物为中心整合相关信息,不仅能够借助其更新周期短等特点满足更加深入的历史人物研究的需求,进而构建能够反映历史进程的历史信息数据库。
目前的人物数据库根据研究对象的不同可以分为两类:单一人物数据库和群体人物数据库。单一人物数据库从多种信息来源采集研究对象的所有相关资料[5],并对其进行合理罗列。数据格式涵盖文本、图片、音频、视频、网页、地图等多种形式[6-7]。其中较为典型的是蒋介石资料数据库,该数据库收录的资料相当丰富,涵盖了研究对象一生的各个方面(如生平事迹、思想言论和文史著述等)[8]。群体人物数据库是以一定的时间或空间为范围,选取具有某类特征的人物作为研究对象形成的数据库。国外具有代表性的这类数据库是英格兰圣公会神职人员数据库和ASP世界历史人物索引库。前者收录了研究对象的任职时间、职务详情等信息,后者记录了世界历史事件所发生的第一个人物的信息,包括个人信函、日记、口述历史等[9]。国内应用较多的有中国历史人物传记数据库(China Biographic Database,CBDB),其中包含人名、生卒年等数据项[10-11]。CBDB分为线上和Access两种查询系统,它提供多个相互关联的表格,可以将人物信息整理出来,以便****进行批量分析[12]。另一个著名的人物数据库为湖南近代人物资源库,它包含了高级的检索功能,可以让用户在使用时根据自己的特殊研究需求获取相应的信息[13-14]
南京钟灵毓秀,是著名的文化古都,有着重要的历史地位。自1927年被设为中华民国首都开始,南京市在近百年来飞速发展。在这段历史时期内,政治、教育、科技、文学和艺术等各方面都涌现出了一批杰出的人才,他们为南京的发展做出了重要的贡献,是南京城市史不可或缺的基本构成要素,反应了南京的历史及其特色。建立南京地方人物数据集不仅能够为南京历史人物的进一步研究提供帮助,更能进一步完善中国人物数据库,为历史文化传承做出贡献。因此,本文以1912–2012年南京杰出历史人物为研究对象,查阅并收集有关书籍史志,将所有历史人物资料电子化为Excel表格和XML两种格式的数据集,为进行更深层次的历史人物分析、人物关系和生平地图可视化研究提供基础。


2 ? 数据样本描述
本数据集采用Excel电子表格和XML文件两种数据存储载体。其中Excel电子表格对人物信息进行了合理罗列,可供普通用户进行简单的查询和统计分析。而XML文件不仅易于在任何应用程序中读写数据,便于进行数据交换,而且能够更好地表达人物相关的时空信息、人物关系以及多属性和层次嵌套关系,可支撑进一步的空间分析和可视化研究,因而供专业用户使用。
数据样本展示包括Excel与XML两种格式,如图2和图3所示。




图2 ? 南京百年人物数据集(Excel格式)










图3 ? 南京百年人物数据集(XML格式)

3 ? 数据质量控制和评估
本数据集的数据质量依赖于现有书籍资料记录的完整性和准确性。《民国南京学术人物传》由历史学家张宪文教授编写,《中华民国史·人物传》由中国社会科学院近代史研究所主持编纂,《南京简志》由南京市地方志编纂委员会办公室编著,数据的可信度较高。由于本数据集中所涉及的时间跨度较长,出现了行政区划调整导致的古今地名不统一的现象,因此在数据处理的过程中对县市名进行了修正,一律以现今地名为准。此外,对书籍资料中的部分错误(如人物年龄错误等)进行了勘误。数据录入的完整性和准确性经多次人工检查,确认无误。

4 ? 数据使用方法和建议
本数据集收录了136条南京杰出历史人物数据,可为了解近现代南京杰出人物数据提供一手资料。随着历史人物和地方文化研究的进一步深入,用户不仅可以据此进行综合统计分析,还可以设计特征查询,制作人物关系图和人物生平地图进行可视化表达与研究。
特征查询可通过姓名、别名等人物特征实现对历史人物详细信息的查询(图4)。




图4 ? 南京百年人物数据集查询示意
人物关系图对历史人物的社会关系和亲属关系进行了可视化展示,通过时间轴的控制展现空间对象在某一特定时期内的人物关系,随着时间的改变,可能会出现新增的或发生变更的人物关系。此外,还可以根据关系远近生成关系图谱(图5)。




图5 ? 人物关系图
历史人物生平地图将大量存在于文字中的信息进行可视化表达,以有形的地图语言展现人物生平,能够有效地更加深刻生动地表达历史,同时对历史研究也具有重要作用和意义(图6)。用户可综合多方面的信息来源,进行数据融合、同化和挖掘后提取最有价值的数据信息。




?


[1]
周兴樑. 历史人物研究评价的几个问题[J]. 福建论坛(人文社会科学版), 2004 (6): 57-61.

+?CSCD?·?Baidu Scholar

[2]
段金生. 读王劲教授著《邓宝珊传》——兼谈历史人物研究的魅力[J]. 天水师范学院学报, 2005, 25(4): 127-128.

+?CSCD?·?Baidu Scholar

[3]
洪拓夷, 王增清, 韦云波. 湖州历史人物数据库建设刍议[J]. 兰台世界, 2007 (14): 16-17.

+?CSCD?·?Baidu Scholar

[4]
蔡璐, 罗力可, 伍艺. 试论湖南近代人物数据库建设[J]. 高校图书馆工作, 2009, 29(6): 29-31.

+?CSCD?·?Baidu Scholar

[5]
葛美玲, 田丽君. 成仿吾人物全文数据库构建实践与思考[J]. 兰台世界, 2017(15): 118-120.

+?CSCD?·?Baidu Scholar

[6]
徐晶晶, 葛红梅. 国内图书馆自建人物数据库的现状分析[J]. 数字图书馆论坛, 2015 (12): 50-55.

+?CSCD?·?Baidu Scholar

[7]
张晓源. 人物数据库人物信息收录范围研究[J]. 图书馆论坛, 2004, 24(2): 87-90.

+?CSCD?·?Baidu Scholar

[8]
赵晓红, 周维煦. 人物数据库建设新模式探索——以蒋介石资料数据库为例[J]. 浙江档案, 2016 (6): 15-17.

+?CSCD?·?Baidu Scholar

[9]
刘小花, 罗力可. 基于知识地图的人物数据库模型构建研究[J]. 图书馆, 2013(4): 91-93.

+?CSCD?·?Baidu Scholar

[10]
中国近代人物传记资料库(CBDB)[DB/OL]. [2019-12-28]. https://projects.iq.harvard.edu/chinesecbdb.

+?CSCD?·?Baidu Scholar

[11]
孙妙凝. CBDB体现多学科交叉理念[N]. 中国社会科学报, 2013-04-15(A03).

+?CSCD?·?Baidu Scholar

[12]
徐力恒. 唐代人物资料的数据化:中国历代人物传记资料库(CBDB)近年工作管窥[J]. 唐宋历史评论, 2017 (00): 20-32, 381.

+?CSCD?·?Baidu Scholar

[13]
蔡璐. 浅谈人物数据库网站的核心表现——以湖南近代人物资源库建设为例[J]. 图书馆, 2010 (3): 107-108.

+?CSCD?·?Baidu Scholar

[14]
全丹丹, 李雯. 人物资料数据库优化浅析——以湖南大学图书馆特色数据库《湖南人物库》为例[J]. 高校图书馆工作, 2010, 30(3): 39-41.

+?CSCD?·?Baidu Scholar

[15]
张宪文. 民国南京学术人物传[M]. 南京:南京大学出版社, 2005: 629.

+?CSCD?·?Baidu Scholar

[16]
中国社会科学院近代史研究所. 中华民国史·人物传[M]. 北京:中华书局, 2011: 5593.

+?CSCD?·?Baidu Scholar

[17]
南京市地方志编纂委员会办公室. 南京简志[M]. 南京:南京出版社, 2014.

+?CSCD?·?Baidu Scholar

[18]
胡迪, 闾国年, 江南, 等. 地理与历史双重视角下的历史GIS数据模型[J]. 地球信息科学, 2018, 20(6): 713-720.

+?CSCD?·?Baidu Scholar

[19]
张晓源. 人物数据库人物收录标准研究[J]. 图书与情报, 2006 (1): 69-73.

+?CSCD?·?Baidu Scholar


数据引用格式
郭畅, 胡迪, 杜晓晗, 等. 南京百年人物数据集[DB/OL]. Science Data Bank, 2020. (2020-03-17). DOI: 10.11922/sciencedb.937.

稿件与作者信息

论文引用格式
郭畅, 胡迪, 杜晓晗, 等. 南京百年人物数据集[J/OL]. 中国科学数据, 2020, 5(3). (2020-03-17). DOI: 10.11922/csdata.2020.0001.zh.
郭畅Guo Chang

主要承担工作:数据的处理、加工,数据集生成,论文的撰写。
(1998—),女,浙江杭州人,本科生,研究方向为地理信息科学。

胡迪Hu Di

主要承担工作:研究思路设计与论文撰写指导。
hud316@gmail.com
(1984—),男,湖北黄冈人,博士,副教授,硕士生导师,研究方向为时空数据模型、历史GIS。

杜晓晗Du xiaohan

主要承担工作:数据的处理、加工,数据集生成。
(1999—),女,陕西南郑人,本科生,研究方向为地理信息科学。

李岱蔚Li daiwei

主要承担工作:数据的处理、加工,数据集生成。
(1998—),男,山西阳泉人,本科生,研究方向为地理信息科学。

杨逸尘Yang yichen

主要承担工作:数据的处理、加工,数据集生成。
(1999—),男,江苏启东人,本科生,研究方向为地理信息科学。

程星华Cheng Xinghua



相关话题/数据 数据库 历史 信息 工作

  • 领限时大额优惠券,享本站正版考研考试资料!
    大额优惠券
    优惠券领取后72小时内有效,10万种最新考研考试考证类电子打印资料任你选。涵盖全国500余所院校考研专业课、200多种职业资格考试、1100多种经典教材,产品类型包含电子书、题库、全套资料以及视频,无论您是考研复习、考证刷题,还是考前冲刺等,不同类型的产品可满足您学习上的不同需求。 ...
    本站小编 Free壹佰分学习网 2022-09-19
  • 1997–2011年黄土丘陵区连续施肥试验土壤水分数据集
    摘要&关键词摘要:黄绵土是陕北黄土丘陵沟壑区的主要耕种土壤,其特征为土层深厚,可储存大量的雨水,被称为旱地作物成长的土壤水库。然而,由于降水偏少,加之水土流失造成的土壤养分贫乏,土壤培肥就成为提高黄绵土生产力的重要措施。有机无机肥料配合施用,连续施用化肥对作物的效益如何?对土壤性质有何影响?为探究上 ...
    本站小编 Free考研考试 2022-01-02
  • 2004–2016年中国生态系统研究网络水体酸碱度和总溶解性固体数据集
    摘要&关键词摘要:水体的酸碱度(pH)和总溶解性固体(TDS)是中国生态系统研究网络(CERN)的重要监测指标,可为生态系统水体质量长期变化研究提供重要数据。降水pH可以表征其是否为酸沉降,地表水和地下水的pH则关系到水质是否对植物生长和动物饮用存在危害等。TDS是表征水体溶解性固体总含量的指标,同 ...
    本站小编 Free考研考试 2022-01-02
  • 2009–2018年西南典型紫色土丘陵区土壤含水量变化数据集
    摘要&关键词摘要:土壤水是农田土壤生态系统中颗粒、胶体和物质运移的主要载体,也是土壤—植物—大气连续体物质交换和能量传导的关键因子,对作物生理生长特性和生态系统服务功能有着重要影响。四川盐亭农田生态系统国家野外科学观测研究站(简称盐亭站)是长江上游唯一的国家农田生态系统科学观测研究站,代表了中亚热带 ...
    本站小编 Free考研考试 2022-01-02
  • 京津冀城市群大区域高分卫星数据产品
    摘要&关键词摘要:采用2018–2019年的国产高分一号B/C、高分二号、高分六号等卫星遥感数据,通过影像配准、平差、几何校正、影像融合、影像镶嵌等卫星数据深加工处理方法得到京津冀城市群地区大区域高分辨率镶嵌影像,空间分辨率为2m,是针对京津冀城市群研制的现势性较好的高分卫星即得即用数据产品。本数据 ...
    本站小编 Free考研考试 2022-01-02
  • 2018年山东省GF-1 WFV相对辐射归一化数据集
    摘要&关键词摘要:地表反射率是遥感定量反演的一个关键参数,对于研究地表和大气间辐射能量平衡、地物识别和分类、水分与气候模型等具有十分重要的意义。本数据集采用相对辐射归一化的方法,以Landsat8OLI地表反射率数据产品为基准影像,对2018年山东省GF-1WFV卫星无云影像进行辐射归一化。相对辐射 ...
    本站小编 Free考研考试 2022-01-02
  • 遥感数据即得即用(Ready To Use,RTU)产品
    摘要&关键词摘要:遥感数据呈现大数据特征并广泛应用于资源调查、环境监测、灾害评估等领域,但其潜在的应用价值还没有被充分挖掘出来。遥感数据工程的建立将有助于遥感数据的智能分析和信息挖掘。即得即用(ReadyToUse,RTU)产品具有辐射归一化、几何标准化、剖分网格化等特点,可直接用于后续的分析应用。 ...
    本站小编 Free考研考试 2022-01-02
  • 《卫星遥感数据即得即用(RTU)产品集专题》卷首语
    卫星遥感数据作为国家基础性和战略性资源,在国民经济、社会发展和国家安全中发挥不可或缺的作用。随着遥感技术、通讯技术以及计算机技术的快速发展,人类对地球进行多尺度、全方位、高频度动态监测的能力进一步增强,卫星遥感数据呈现爆炸性增长,卫星遥感进入大数据时代。高质量的数据是进行科学研究、认知地学规律和实现 ...
    本站小编 Free考研考试 2022-01-02
  • 遥感数据即得即用(Ready To Use,RTU)地理格网产品规范
    摘要&关键词摘要:遥感影像是一种平面栅格数据,以一定的地图投影方式反映地球表面的表象。常规的标准遥感影像分幅产品是以一定的规则按照景来分幅的,不同的卫星影像,景的分幅和编码规则不同。遥感影像的景没有完全与地球上的地理坐标对应。为了使长时序影像更容易查询、分析和管理,本文提出遥感影像即得即用(Read ...
    本站小编 Free考研考试 2022-01-02
  • 2005–2018年鼎湖山森林生态系统定位研究站气象数据集
    摘要&关键词摘要:气象数据是区域气候特征描述的重要基础资料,开展局地长期气象观测对提升区域气象预报准确度和防灾减灾能力、认知与应对气候变化等意义深远。气象因子是中国生态系统研究网络(ChineseEcosystemResearchNetwork,CERN)各定位站野外观测的重要要素之一。中国科学院鼎 ...
    本站小编 Free考研考试 2022-01-02
  • 2005–2014年桃源站气象综合观测场土壤水热动态数据集
    摘要&关键词摘要:土壤水热状况不仅对作物的生长、节水灌溉有着重要的作用,同时对大气环流和气候变化也影响重大,这类高质量的长期野外监测数据尤为宝贵。湖南桃源农田生态系统国家野外观测研究站地处江南丘陵复合农业生态区,该区光、热、水和生物资源丰富,气候生产潜力高,复合农业经营发达,是我国传统的粮、油、猪、 ...
    本站小编 Free考研考试 2022-01-02