一、研究進(jìn)展情況
主要內(nèi)容:
①研究計(jì)劃總體執(zhí)行情況及各子課題進(jìn)展情況
本課題的研究前期主要是收集和整理兩岸關(guān)系的族譜資料和研發(fā)設(shè)計(jì)數(shù)據(jù)庫。在資料數(shù)據(jù)化、電子化的同時(shí),開展相關(guān)的課題研究和學(xué)術(shù)交流活動(dòng)。
資料收集電子化是一項(xiàng)龐大的工程,收集整理逾萬種的家譜資料不僅僅是完成資料掃描電子化那么簡(jiǎn)單。慶幸地是我們?cè)诮ㄔO(shè)數(shù)據(jù)庫的過程中研發(fā)了人工智能識(shí)別系統(tǒng),使我們將電子化的族譜資料進(jìn)行人工智能識(shí)別時(shí)提高了效率,推進(jìn)了數(shù)據(jù)庫的建設(shè)工作。
我們將以往收集到的族譜資料整理出版,完成了《客家珍稀譜牒文獻(xiàn)叢刊》(100冊(cè)),由廣東人民出版社正式出版。課題組成員已撰寫相關(guān)論文10多篇,并完成《閩臺(tái)族譜文獻(xiàn)研究》(20萬字)撰寫工作,正與九州出版社簽訂出版合同。
相關(guān)課題組正在編纂族譜目錄,并撰寫有關(guān)族譜與兩岸關(guān)系、閩臺(tái)社會(huì)等方面的研究論著。
②調(diào)查研究及學(xué)術(shù)交流情況
族譜資料的收集情況:課題組基本完成了各地族譜資料的收集工作,并派員赴臺(tái)灣收集族譜資料。我們先后有6人赴臺(tái)收集資料20天,有1人赴臺(tái)1個(gè)月訪學(xué)并收集課題相關(guān)的族譜資料。
2018年2月6日,利用課題開題之際,我們與福建省姓氏源流研究會(huì)共同舉辦了兩岸關(guān)系族譜資料數(shù)據(jù)庫建設(shè)會(huì)議,邀請(qǐng)了臺(tái)灣10余位姓氏研究會(huì)代表出席會(huì)議。
2018年12月7日——9日,我們?cè)诟V菖e辦了第六屆兩岸文化發(fā)展論壇,與會(huì)代表100余人,其中臺(tái)灣代表出席會(huì)議亦有30人之多,會(huì)議以兩岸族譜研究、宗親關(guān)系等為題展開深入地探討。
2019年4月20日,我們同臺(tái)北大學(xué)人文學(xué)院陳俊強(qiáng)簽訂了福建師范大學(xué)與臺(tái)北大學(xué)人文學(xué)院學(xué)術(shù)交流的協(xié)議,雙方擬在在臺(tái)灣文獻(xiàn)資料研究方面,在臺(tái)灣民俗文化研究方面,加強(qiáng)合作。
2019年6月16日——18日,我們?cè)诟V菖e辦了第十一屆海峽論壇之第七屆兩岸文教發(fā)展論壇,臺(tái)灣代表有30多位出席會(huì)議并發(fā)言。
圍繞兩岸關(guān)系我們亦邀請(qǐng)廈門大學(xué)臺(tái)灣研究院的李鵬、劉國(guó)深、唐永紅、張寶蓉;福建社會(huì)科學(xué)院的劉小新、劉傳標(biāo);全國(guó)臺(tái)灣研究會(huì)的汪毅夫;上海交通大學(xué)臺(tái)灣研究中心的林岡;臺(tái)灣世新大學(xué)的曾永義、臺(tái)灣淡江大學(xué)的呂正惠、臺(tái)灣東海大學(xué)的趙剛、臺(tái)灣中華兩岸和平發(fā)展聯(lián)合會(huì)的藍(lán)博洲、臺(tái)灣藝術(shù)大學(xué)的王慶臺(tái)、臺(tái)灣佛光大學(xué)的謝大寧等來福建師范大學(xué)閩臺(tái)區(qū)域研究中心(課題組依托單位)做學(xué)術(shù)報(bào)告。與研究臺(tái)灣問題的學(xué)者交流,與來自臺(tái)灣的學(xué)者專家交流,大大豐富了我們對(duì)課題研究的思路和眼界,有力地推動(dòng)了兩岸關(guān)系族譜資料數(shù)據(jù)庫的建設(shè)工作。
③成果宣傳推介情況
在課題研究的過程中,由于資料數(shù)據(jù)化的工作極其重要,人工智能識(shí)別系統(tǒng)的應(yīng)用特別引人矚目。我們開發(fā)使用的人工智能識(shí)別系統(tǒng)亦引起相關(guān)部門的注意,浙江師范大學(xué)圖書館、暨南大學(xué)圖書館、臺(tái)灣淡江大學(xué)EMBA福建考察團(tuán)、福建省圖書館、廣州市圖書館都前來商談人工智能識(shí)別系統(tǒng)的應(yīng)用事宜,并考察兩岸關(guān)系族譜資料數(shù)據(jù)庫的功能。
二、研究成果情況
主要內(nèi)容:①代表性成果簡(jiǎn)介
本課題主要的代表性成果——《兩岸關(guān)系族譜資料數(shù)據(jù)庫》的建設(shè),具體情況如下:
截至2019年7月,征集加工入庫的族譜主要是福建、臺(tái)灣兩省1949年之前老譜,共計(jì)1517冊(cè)、144323頁,詳見:族譜深加工族譜目錄。2020年6月前計(jì)劃征集加工入庫的涉臺(tái)族譜共1.5萬冊(cè),125萬頁(其中福建地區(qū)5542冊(cè)、70萬頁,臺(tái)灣家譜6781冊(cè)、25萬頁,其他2677冊(cè)、30萬頁)。
在《兩岸關(guān)系族譜資料數(shù)據(jù)庫》數(shù)據(jù)庫建設(shè)中,我們創(chuàng)建了OCR人工智能平臺(tái),對(duì)于已經(jīng)預(yù)處理的圖片進(jìn)行文字比對(duì)識(shí)別,識(shí)別內(nèi)容主要包括:文字、符號(hào)、數(shù)字以及表格等內(nèi)容。現(xiàn)目前,OCR人工智能識(shí)別系統(tǒng)的識(shí)別率高達(dá)99%以上,極大提高了家譜資料識(shí)別準(zhǔn)確率,從而降低人工校對(duì)的要求。兩岸關(guān)系家譜圖片成果達(dá)到全文識(shí)別,將使圖片數(shù)字化發(fā)展提升到一個(gè)新的階段,為我們的最終成果兩岸關(guān)系族譜資料數(shù)據(jù)庫的文獻(xiàn)查詢提供了技術(shù)支持。
其次,數(shù)據(jù)庫的建設(shè)過程中,生成了世譜樹,世譜樹是族譜中最重要的組成部分,基于OCR人工智能識(shí)別與校對(duì),對(duì)出現(xiàn)在家譜中的譜系圖、譜系圖表、譜系描述文字等部分中的每一個(gè)人物進(jìn)行置標(biāo)以及二維關(guān)系的維護(hù)。對(duì)譜系人物的信息進(jìn)行標(biāo)引著錄,使人物及人物關(guān)系結(jié)構(gòu)清晰化,生成完整家譜世系樹。通過對(duì)人物的坐標(biāo)定位,可實(shí)現(xiàn)搜索、快速查找。世系樹的各節(jié)點(diǎn)都可以展示人員的詳細(xì)信息。
人物信息置標(biāo)內(nèi)容包括:姓、名、諱、字、號(hào)、別稱、謚號(hào)、性別、生、卒、世代、支派等。按照支派、世代的先后順序,同一支派的同一世代按照從右向左、從上至下的順序依次置標(biāo)。
提供世系樹各節(jié)點(diǎn)數(shù)據(jù)的導(dǎo)入和導(dǎo)出功能。“導(dǎo)出”和“導(dǎo)入”功能用于支持本系統(tǒng)與外部系統(tǒng)的數(shù)據(jù)交換,導(dǎo)入數(shù)據(jù)用于選擇一個(gè)數(shù)據(jù)交換文件 (xml、excel)將其中的人物數(shù)據(jù)導(dǎo)入并將之作為選中人物的后代。導(dǎo)出可以對(duì)世系樹上的各個(gè)節(jié)點(diǎn)信息以及隸屬于該節(jié)點(diǎn)的族譜信息的導(dǎo)出,導(dǎo)出文檔模式可以根據(jù)客戶需要進(jìn)行選擇。
第三方面,我們已完成了數(shù)據(jù)庫的“在線修譜”工作。族譜的編修是繼承傳統(tǒng)文化、家族命脈的需要,通過在線修譜可進(jìn)行家族族譜的共同編修、修整和快速續(xù)譜,傳播譜牒文化知識(shí)。平臺(tái)在對(duì)老譜進(jìn)行數(shù)字化深加工(族譜人工智能識(shí)別與校對(duì))后,在線修譜軟件會(huì)分析原譜體例,產(chǎn)生規(guī)范家譜章節(jié)文本數(shù)據(jù)與世系樹,提供完整的族譜編修界面。
兩岸關(guān)系族譜資料數(shù)據(jù)庫的后臺(tái)管理也相繼完備,主要體現(xiàn)在⑴系統(tǒng)管理;⑵任務(wù)分配;⑶統(tǒng)計(jì)功能;⑷文件管理;⑸數(shù)據(jù)庫備份;⑹系統(tǒng)日志功能等方面。
《兩岸關(guān)系族譜資料數(shù)據(jù)庫》主要功能有族譜全文檢索、輸名尋祖、在線修譜等功能。應(yīng)用系統(tǒng)總體建構(gòu)采用分層設(shè)計(jì)思想,具體分為:表現(xiàn)層、接入層、應(yīng)用層、數(shù)據(jù)層。今后的工作即充實(shí)數(shù)據(jù)庫的內(nèi)容,不斷地完善數(shù)據(jù)庫功能。
三、下一步研究計(jì)劃
1. 族譜征集工作,尤其是臺(tái)灣地區(qū)的族譜還需實(shí)地調(diào)研征集。
2. 族譜資料數(shù)據(jù)化加工。人工智能識(shí)別族譜資料尚完成總體工作的12%還需進(jìn)一步的推進(jìn)。
3. 族譜總目編目工作需要盡快完成。
4. 繼續(xù)編寫相關(guān)的論文和著作。
5. 舉辦關(guān)于兩岸族譜研究的學(xué)術(shù)會(huì)議。
課題組供稿