一、研究進(jìn)展情況
一、研究計(jì)劃總體執(zhí)行情況
本項(xiàng)目2012年10月立項(xiàng)。2013年1月13日舉行開(kāi)題論證會(huì),至今(2014年6月)已有一年五個(gè)月。一年多來(lái),項(xiàng)目按照原定計(jì)劃推進(jìn),總體進(jìn)展順利。
本項(xiàng)目的總目標(biāo)是建設(shè)一個(gè)可與GIS銜接的、方言布點(diǎn)較均衡、語(yǔ)料類(lèi)型較全、標(biāo)注較精的基礎(chǔ)方言口語(yǔ)語(yǔ)料庫(kù),同時(shí)借助語(yǔ)料庫(kù)建設(shè)推動(dòng)方言研究的數(shù)字化。課題有兩項(xiàng)建設(shè)目標(biāo):(1)建語(yǔ)料庫(kù);(2)通過(guò)建庫(kù)推動(dòng)方言研究的數(shù)字化。依據(jù)研究計(jì)劃,課題分前期(2013)、中期(2014-2016)、后期(2017)三個(gè)階段。前期主要任務(wù)是基礎(chǔ)理論研究和建庫(kù)設(shè)計(jì);中期主要是語(yǔ)料采集和標(biāo)注;后期主要是語(yǔ)料庫(kù)運(yùn)行和完善。目前已完成前期基礎(chǔ)理論研究,剛進(jìn)入中期語(yǔ)料采集。具體情況如下。
1.1 前期基礎(chǔ)理論研究(2013.02-2014.05)
調(diào)動(dòng)組織全組力量,完成了三項(xiàng)基礎(chǔ)工作:(1)梳理相關(guān)文獻(xiàn),厘清建庫(kù)的基本理念,重新審視并確認(rèn)申報(bào)時(shí)論證的語(yǔ)料庫(kù)定位;(2)依據(jù)語(yǔ)料庫(kù)定位設(shè)計(jì)語(yǔ)料庫(kù)整體架構(gòu)、確定數(shù)據(jù)類(lèi)型與數(shù)據(jù)結(jié)構(gòu);(3)研究口語(yǔ)語(yǔ)篇類(lèi)型,擬定語(yǔ)料采錄大綱。
1.1.1 確認(rèn)語(yǔ)料庫(kù)定位
項(xiàng)目組對(duì)語(yǔ)料庫(kù)文獻(xiàn)及本項(xiàng)目所涉方言的各種文獻(xiàn)進(jìn)行了仔細(xì)梳理,結(jié)合研究目標(biāo)厘清了建庫(kù)的三個(gè)基本理念:專(zhuān)庫(kù)多用、開(kāi)放互動(dòng)、方言研究數(shù)字化;同時(shí)確認(rèn)本項(xiàng)目應(yīng)建一個(gè)基礎(chǔ)性的、系統(tǒng)語(yǔ)篇型語(yǔ)料庫(kù),即給本庫(kù)兩個(gè)定位:(1)基礎(chǔ)性;(2)系統(tǒng)語(yǔ)篇型。
1.1.2 完成語(yǔ)料庫(kù)設(shè)計(jì)及各類(lèi)數(shù)據(jù)設(shè)計(jì)
根據(jù)“基礎(chǔ)性”和“系統(tǒng)語(yǔ)篇型”的定位設(shè)計(jì)了語(yǔ)料庫(kù)結(jié)構(gòu)及各類(lèi)數(shù)據(jù)結(jié)構(gòu)。我們用三項(xiàng)設(shè)計(jì)實(shí)現(xiàn)“基礎(chǔ)性”定位:
第一,語(yǔ)料類(lèi)型的基礎(chǔ)性。以口語(yǔ)語(yǔ)篇為主,輔以字、詞、句等基礎(chǔ)語(yǔ)料。從建庫(kù)目標(biāo)看,基礎(chǔ)語(yǔ)料是實(shí)現(xiàn)語(yǔ)篇自動(dòng)或半自動(dòng)標(biāo)注的支柱;從語(yǔ)料庫(kù)結(jié)構(gòu)看,基礎(chǔ)語(yǔ)料與語(yǔ)篇語(yǔ)料互為依托,才能滿足方言研究及應(yīng)用研究的各種需求。
第二,方言布點(diǎn)的基礎(chǔ)性。方言口語(yǔ)語(yǔ)篇兼具方言的語(yǔ)言系統(tǒng)及其所承載的地域文化的雙重基礎(chǔ)性。為呈現(xiàn)這種雙重基礎(chǔ)性,方言布點(diǎn)兼顧方言與文化。因方言分區(qū)與地域文化大體對(duì)應(yīng),故依照漢語(yǔ)方言的一二級(jí)分區(qū)、選擇地域文化中心的具有典型代表的縣市設(shè)方言點(diǎn)。這些方言點(diǎn)覆蓋全國(guó)九個(gè)大方言區(qū)和官話的八個(gè)二級(jí)分區(qū),是當(dāng)?shù)亟?jīng)濟(jì)文化中心(或?yàn)楣懦牵哂械赜蛭幕硇浴?/p>
第三,語(yǔ)料形式與內(nèi)容統(tǒng)一的基礎(chǔ)性。語(yǔ)料形式指其語(yǔ)言樣態(tài),語(yǔ)料內(nèi)容指其所映射的客觀世界。選用適量的方言文化語(yǔ)料,體現(xiàn)方言所承載的經(jīng)典地域文化。
用兩項(xiàng)設(shè)計(jì)實(shí)現(xiàn)“系統(tǒng)語(yǔ)篇型”定位。“系統(tǒng)語(yǔ)篇型”有兩個(gè)含義,一是語(yǔ)料類(lèi)型以語(yǔ)篇為主;二是語(yǔ)料是系統(tǒng)的(Systematic),即預(yù)先確定收集語(yǔ)料的原則和比例,語(yǔ)料具有平衡性和系統(tǒng)性。
第一,設(shè)兩個(gè)大庫(kù):語(yǔ)篇庫(kù)和基礎(chǔ)庫(kù),語(yǔ)篇庫(kù)是主庫(kù),基礎(chǔ)庫(kù)是副庫(kù),體現(xiàn)語(yǔ)篇的主角地位。兩個(gè)大庫(kù)分別設(shè)三個(gè)子庫(kù):語(yǔ)篇庫(kù)有文本語(yǔ)篇庫(kù)、即席語(yǔ)篇庫(kù)和自錄語(yǔ)篇庫(kù),基礎(chǔ)庫(kù)含字庫(kù)、詞庫(kù)和句庫(kù)。
第二,語(yǔ)篇類(lèi)型分三級(jí),三級(jí)類(lèi)型所含種類(lèi)數(shù)成寶塔狀:頂部的一級(jí)種類(lèi)數(shù)目少,概括度高,便于操作;中底部的二、三級(jí)類(lèi)型數(shù)目遞增,盡量涵蓋方言口語(yǔ)中出現(xiàn)的各種細(xì)類(lèi),體現(xiàn)語(yǔ)篇語(yǔ)料的系統(tǒng)性。設(shè)定每一小類(lèi)的采錄內(nèi)容及大體相當(dāng)?shù)臅r(shí)長(zhǎng),實(shí)現(xiàn)語(yǔ)料平衡。
設(shè)計(jì)基礎(chǔ)數(shù)據(jù)。語(yǔ)篇庫(kù)以語(yǔ)篇為一級(jí)單位、以句為二級(jí)單位設(shè)計(jì)數(shù)據(jù),每條數(shù)據(jù)24個(gè)字段;A(chǔ)庫(kù)因語(yǔ)言單位不同,分別設(shè)計(jì)數(shù)據(jù)字段。字庫(kù)以音節(jié)為一級(jí)單位、以音位為二級(jí)單位設(shè)計(jì),每條數(shù)據(jù)41字段。詞庫(kù)以詞語(yǔ)為一級(jí)單位、以音節(jié)結(jié)構(gòu)元素為二級(jí)單位設(shè)計(jì),每條數(shù)據(jù)42字段。句庫(kù)以句為單位設(shè)計(jì),每條數(shù)據(jù)22字段。各類(lèi)數(shù)據(jù)的字段數(shù)目雖不同,但都含三部分,一是語(yǔ)言信息字段,二是制作信息字段,三是與GIS銜接的字段。
1.1.3 完成語(yǔ)料庫(kù)采錄底本制作
語(yǔ)料采錄底本是語(yǔ)料庫(kù)建設(shè)的根本,前述各項(xiàng)設(shè)計(jì)能否兌現(xiàn)取決于語(yǔ)料采錄底本的結(jié)構(gòu)與質(zhì)量。語(yǔ)料采錄底本還是中后期工作的綱領(lǐng)。因此,擬制語(yǔ)料采錄底本是前期基礎(chǔ)研究的歸宿與重心,項(xiàng)目組傾注了大量人力、物力與精力。語(yǔ)料采錄底本分字表、詞表、句表和語(yǔ)篇底本四類(lèi)。前三類(lèi)我們有前期積累,而語(yǔ)篇底本我們既無(wú)前期研究成果,又缺乏可資參考的資料,是重中之重。四類(lèi)采錄底本的研制經(jīng)歷了三步。第一步參閱文獻(xiàn)擬草稿(2013年2月-2013年11
月)。第二步征求意見(jiàn)后修改加工形成初稿(2013年12月)。2013年12月中旬在
廣州召開(kāi)第17屆全國(guó)漢語(yǔ)方言學(xué)會(huì)年會(huì),四類(lèi)采錄底本以論文形式在會(huì)上交流,廣泛征求專(zhuān)家意見(jiàn)。第三步經(jīng)實(shí)地采錄試驗(yàn)后再次修訂、定稿(2014年2月-4月)。2014年1月在南京用采錄底本初稿試驗(yàn)錄制,然后逐字、逐詞、逐句、逐篇整理、修訂,再定稿。四類(lèi)采錄底本的擬制情況見(jiàn)下節(jié)“調(diào)查研究”。
1.2 中期語(yǔ)料研究(2014年1月-至今)
2014年上半年是前期基礎(chǔ)研究與中期語(yǔ)料研究的銜接過(guò)渡期。已按計(jì)劃完成南京方言的試驗(yàn)采錄,并根據(jù)試驗(yàn)結(jié)果修訂完善了語(yǔ)料采錄大綱。其他方言點(diǎn)的同步采錄工作大多安排就緒,計(jì)劃暑假開(kāi)工。
南京方言的采錄試驗(yàn)集中在2014年1月,依照采錄底本初稿完成了主體工作,含4052單字、542雙字組、5646詞語(yǔ)、100語(yǔ)法例句,以及文本語(yǔ)篇、即席語(yǔ)篇的錄音和錄像。2月至6月進(jìn)行了兩項(xiàng)后續(xù)工作。一是依據(jù)試驗(yàn)結(jié)果修訂采錄底本的缺陷,補(bǔ)充、刪節(jié)、修改有關(guān)內(nèi)容,完善采錄底本。其中字表和詞表有較大改動(dòng),語(yǔ)篇底本有個(gè)別調(diào)整。二是檢查所錄語(yǔ)料是否合格。重點(diǎn)檢查方言是否準(zhǔn)確、地道,音檔有無(wú)撲麥、過(guò)載或信噪比不足,音檔數(shù)量與采錄底本是否吻合。請(qǐng)當(dāng)?shù)胤窖匀藢徛?tīng)方言是否合格,由項(xiàng)目組成員審查技術(shù)問(wèn)題。將審核出的問(wèn)題集中,擬制成補(bǔ)錄提綱,于2014年4月完成補(bǔ)錄。然后整理補(bǔ)錄的音檔,替換原不合格音檔。根據(jù)新定采錄底本重新整理已錄語(yǔ)料,根據(jù)數(shù)據(jù)模型切割音檔,根據(jù)語(yǔ)料庫(kù)構(gòu)架歸置音檔于指定位置,使所有音檔的編碼、存放位置等與新采錄大綱一致。
二、各子課題進(jìn)展情況
本項(xiàng)目有五個(gè)子課題。子課題一是軟件組,研制建庫(kù)系列軟件;子課題二、三、四是方言組,分別研究東西南北中的方言語(yǔ)料;子課題五研究方言韻律。軟件組和韻律組的研究依托于方言組。方言組的研究主要在前期和中期,軟件組和韻律組的研究主要在中期和后期。五個(gè)子課題都按照原計(jì)劃實(shí)施研究。
2.1 子課題一:語(yǔ)料庫(kù)建設(shè)系列軟件的研制
負(fù)責(zé)人南京師范大學(xué)計(jì)算機(jī)學(xué)院曲維光教授。該子課題的任務(wù)是研究和開(kāi)發(fā)相關(guān)軟件,使語(yǔ)料的采集加工軟件化或半軟件化。采用兩條途徑實(shí)現(xiàn)這一目標(biāo):一是自主研制相應(yīng)軟件,二是借用已有軟件,分別由兩個(gè)小組承擔(dān)。關(guān)于借用軟件,已選了兩款,其中一款已完成與項(xiàng)目的對(duì)接,另一款尚在考察中。關(guān)于自研軟件,正在依據(jù)已錄語(yǔ)料細(xì)化其設(shè)計(jì),并選用供研制軟件用的語(yǔ)料。
借用軟件之一是Elan ( EUDICO Linguistic Annotator),由荷蘭紐梅茵馬克斯布朗克心理語(yǔ)言學(xué)研究所開(kāi)發(fā),是一個(gè)跨平臺(tái)(可在Windows ,Macos ,Linux等主流操作系統(tǒng)上使用)的多媒體轉(zhuǎn)寫(xiě)標(biāo)注軟件。廣泛應(yīng)用于口語(yǔ)語(yǔ)料庫(kù)建設(shè)、話語(yǔ)分析、態(tài)勢(shì)語(yǔ)研究等方面。2001年頒布,比較成熟,已有漢文版。本項(xiàng)目所以選擇Elan是因?yàn)椋旱谝,它可同步?shí)現(xiàn)語(yǔ)篇的三種標(biāo)注——漢字、國(guó)際音標(biāo)、普通話譯文;第二,可分別進(jìn)行音頻、視頻文件的標(biāo)注。這兩種性能與本項(xiàng)目語(yǔ)料文件儲(chǔ)存類(lèi)型及語(yǔ)篇標(biāo)注要求相吻合。按照項(xiàng)目組要求,王洪鐘教授和侯超實(shí)驗(yàn)師研究了Elan性能和操作程序,并用已采錄語(yǔ)料實(shí)際演練,確定語(yǔ)篇標(biāo)注工序。由侯超起草、項(xiàng)目負(fù)責(zé)人審定修改,形成本項(xiàng)目語(yǔ)篇標(biāo)注規(guī)范,收入《漢語(yǔ)方言口語(yǔ)有聲庫(kù)語(yǔ)料采制工作手冊(cè)》下篇第三部分“語(yǔ)料整理規(guī)范”第六款第四條“語(yǔ)篇標(biāo)注規(guī)范”。
另一款軟件可同步錄入用普通話翻譯方言語(yǔ)篇的口語(yǔ)語(yǔ)聲。這將在一定程度上緩解語(yǔ)篇標(biāo)注的壓力。但這款軟件不夠穩(wěn)定。可否改造為建庫(kù)所用,尚在考察中。
該組成員同時(shí)進(jìn)行語(yǔ)言處理及計(jì)算語(yǔ)言學(xué)的相關(guān)研究,發(fā)表論文3篇。
2.2 子課題二:西部北部方言口語(yǔ)語(yǔ)料研究
負(fù)責(zé)人蘭州城市學(xué)院莫超教授。該組負(fù)責(zé)北方官話二級(jí)分區(qū)及晉語(yǔ)的9個(gè)方言點(diǎn)的語(yǔ)料研究。在2013年的前期基礎(chǔ)研究中,協(xié)同總項(xiàng)目組完成了語(yǔ)法采錄大綱的研制。專(zhuān)題研制了“蘭銀官話語(yǔ)法基礎(chǔ)語(yǔ)料調(diào)查提要”,為中期蘭銀官話語(yǔ)法語(yǔ)料的采錄提供了依據(jù)。
2014年2-5月,該子課題有8個(gè)方言點(diǎn)完成了以下三項(xiàng)基礎(chǔ)工作:
(1)梳理方言音系已有研究成果,匯總主要分歧,為歸納音系做準(zhǔn)備。
(2)擬制本方言特有文化語(yǔ)料采錄底本。這是語(yǔ)篇采錄大綱的內(nèi)容之一,約占一個(gè)方言點(diǎn)語(yǔ)篇總時(shí)長(zhǎng)的20%。
(3)擬出本方言特征詞表。這是采錄詞表的內(nèi)容之一,占一個(gè)方言點(diǎn)采錄總詞條數(shù)的3.6%。
本項(xiàng)目語(yǔ)料采錄大綱分所有方言共有和各方言特有兩部分,以共有語(yǔ)料為主,特有語(yǔ)料為輔。共有語(yǔ)料由總項(xiàng)目組設(shè)計(jì)。特有語(yǔ)料分特有文化語(yǔ)料和特征詞兩類(lèi)。特有文化語(yǔ)料由各方言點(diǎn)根據(jù)語(yǔ)篇模型擬出初稿,由總項(xiàng)目組審核定稿。特征詞由總項(xiàng)目組提供初稿,方言點(diǎn)核實(shí)、補(bǔ)充、修訂,再由總項(xiàng)目組審核、定稿。兩類(lèi)語(yǔ)料的設(shè)計(jì)模型均經(jīng)過(guò)2014年1月的語(yǔ)料采錄試點(diǎn)的檢驗(yàn)。2月,各方言點(diǎn)開(kāi)始工作,5月全部完成。
特有文化語(yǔ)料歸屬語(yǔ)篇,項(xiàng)目組依據(jù)語(yǔ)篇模型規(guī)定其種類(lèi)及數(shù)量,以保持各方言點(diǎn)語(yǔ)料的平衡。擬出特有文化語(yǔ)料底本的統(tǒng)一書(shū)寫(xiě)模板,以保證語(yǔ)料采集大綱的整齊與一致。關(guān)于特征詞,項(xiàng)目組提供了精粗不一的初稿,各方言依據(jù)多種文獻(xiàn)和責(zé)任人此前的研究積累進(jìn)行復(fù)核修訂。各方言修訂的幅度不同,有的未修訂,仍采用原稿;有的刪節(jié)大部分詞條,另做補(bǔ)充;有的基本保留原詞條,補(bǔ)充了詞義、例證等。提交的特征詞表各方言數(shù)目不等,需要項(xiàng)目組最終審核統(tǒng)一。關(guān)于音系綜述,有的方言點(diǎn)已有研究不多,尚無(wú)分歧,略去不做。
以上三項(xiàng)工作及完成情況的概括包含三個(gè)方言組,下文匯報(bào)另兩個(gè)方言組情況時(shí)不再重復(fù)。
本組有8個(gè)方言點(diǎn)擬定了特有文化語(yǔ)料采錄大綱:北京官話(馮青青博士)、膠遼官話(王淑霞教授)、冀魯官話(張燕芬副教授)、甘肅蘭銀官話和寧夏蘭銀官話(莫超教授)、東北官話(梁曉玲副教授)、新疆蘭銀官話(張洋教授)、晉語(yǔ)(史秀菊教授),共11.18萬(wàn)字,平均每方言1.4萬(wàn)字。有7個(gè)方言擬制了特征詞表(新疆點(diǎn)除外),共1634條,平均每方言233條;有5個(gè)方言做了音系綜述(膠遼官話、晉語(yǔ)、新疆蘭銀官話除外),總字?jǐn)?shù)1.73萬(wàn)字,平均每方言0.346萬(wàn)字。
該組成員同時(shí)進(jìn)行本方言的相關(guān)研究,發(fā)表論文12篇。
2.3 子課題三:中部東部方言口語(yǔ)語(yǔ)料研究
負(fù)責(zé)人浙江師范大學(xué)王洪鐘教授。該組負(fù)責(zé)吳語(yǔ)、徽語(yǔ)、湘語(yǔ)、江淮官話共5個(gè)方言點(diǎn)的語(yǔ)料研究。2013年的基礎(chǔ)研究階段,協(xié)同總項(xiàng)目組研究語(yǔ)篇采錄大綱,以及語(yǔ)篇標(biāo)注軟件的引介工作。
2013年1-5月,王洪鐘首次研究了方言口語(yǔ)的語(yǔ)篇類(lèi)型,擬出語(yǔ)篇采錄初稿,為本項(xiàng)目語(yǔ)篇采錄底本的后續(xù)研究奠定了良好基礎(chǔ)。同時(shí),嘗試用Elan標(biāo)注方言語(yǔ)篇,使本項(xiàng)目建庫(kù)軟件的開(kāi)發(fā)借用進(jìn)入了操作層面。
2014年1-4月,江淮官話南京方言點(diǎn)作為項(xiàng)目試點(diǎn)完成語(yǔ)料采錄。
2014年2-5月,本組的其他4個(gè)方言點(diǎn)完成了特有文化語(yǔ)料底本、特征詞表、音系文獻(xiàn)綜述等研究:南部吳語(yǔ)(王洪鐘教授)、北部吳語(yǔ)(顧勁松副教授)、徽語(yǔ)(栗華益副教授)、湘語(yǔ)(李康澄博士)。4個(gè)方言的特有文化語(yǔ)料底本總字?jǐn)?shù)8.74萬(wàn),平均每方言點(diǎn)2.185萬(wàn)字。4方言音系綜述共1.454萬(wàn)字,平均每方言點(diǎn)0.36萬(wàn)字。修訂特征詞表的有3個(gè)方言,共497詞條,平均每方言點(diǎn)166詞,徽語(yǔ)仍沿用項(xiàng)目組提供的詞表。
該組成員同時(shí)進(jìn)行本方言的相關(guān)研究,出版著作一部,發(fā)表論文17篇。
2.4 子課題四:南部方言口語(yǔ)語(yǔ)料研究
負(fù)責(zé)人暨南大學(xué)陳曉錦教授,負(fù)責(zé)粵語(yǔ)、閩語(yǔ)、客家話、贛語(yǔ)4個(gè)方言點(diǎn)的語(yǔ)料研究。
2014年2-5月,粵語(yǔ)(陳曉錦教授)和客家話(侯小英博士)完成了擬訂文化語(yǔ)料底本、修訂特征表及音系綜述三項(xiàng)工作;浾Z(yǔ)文化語(yǔ)料底本2.23萬(wàn)字,特征詞162個(gè),音系綜述0.83萬(wàn)字?图曳窖晕幕Z(yǔ)料底本1.45萬(wàn)字,特征詞208條,音系綜述0.35萬(wàn)字。平均每方言點(diǎn)文化語(yǔ)料1.84萬(wàn)字,特征詞185詞,音系綜述0.59萬(wàn)字。
該組成員同時(shí)進(jìn)行本方言的相關(guān)研究,發(fā)表論文9篇。
2.5子課題五:方言口語(yǔ)韻律研究
負(fù)責(zé)人南京師范大學(xué)顧文濤教授。根據(jù)開(kāi)題評(píng)審專(zhuān)家“收縮任務(wù)”“研究韻律詞變調(diào)”的意見(jiàn),本組研究任務(wù)調(diào)整為兩項(xiàng):一是建設(shè)典型方言專(zhuān)用韻律數(shù)據(jù)庫(kù);二是用實(shí)驗(yàn)方法研究各方言點(diǎn)韻律詞(雙音節(jié))變調(diào),為研究方言語(yǔ)料標(biāo)注軟件提供音變規(guī)律的支撐。因收縮了任務(wù),顧文濤教授2013年另設(shè)計(jì)課題“社會(huì)情感的語(yǔ)音生成與認(rèn)知的跨語(yǔ)言跨文化研究”,選為國(guó)家社科基金重大項(xiàng)目,競(jìng)標(biāo)后獲批,立項(xiàng)號(hào)13&ZD189。
該組的方言專(zhuān)用韻律數(shù)據(jù)庫(kù)正在籌建。
韻律詞變調(diào)研究需要語(yǔ)料做實(shí)驗(yàn)。2014年5月,南京完成采錄語(yǔ)料的核對(duì),6月初,選用了其中的542組雙音節(jié)韻律詞開(kāi)始做實(shí)驗(yàn)。目前正在分割組合音檔,做標(biāo)注。預(yù)計(jì)7月底完成。這一研究的另一用意是通過(guò)試驗(yàn)擬出韻律詞變調(diào)的研究規(guī)范。
該組成員同時(shí)還進(jìn)行韻律及方言的相關(guān)研究,發(fā)表論文5篇。
三、調(diào)查研究
主要有文獻(xiàn)調(diào)查和實(shí)地語(yǔ)料采錄。
實(shí)地語(yǔ)料采錄是本項(xiàng)目中期的主要任務(wù)。2104年是中期研究第一年,上半年完成一個(gè)方言的試點(diǎn)采錄,下半年將全面推開(kāi)。
2013年1月至今,項(xiàng)目組調(diào)查研究的重心是語(yǔ)料采錄大綱,分字表、詞表、句表和語(yǔ)篇底本四種。如前所述,研制語(yǔ)料采錄大綱經(jīng)歷了三步:查閱文獻(xiàn)擬草稿,征求意見(jiàn)定初稿,試驗(yàn)檢驗(yàn)后定稿。四類(lèi)語(yǔ)料底本的具體調(diào)查研究如下。
3.1字表。定稿字表分單字表和雙字組表(用來(lái)調(diào)查連讀變調(diào))。定稿單字表4012字,分音系例字(1-337)和同音字匯(338-4012)兩部分,統(tǒng)一編號(hào)。第1-96號(hào)為聲調(diào)例字,97-234為聲母例字,235-337為韻母例字;338-4012為同音字匯。每字?jǐn)y帶反切上下字、中古韻攝、開(kāi)合、等、聲、韻、調(diào)及北京聲韻調(diào)。其中3904-4012的109個(gè)字沒(méi)有古音信息。先后參加字表擬定的有項(xiàng)目組成員吳莉、肖萍、馮青青、王會(huì)、魏漢杰、唐志強(qiáng)、劉俐李。
雙字組表用來(lái)調(diào)查最基本的雙音節(jié)連讀變調(diào)規(guī)律。按照中古四聲八調(diào)設(shè)計(jì),共542組。這些組合首先確保符合調(diào)類(lèi)組合規(guī)則,其次考慮常用性和通用性,考慮到有的方言可能不只八個(gè)聲調(diào),預(yù)留了可補(bǔ)空間。先后參加雙字組表擬定的有侯超、馮青青、劉俐李。
單字表的源表是項(xiàng)目組前期成果“現(xiàn)代漢語(yǔ)方言有聲數(shù)據(jù)庫(kù)”(2005-2012)的采錄字表,經(jīng)歷了四次修訂?傋?jǐn)?shù)由源表的4033字到草稿的4082字、初稿的4052字,定稿為4012字。
第一次修訂(2013年2月至10月)擬出草稿。修訂原則:一字一音一義,不收方言不說(shuō)的字、發(fā)音人難以確認(rèn)的字、冗余字、極度低頻字和語(yǔ)義不明字。做了四項(xiàng)修訂:驗(yàn)核補(bǔ)字,刪重,修繕,補(bǔ)充各字的古音信息。我們用三種材料檢驗(yàn)字表收字,一是42卷本方言詞典共有詞的用字,二是“現(xiàn)代漢語(yǔ)方言有聲數(shù)據(jù)庫(kù)”6000詞匯表用字,三是社科院語(yǔ)言所的詞匯調(diào)查表用字,然后刪重補(bǔ)漏,修訂源表用字、用例、注釋、讀音等方面的不當(dāng)及錯(cuò)漏?傋?jǐn)?shù)由源表的4033增至4082。
第二次修訂(2013年12月)后確定初稿。廣州方言會(huì)議征求意見(jiàn)后,主要修正了有誤的古音和北京音信息,查補(bǔ)了80余字原缺的古音信息,增加了音系例字中的韻母例字,刪節(jié)了30個(gè)不易采錄到的字,給字表重新排序。總字?jǐn)?shù)由草稿的4082減至4052。該稿用于試點(diǎn)采錄。
第三次修訂(2014年2月)后初步定稿。初稿在南京試錄后根據(jù)試驗(yàn)結(jié)果再次修訂。主要工作:再次排查重復(fù)字,刪節(jié)書(shū)面語(yǔ)字、少用字、不便言說(shuō)的字,多義字選其口語(yǔ)常用義,給無(wú)音韻地位的字重新排序。總字?jǐn)?shù)由初稿的4052減至4012。
第四次(2014年5至6月)核對(duì)古音信息,定稿。依據(jù)丁聲樹(shù)、李榮《古今字音對(duì)照手冊(cè)》和社科院語(yǔ)言所《方言調(diào)查字表》,參照《廣韻》、《康熙字典》和郭錫良《漢字古音手冊(cè)》逐字核對(duì)修正或補(bǔ)充4012字的古音信息及北京音信息,共修正補(bǔ)充了34字的相關(guān)信息。
3.2 詞表。定稿詞表分核心詞、基礎(chǔ)詞和特征詞三個(gè)大類(lèi)。前兩類(lèi)是各方言共有詞,反映方言的共性,可用于方言間比較。特征詞各方言點(diǎn)不同,反映方言的個(gè)性。核心詞采用斯瓦迪士的200核心詞,序號(hào)1-200;A(chǔ)詞共5260條,序號(hào)201-5460;按語(yǔ)義分作29類(lèi),按類(lèi)排序。特征詞每方言點(diǎn)各有專(zhuān)屬詞表,詞目在100-300之間,起始序號(hào)5461。
用來(lái)制定詞表的源表是項(xiàng)目組前期成果“現(xiàn)代漢語(yǔ)方言有聲數(shù)據(jù)庫(kù)”(2008-2012)的采錄詞表,有6020條核心詞和基礎(chǔ)詞,各方言特征詞100-400不等。6020條詞表是多重研究的結(jié)果,以三篇系統(tǒng)研究漢語(yǔ)方言詞匯的碩士學(xué)位論文(南京師范大學(xué),2009)為主。該詞表含42卷本方言詞典的3877條方言共有詞(經(jīng)碩士論文自建數(shù)據(jù)庫(kù)統(tǒng)計(jì)得出)。源詞表的收詞及數(shù)量基本符合本項(xiàng)目,但還需要打磨。源詞表經(jīng)過(guò)三次修訂,總詞數(shù)由6020詞減至5886、5646(用于試點(diǎn)錄音),定稿詞表為5460詞。修訂工作主要有:(1)核定收詞單位,刪節(jié)語(yǔ)素,保留詞、短語(yǔ)詞和成語(yǔ)、慣用語(yǔ);(2)核定并注釋詞義,給容易岐解的詞、不易準(zhǔn)確理解的多義詞注釋詞義(取基本義),做到一詞一義;(3)核定詞性,做到一詞一種詞性;(4)刪節(jié)同義重復(fù)詞、生僻詞、已亡詞、近亡詞、書(shū)面語(yǔ)詞、方言中難有對(duì)應(yīng)說(shuō)法的詞,刪節(jié)借用常用名詞或動(dòng)詞的量詞,如一房子人,一挑水,刪節(jié)重疊、兒化等變形詞;(5)分類(lèi)及歸類(lèi);(6)編碼;(7)排序。2013年11月前擬草稿,主要工作是(1)-(4);2013年12月擬出初稿,以(4)-(7)為主;2014年1月后的再次修訂,主要查誤補(bǔ)漏,涉及(1)-(7)全部。
參加詞表修訂的有侯超、宋益丹、唐志強(qiáng)、滕菲、王會(huì)、魏漢杰、唐志強(qiáng)、劉俐李。
3.3 句表。有100語(yǔ)法例句。語(yǔ)法例句不是本項(xiàng)目語(yǔ)料重點(diǎn),因?yàn)楸編?kù)各種類(lèi)型的語(yǔ)篇能提供數(shù)量較大、類(lèi)型較全、自然度較高的語(yǔ)法例句。但自然語(yǔ)篇的語(yǔ)法例句類(lèi)型及其數(shù)量的平衡不易控制,故仍需做此項(xiàng)設(shè)計(jì)。100條語(yǔ)法例句涉及句法結(jié)構(gòu)、句法成分、語(yǔ)序、句型、句類(lèi)、體貌、復(fù)句和特殊格式,以方便方言之間的比較。句表草稿擬出后修訂了一次,即廣州會(huì)議后的修訂,南京試驗(yàn)時(shí)未發(fā)現(xiàn)問(wèn)題。擬制句表的有侯超、莫超。
3.4 語(yǔ)篇。這是本庫(kù)語(yǔ)料建設(shè)的主體,但可資參考的文獻(xiàn)很少。我們認(rèn)為,口語(yǔ)語(yǔ)篇類(lèi)型及據(jù)此而研制的語(yǔ)篇采錄模型是擬制語(yǔ)篇底本的關(guān)鍵。2013年1月,項(xiàng)目開(kāi)題后即由王洪鐘擔(dān)綱,從語(yǔ)篇類(lèi)型入手展開(kāi)研究。5月13日擬出初
稿。項(xiàng)目負(fù)責(zé)人根據(jù)初稿再研究,8月13日擬出第二稿,然后提交方言組學(xué)者討論。8月27日擬出第三稿。第三稿結(jié)合說(shuō)話人角色和語(yǔ)料類(lèi)型進(jìn)行語(yǔ)料平衡處理,設(shè)定各類(lèi)話題編碼,形成語(yǔ)篇采錄模型。然后用具體語(yǔ)料填充該模型,制成語(yǔ)篇采錄表。語(yǔ)篇采錄表經(jīng)廣州會(huì)議征求意見(jiàn)和南京試錄檢驗(yàn)后,調(diào)整了一些話語(yǔ)方式,最終定稿。馮青青參與了具體語(yǔ)料的研制。
確定語(yǔ)篇類(lèi)型依循三條原理:(1)注重語(yǔ)篇形式與語(yǔ)篇內(nèi)容的統(tǒng)一及充實(shí);(2)語(yǔ)篇形式應(yīng)涵蓋本項(xiàng)目所涉及的各種因素;(3)語(yǔ)篇內(nèi)容應(yīng)包含人、自然、社會(huì)和話語(yǔ)四方面,因?yàn)檎Z(yǔ)篇映射客觀世界,客觀世界的基本元素有人、自然和社會(huì);語(yǔ)篇還是話語(yǔ)單位,應(yīng)有話語(yǔ)的內(nèi)涵。語(yǔ)篇設(shè)計(jì)遵循四項(xiàng)原則:(1)類(lèi)型全,篇量足;(2)注重反映方言的語(yǔ)音、詞匯、語(yǔ)法、語(yǔ)篇特點(diǎn),注重反映方言所承載的地域文化特征;(3)便于各方言語(yǔ)料對(duì)比;(4)便于發(fā)音人言說(shuō)和錄音人錄制。
定稿語(yǔ)篇采錄底本分為三大類(lèi):文本語(yǔ)篇(按照文本脫稿言說(shuō)生成)、即席語(yǔ)篇(順著話題即時(shí)言說(shuō)生成)、自錄語(yǔ)篇(根據(jù)語(yǔ)境現(xiàn)場(chǎng)言說(shuō)生成)。三類(lèi)語(yǔ)篇的自然度依次遞增,即:文本語(yǔ)篇﹤即席語(yǔ)篇﹤自錄語(yǔ)篇,但錄制與標(biāo)注的難度順序相反。文本語(yǔ)篇分六類(lèi),即席語(yǔ)篇有四類(lèi),自錄語(yǔ)篇有兩類(lèi)。
四、學(xué)術(shù)會(huì)議
舉辦了重大項(xiàng)目開(kāi)題論證會(huì)。
先期召開(kāi)了開(kāi)題預(yù)備會(huì)。2012年12月15日項(xiàng)目組在寧全體成員參加,主要討論項(xiàng)目負(fù)責(zé)人的開(kāi)題總報(bào)告,五個(gè)子課題的分報(bào)告。重點(diǎn)討論了語(yǔ)料庫(kù)管理及研發(fā)語(yǔ)料處理軟件問(wèn)題,GIS(地理信息系統(tǒng))技術(shù)與方言語(yǔ)料對(duì)接問(wèn)題,語(yǔ)篇類(lèi)型設(shè)計(jì)、采錄、標(biāo)注等問(wèn)題。安排了論證會(huì)的學(xué)術(shù)準(zhǔn)備與會(huì)務(wù)籌備。
2013年1月13日,開(kāi)題論證會(huì)在南京師范大學(xué)隨園舉行。會(huì)議由中國(guó)社會(huì)科學(xué)院語(yǔ)言所侯精一研究員主持,出席會(huì)議的有上海師范大學(xué)潘悟云、復(fù)旦大學(xué)游汝杰、復(fù)旦大學(xué)陳忠敏、南京大學(xué)顧黔等五位教授,江蘇省社科規(guī)劃辦主任徐之順,還有南京師范大學(xué)副校長(zhǎng)繆建東、社會(huì)科學(xué)處處長(zhǎng)秦國(guó)榮、文學(xué)院院長(zhǎng)駱冬青、副院長(zhǎng)黨銀平等教授。項(xiàng)目負(fù)責(zé)人劉俐李教授做開(kāi)題總報(bào)告,子課題負(fù)責(zé)人蘭州城市學(xué)院副院長(zhǎng)莫超、浙江師范大學(xué)王洪鐘、南師大計(jì)算機(jī)學(xué)院副院長(zhǎng)曲維光、南師大文學(xué)院顧文濤四教授作子課題開(kāi)題報(bào)告,骨干成員南師大地科院龍毅教授就本項(xiàng)目與GIS的銜接作說(shuō)明。各位評(píng)審專(zhuān)家就數(shù)據(jù)庫(kù)規(guī)范、標(biāo)注工作量、音變規(guī)律研究等問(wèn)題提出精要見(jiàn)解與建議。侯精一研究員
作總結(jié),認(rèn)為本項(xiàng)目有“很高的熱情,很硬的要求,很大的工作量”,建議“收縮任務(wù)”并提出具體指導(dǎo)意見(jiàn)。這些意見(jiàn)和建議中肯、切實(shí),使項(xiàng)目建設(shè)更具操作性。
組織了重要學(xué)術(shù)會(huì)議的專(zhuān)場(chǎng)討論。
“全國(guó)漢語(yǔ)方言學(xué)會(huì)第十七屆學(xué)術(shù)年會(huì)暨漢語(yǔ)方言國(guó)際學(xué)術(shù)討論會(huì)”2013年12月12-15日在廣州召開(kāi),這是國(guó)內(nèi)最高層次的方言學(xué)研討會(huì)。遵照會(huì)議籌委會(huì)組織重大項(xiàng)目專(zhuān)場(chǎng)討論的動(dòng)議,項(xiàng)目組組織了一組論文參會(huì)。項(xiàng)目負(fù)責(zé)人作大會(huì)主題發(fā)言“第三代語(yǔ)料庫(kù)和方言語(yǔ)篇庫(kù)設(shè)計(jì)——‘漢語(yǔ)方言自然口語(yǔ)有聲基礎(chǔ)語(yǔ)料庫(kù)建設(shè)’的設(shè)計(jì)”。與之呼應(yīng)的有分會(huì)場(chǎng)的學(xué)術(shù)報(bào)告“漢語(yǔ)方言長(zhǎng)篇采錄語(yǔ)料的設(shè)計(jì)與思考”(王洪鐘)、“蘭銀官話自然口語(yǔ)庫(kù)中語(yǔ)法基礎(chǔ)語(yǔ)料的設(shè)計(jì)與思考”(莫超)、“漢語(yǔ)方言自然口語(yǔ)庫(kù)語(yǔ)法調(diào)查設(shè)計(jì)”(侯超)、“漢語(yǔ)方言自然口語(yǔ)庫(kù)語(yǔ)音采錄語(yǔ)料的思考”(肖萍)、“吳語(yǔ)敘述型語(yǔ)篇韻律研究方案”(宋益丹)。這些發(fā)言引起了會(huì)場(chǎng)內(nèi)外的熱烈討論。項(xiàng)目組成員廣泛征求意見(jiàn),同時(shí)利用會(huì)議間隙集體討論了研究?jī)?nèi)容、研究策略以及語(yǔ)料采錄大綱的修訂與分工。會(huì)后,項(xiàng)目負(fù)責(zé)人被推舉為全國(guó)方言學(xué)會(huì)學(xué)術(shù)委員。
再次組織重要學(xué)術(shù)會(huì)議的專(zhuān)場(chǎng)討論。
第十一屆中國(guó)語(yǔ)音學(xué)學(xué)術(shù)會(huì)議(PCC2014)將于2014年8月在新疆大學(xué)舉行。中國(guó)語(yǔ)言學(xué)會(huì)語(yǔ)音學(xué)分會(huì)會(huì)長(zhǎng)鮑懷翹研究員授意項(xiàng)目負(fù)責(zé)人組織實(shí)驗(yàn)方言學(xué)專(zhuān)場(chǎng)。項(xiàng)目組將以一組方言聲調(diào)實(shí)驗(yàn)與數(shù)據(jù)處理策略的論文參會(huì)。劉俐李參會(huì)論文“方言聲調(diào)大樣本單體實(shí)驗(yàn)的啟示”、侯超“基于語(yǔ)音實(shí)驗(yàn)的調(diào)系規(guī)整方法再議”、宋益丹“漢語(yǔ)方言調(diào)長(zhǎng)和調(diào)型的關(guān)系研究”。
五、學(xué)術(shù)交流
學(xué)術(shù)會(huì)議
2012年11月至2014年6月,項(xiàng)目組成員出席國(guó)際、國(guó)內(nèi)重要學(xué)術(shù)會(huì)議32人次。主要會(huì)議有“全國(guó)漢語(yǔ)方言學(xué)會(huì)第十七屆學(xué)術(shù)年會(huì)暨漢語(yǔ)方言國(guó)際學(xué)術(shù)討論會(huì)”(2013年12月,廣州),“第七屆官話方言國(guó)際學(xué)術(shù)研討會(huì)”(2013年11月,合肥),“首屆語(yǔ)言類(lèi)型學(xué)國(guó)際學(xué)術(shù)研討會(huì)暨第二屆方言語(yǔ)音與語(yǔ)法論壇”(2013年11月,常熟),“方言學(xué)國(guó)際高端論壇暨慶!斗窖浴冯s志創(chuàng)刊35周年學(xué)術(shù)討論會(huì)”(2013年9月,濟(jì)南),“阿爾泰語(yǔ)與西北漢語(yǔ)方言接觸學(xué)術(shù)研討會(huì)”(2013年8月,西寧),“第七屆國(guó)際吳方言學(xué)術(shù)研討會(huì)”(2012年11月,
金華),“當(dāng)代語(yǔ)言科學(xué)創(chuàng)新與發(fā)展國(guó)際學(xué)術(shù)研討會(huì)”(2012年10月,徐州),“第二屆中國(guó)地理語(yǔ)言學(xué)國(guó)際學(xué)術(shù)研討會(huì)”(2012年10月,南京)。
學(xué)術(shù)講座
2012年10月至2014年6月,項(xiàng)目組成員應(yīng)邀外出講座5人次。
2012年10月,莫超教授與張建軍副教授應(yīng)邀在寶雞文理學(xué)院做“西北方言文言文獻(xiàn)中的“語(yǔ)助辭”專(zhuān)題講座。
2013年4月,張洋教授應(yīng)邀在新疆維吾爾自治區(qū)黨校做“新疆語(yǔ)言與文化”學(xué)術(shù)講座。
2013年5月,張洋教授應(yīng)邀在新疆大學(xué)方言研究中心做“新疆漢語(yǔ)方言的語(yǔ)音”專(zhuān)題講座。
2013年9月,顧文濤教授應(yīng)邀在日本東京大學(xué)做“Prosodic analysis and perception of Mandarin attitudinal speech”講座。
2014年3月,顧文濤教授應(yīng)邀在日本東京大學(xué)做“Quantitative analysis of prosodic errors in nonnative speech”講座。
六、成果宣傳推介情況
項(xiàng)目組雖未舉行專(zhuān)門(mén)的成果發(fā)布會(huì),但已多次在國(guó)際和全國(guó)性學(xué)術(shù)會(huì)議上推介階段成果,尤其“全國(guó)漢語(yǔ)方言學(xué)會(huì)第十七屆學(xué)術(shù)年會(huì)暨漢語(yǔ)方言國(guó)際學(xué)術(shù)討論會(huì)”,與會(huì)學(xué)者300余人,項(xiàng)目組發(fā)布了一組有關(guān)方言口語(yǔ)語(yǔ)料庫(kù)設(shè)計(jì)的系列論文,引起關(guān)注,影響較大。項(xiàng)目負(fù)責(zé)人的主題報(bào)告“第三代語(yǔ)料庫(kù)和方言語(yǔ)篇庫(kù)設(shè)計(jì)——‘漢語(yǔ)方言自然口語(yǔ)有聲基礎(chǔ)語(yǔ)料庫(kù)建設(shè)’的設(shè)計(jì)”反響熱烈,當(dāng)場(chǎng)即有學(xué)者表示贊同或贊譽(yù)。項(xiàng)目組成員還在“第七屆官話方言國(guó)際學(xué)術(shù)研討會(huì)”、“方言學(xué)國(guó)際高端論壇暨慶祝《方言》雜志創(chuàng)刊35周年學(xué)術(shù)討論會(huì)”等重要學(xué)術(shù)會(huì)議上推介本項(xiàng)目成果及方言研究數(shù)字化理念。
項(xiàng)目負(fù)責(zé)人在《中國(guó)社會(huì)科學(xué)院報(bào)》(2013年2月18日第A07版)撰文介紹方言研究數(shù)字化成果“漢語(yǔ)方言實(shí)驗(yàn)工作系統(tǒng)”,編者將文章標(biāo)題改為“‘方言實(shí)驗(yàn)工作系統(tǒng)’使方言研究更科學(xué)”,并在文前加有編者按。本項(xiàng)目倡導(dǎo)并實(shí)踐的方言研究數(shù)字化已為國(guó)家社科規(guī)劃辦采納,列為2014年度國(guó)家社會(huì)科學(xué)基金項(xiàng)目語(yǔ)言學(xué)課題指南的第12號(hào)“方言研究數(shù)字化基礎(chǔ)建設(shè)研究”(項(xiàng)目負(fù)責(zé)人劉俐李2011年上報(bào)“國(guó)家哲學(xué)社會(huì)科學(xué)重大基礎(chǔ)理論研究選題建議”的題目是“方言研究數(shù)字化基礎(chǔ)建設(shè)”)。
二、研究成果情況
一、代表性成果
1.《漢語(yǔ)方言自然口語(yǔ)有聲基礎(chǔ)語(yǔ)庫(kù)語(yǔ)料采錄大綱》(8.76萬(wàn)字)
這是本項(xiàng)目語(yǔ)料采錄大綱,也可供方言口語(yǔ)研究用。由三部分構(gòu)成。
第一部分“錄制語(yǔ)料概覽”,用6張表列出采錄底本的結(jié)構(gòu)、語(yǔ)料種類(lèi)、數(shù)量,各類(lèi)語(yǔ)料錄制時(shí)長(zhǎng)、錄制方式,不同角色發(fā)音人的具體任務(wù)。
第二部分“基礎(chǔ)語(yǔ)料錄制底本”,分語(yǔ)音、詞匯、語(yǔ)法。語(yǔ)音部分有單字4012個(gè),雙音節(jié)韻律詞542個(gè)。詞匯分核心詞(200)、基礎(chǔ)詞(5260,29類(lèi))、特征詞(100-300)。語(yǔ)法有100例句。
第三部分“語(yǔ)篇語(yǔ)料錄制底本”,分文本語(yǔ)篇、即席語(yǔ)篇、自錄語(yǔ)篇三種。文本語(yǔ)篇有六類(lèi),分全部方言通用與各方言特用兩種,提供錄制底本。即席語(yǔ)篇有四類(lèi),各類(lèi)下含三至四種,提供話題及話題引導(dǎo)詞。自錄語(yǔ)篇兩種,提供場(chǎng)景說(shuō)明及錄制要求。
創(chuàng)新之處主要是第三部分。此前的方言調(diào)查大綱多為字、詞、句,即本大綱的第二部分,未見(jiàn)語(yǔ)篇調(diào)查大綱。在已有研究成果中也有語(yǔ)篇,但數(shù)量少,尤其缺少自然口語(yǔ)語(yǔ)篇(即席語(yǔ)篇與自錄語(yǔ)篇)。本成果提供了成系統(tǒng)的口語(yǔ)語(yǔ)篇采錄底本,就我們目力所及,在漢語(yǔ)方言研究領(lǐng)域應(yīng)是第一次。方言口語(yǔ)語(yǔ)篇采錄底本有助于推動(dòng)方言口語(yǔ)甚至共同語(yǔ)口語(yǔ)的調(diào)查與研究。此外,詞表分核心詞、基礎(chǔ)詞、特征詞的三分結(jié)構(gòu),基礎(chǔ)詞的多重篩選,字表附古音信息,字表添加韻律詞等,具有一定新意,會(huì)更方便漢語(yǔ)方言的調(diào)查與研究。
2.《漢語(yǔ)方言口語(yǔ)有聲庫(kù)語(yǔ)料采制工作手冊(cè)》(2.36萬(wàn)字)
這是規(guī)范項(xiàng)目組各項(xiàng)工作的指導(dǎo)文件,分“概述”和“工作規(guī)范”兩部分。
“概述”含研究目標(biāo)、方言選點(diǎn)、語(yǔ)料結(jié)構(gòu)、任務(wù)進(jìn)度、責(zé)任分工五項(xiàng)?墒姑课豁(xiàng)目組成員把握項(xiàng)目整體,定位各自職責(zé)。
“工作規(guī)范”有三項(xiàng):(1)資料規(guī)范;(2)采錄規(guī)范;(3)整理規(guī)范。
(1)資料規(guī)范:有補(bǔ)充采錄底本(文化語(yǔ)料及特征詞)規(guī)范和確定音系規(guī)范。提出具體要求(類(lèi)型和數(shù)目)、指明途徑、規(guī)范工作步驟。
(2)采錄規(guī)范:有采錄對(duì)象規(guī)范、采錄內(nèi)容規(guī)范、音頻采錄與處理規(guī)范、
視頻采錄與處理規(guī)范、拍照規(guī)范五項(xiàng)。指明采錄對(duì)象和采錄內(nèi)容,提出技術(shù)要求并予以指導(dǎo),如硬件型號(hào)、軟件版本、技術(shù)指標(biāo)、操作程序及注意事項(xiàng)等。
(3)語(yǔ)料整理規(guī)范:含音頻和視頻剪輯、轉(zhuǎn)寫(xiě)漢字、標(biāo)注國(guó)際音標(biāo)、字詞標(biāo)注和復(fù)核、例句標(biāo)注和復(fù)核、語(yǔ)篇標(biāo)注、數(shù)據(jù)模板和數(shù)據(jù)字典、入庫(kù)數(shù)據(jù)語(yǔ)料包等八項(xiàng)操作規(guī)范。同時(shí)寫(xiě)明各類(lèi)軟件的使用方法、操作步驟與具體要求。
工作手冊(cè)是規(guī)范本項(xiàng)目各種研究程序的文件,也是方言語(yǔ)料數(shù)字化研究方法、研究方式與技術(shù)手段的集成。方言研究的數(shù)字化是本世紀(jì)方言研究的趨勢(shì),是本項(xiàng)目建設(shè)的目標(biāo)之一。該工作手冊(cè)有助于推進(jìn)方言數(shù)字化研究方式與技術(shù)手段的推廣與普及。
3.《江陰方言新探》(18.6萬(wàn)字)
該書(shū)采用多學(xué)科交叉的多元方法研究江陰方言。首先構(gòu)建江陰方言有聲數(shù)據(jù)庫(kù)(附光盤(pán)),應(yīng)用數(shù)據(jù)庫(kù)語(yǔ)料實(shí)驗(yàn)研究江陰16鎮(zhèn)18方言點(diǎn)的聲調(diào)。根據(jù)實(shí)驗(yàn)結(jié)果,將江陰方言分為五片。應(yīng)用歷史語(yǔ)料與年齡差語(yǔ)料揭示江陰方言近20年的變化。描寫(xiě)并比較江陰5方言片以及新派的常用詞和特征詞。有同音字匯、記音語(yǔ)法例句、方言故事和曲藝音頻。抽樣調(diào)查江陰的語(yǔ)言生態(tài),多項(xiàng)綜合統(tǒng)計(jì)表明,近20年來(lái)江陰方言快速萎縮、普通話發(fā)展迅速,這與江陰人的語(yǔ)言態(tài)度密切相關(guān)。
著名方言學(xué)家、復(fù)旦大學(xué)游汝杰教授書(shū)評(píng)評(píng)價(jià):“同時(shí)具備四項(xiàng)新內(nèi)容的‘方言志’,《江陰方言新探》應(yīng)該是第一部”。廈門(mén)大學(xué)李如龍教授認(rèn)為“采取多學(xué)科交叉、多種方法綜合的研究便可使現(xiàn)代的方言學(xué)‘插翅’”。
該書(shū)是運(yùn)用多學(xué)科交叉的數(shù)字化方法研究單點(diǎn)方言的一個(gè)成功案例,其模式對(duì)推進(jìn)單點(diǎn)方言的數(shù)字化研究有參考意義。本項(xiàng)目單方言點(diǎn)的后期研究成果將以此書(shū)為參照。
二、成果清單
序號(hào) |
成果名稱(chēng) |
作者 |
成果形式 |
刊物、出版社名稱(chēng)及刊發(fā)、出版時(shí)間 |
字?jǐn)?shù) |
轉(zhuǎn)載、引用、獲獎(jiǎng)等況 |
1 |
漢語(yǔ)方言自然口語(yǔ)有聲基礎(chǔ)語(yǔ)庫(kù)語(yǔ)料采錄大綱 |
項(xiàng)目組 |
著作(稿) |
未出版 |
8.76萬(wàn) |
|
2 |
漢語(yǔ)方言口語(yǔ)有聲庫(kù)語(yǔ)料采制工作手冊(cè) |
項(xiàng)目組 |
報(bào)告類(lèi) |
未發(fā)表 |
2.36萬(wàn) |
|
3 |
江陰吳語(yǔ)新探 |
劉俐李 侯 超 |
著作 |
世界圖書(shū)出版公司北京公司,2013 |
18.6萬(wàn) |
有書(shū)評(píng) |
4 |
中古陽(yáng)聲韻韻尾在現(xiàn)代漢語(yǔ)方言中的讀音類(lèi)型 |
張燕芬 |
論文 |
《語(yǔ)言研究》2012年4期 |
1.4萬(wàn) |
|
5 |
江陰吳語(yǔ)近二十年的變化 |
劉俐李 |
論文 |
《語(yǔ)言研究》2013年1期 |
0.84萬(wàn) |
人大《語(yǔ)言文字學(xué)》2013年5期全文轉(zhuǎn) |
6 |
試析湖北通城方言的入聲韻尾 |
栗華益 |
論文 |
《語(yǔ)言研究》2013年3期 |
0.7萬(wàn) |
|
7 |
試析漢語(yǔ)方言入聲韻尾邊音化 |
栗華益 |
論文 |
《方言》2013年4期 |
1.57萬(wàn) |
|
8 |
浙江仙居吳語(yǔ)濁內(nèi)爆音的語(yǔ)音學(xué)考察 |
宋益丹 |
論文 |
《方言》2014年2期 |
0.6萬(wàn) |
|
9 |
東干語(yǔ)(陜西支)聲調(diào)共時(shí)差異實(shí)驗(yàn)研究 |
劉俐李 |
論文 |
《民族語(yǔ)文》2013年5期 |
1.18萬(wàn) |
|
10 |
哈密方言的“上”所起的格作用 |
熱西旦·馬力克、張洋 |
論文 |
《民族語(yǔ)文》2014年1期 |
0.8萬(wàn) |
|
11 |
“方言實(shí)驗(yàn)工作系統(tǒng)”使方言研究更科學(xué) |
劉俐李 |
論文 |
《中國(guó)社會(huì)科學(xué)報(bào)》2013年2月18日第A07版 |
0.25萬(wàn) |
|
12 |
海洋方言:漢語(yǔ)方言研究新視覺(jué) |
陳曉錦 黃高飛 |
論文 |
《中國(guó)社會(huì)科學(xué)報(bào)》2014年4月14日第七版頭條,并在第一版有提要介紹 |
|
|
13 |
基于統(tǒng)計(jì)學(xué)習(xí)模型的句法分析方法綜述 |
吳偉成 周俊生 曲維光 |
論文 |
《中文信息學(xué)報(bào)》,2013年,第27卷,第3期,9-19 |
0.5萬(wàn) |
|
14 |
A Practical Method for Chinese All-Word Sense Tagging |
Fu Jia, Qu Weiguang |
論文 |
ICIC Express Letters, Part B: Application, Volume 3, Number 6, p 1459-1466, 2012 |
0.5萬(wàn) |
EI檢索 |
15 |
詞義歸納綜述 |
孫玉霞 曲維光 狄 穎 周俊生 |
論文 |
計(jì)算機(jī)科學(xué),2014,第二期,23-32 |
0.5萬(wàn) |
|
16 |
江淮方言入聲時(shí)長(zhǎng)變異實(shí)驗(yàn)研究 |
劉俐李 |
論文 |
《中國(guó)語(yǔ)言學(xué)》第六輯北京大學(xué)出版社 2013 |
1.5萬(wàn) |
|
17 |
試析漢語(yǔ)方言入聲韻的元音尾化 |
栗華益 |
論文 |
《語(yǔ)文研究》2013年1期 |
2.16萬(wàn) |
|
18 |
實(shí)驗(yàn)方言學(xué)理念與方法芻議——以《江陰方言新探》為例 |
唐志強(qiáng) 劉俐李 |
論文 |
《語(yǔ)文研究》2013年4期 |
0.4萬(wàn) |
|
19 |
試析漢語(yǔ)方言入聲韻元音分尾現(xiàn)象 |
栗華益 |
論文 |
《語(yǔ)言科學(xué)》2013年3期 |
1.6萬(wàn) |
|
20 |
甘肅境內(nèi)的中原官話研究 |
莫 超 尹 雯 |
論文 |
《語(yǔ)言科學(xué)》2013年6期 |
1.80萬(wàn) |
|
21 |
績(jī)溪華陽(yáng)話兩字組連讀變調(diào)分析 |
栗華益 |
論文 |
《中國(guó)語(yǔ)學(xué)研究·開(kāi)篇》(日本)第31期(2012) |
0.94萬(wàn) |
|
22 |
江蘇高淳(淳溪鎮(zhèn))方言音系 |
侯 超 |
論文 |
《中國(guó)語(yǔ)學(xué)研究·開(kāi)篇》(日本)第32期(2013) |
0.94萬(wàn) |
|
23 |
哈密方言非音質(zhì)特征表達(dá)的意義 |
張 洋 |
論文 |
《語(yǔ)言與翻譯》2013年3期 |
0.5萬(wàn) |
|
24 |
哈密方言“走”字句 |
張 洋 田云華 |
論文 |
《語(yǔ)言與翻譯》2014年3期 |
0.6萬(wàn) |
|
25 |
哈密方言的“下” |
張 洋 |
論文 |
《新疆社科論壇》 2012年5期 |
0.55萬(wàn) |
|
26 |
試論詞匯研究在海外漢語(yǔ)方言研究中的重要性 |
陳曉錦 |
論文 |
《暨南學(xué)報(bào)》(哲社版) 2013年9期 |
|
|
27 |
漢語(yǔ)詞綴的功能與皖北方言的”子”尾 |
侯 超 |
論文 |
《南京師范大學(xué)文學(xué)院學(xué)報(bào)》2012年3期 |
0.9萬(wàn) |
|
28 |
普通話態(tài)度語(yǔ)音的感知實(shí)驗(yàn)研究 |
顧文濤 |
論文 |
《南京師范大學(xué)文學(xué)院學(xué)報(bào)》2013年9月 |
0.6萬(wàn) |
|
29 |
方言與網(wǎng)絡(luò)語(yǔ)言 |
侯 超 |
論文 |
《語(yǔ)文建設(shè)》2013年2期 |
0.25萬(wàn) |
|
30 |
宿遷方言古咸山攝舒聲字的今讀 |
馮青青 |
論文 |
《江蘇大學(xué)學(xué)報(bào)》 2013年2期 |
0.77萬(wàn) |
|
31 |
日照巨峰方言音系及其特點(diǎn) |
馮青青 |
論文 |
《山東理工大學(xué)學(xué)報(bào)》 2014年1期 |
1.06萬(wàn) |
|
32 |
《西游記》中“筑”字形義考辨 |
顧勁松 |
論文 |
《鹽城師范學(xué)院學(xué)報(bào)(人文社會(huì)科學(xué)版)》2012年6期 |
0.55萬(wàn) |
|
33 |
鹽城方言古全濁上及濁去字的今讀 |
馮青青 |
論文 |
《鹽城師范學(xué)院學(xué)報(bào)(人文社會(huì)科學(xué)版)》 2014年1期 |
0.95萬(wàn) |
|
34 |
現(xiàn)代漢語(yǔ)“夠+A”格式研究 |
侯 超 |
論文 |
《常熟理工學(xué)院學(xué)報(bào)(人文社會(huì)科學(xué)版)》2012第9期 |
0.7萬(wàn) |
|
35 |
蘇屬江淮官話n、l分混狀況考察 |
顧勁松 |
論文 |
《常熟理工學(xué)院學(xué)報(bào)(人文社會(huì)科學(xué)版)》2013年5期 |
0.80萬(wàn) |
|
36 |
現(xiàn)代漢語(yǔ)方言詞匯研究綜述 |
顧勁松 |
論文 |
《蘇州科技學(xué)院學(xué)報(bào)(社會(huì)科學(xué)版)》2014年3期 |
0.90萬(wàn) |
|
37 |
從民俗中發(fā)掘方言語(yǔ)詞的特殊讀音——梅縣客方言為例 |
侯小英 |
論文 |
《嘉應(yīng)學(xué)院學(xué)報(bào)》 2014年4期 |
0.74萬(wàn) |
|
38 |
Data acquisition and prosodic analysis for Mandarin attitudinal speech |
顧文濤 |
論文 |
East Flows the Great River: Festschrift in Honor of William S-Y Wang on his 80th Birthday,香港城市大學(xué)出版社,2013年8月 |
0.8萬(wàn) |
|
39 |
Rhythmic Patterns of Nonnative Mandarin Speech |
顧文濤 |
論文 |
日本音響學(xué)會(huì)2014年春季研究発表會(huì)論文集,2014年3月 |
0.3萬(wàn) |
|
40 |
Prosody of Mandarin affective speech by mentally retarded children |
顧文濤 |
論文 |
Proceedings of WASSS 2013年8月 |
0.4萬(wàn) |
|
41 |
東北、華北方言中后置原因標(biāo)記“的事兒” |
梁曉玲 |
論文 |
《語(yǔ)文教學(xué)通訊》 2013年9期 |
0.5萬(wàn) |
|
42 |
哈密方言的復(fù)數(shù)詞綴“跟前” |
張 洋 |
論文 |
《新疆職業(yè)大學(xué)學(xué)報(bào)》 2012年6期 |
0.55萬(wàn) |
|
43 |
哈密方言的處所疑問(wèn)代詞“哪達(dá)” |
張洋 田云華 |
論文 |
《新疆職業(yè)大學(xué)學(xué)報(bào)》 2014年3期 |
0.6萬(wàn) |
|
44 |
悉尼粵方言廣府話 |
陳曉錦 |
論文 |
《粵語(yǔ)研究》 2012年12月,澳門(mén) |
|
|
45 |
東南亞華人社區(qū)漢語(yǔ)方言創(chuàng)新詞分析 |
陳曉錦 |
論文 |
《南方語(yǔ)言學(xué)》第五輯,暨南大學(xué)出版社,2013年 |
|
|
46 |
東南亞華人社區(qū)兄弟漢語(yǔ)方言的互借詞 |
陳曉錦 |
論文 |
《粵語(yǔ)研究》2013年6月,澳門(mén) |
|
|
47 |
從語(yǔ)言接觸看粵語(yǔ)對(duì)廣州地區(qū)客家話的影響 |
陳曉錦 肖自輝 |
論文 |
《第十五屆粵方言研討會(huì)論文集》,澳門(mén)粵方言學(xué)會(huì),2012年12月。 |
|
|
48 |
廣州的客家方言 |
陳曉錦 鄭 蕾 |
論文 |
《第九屆客家方言學(xué)術(shù)研討會(huì)論文集》,中央民族大學(xué)出版社,2013年1月 |
|
|
49 |
馬來(lái)西亞沙巴客家話借詞淺析 |
陳曉錦 卓俊霖 |
論文 |
《第九屆客家方言學(xué)術(shù)研討會(huì)論文集》,中央民族大學(xué)出版社,2013年1月 |
|
|