• <samp id="sgkyk"><pre id="sgkyk"></pre></samp>
    
    

    舊版網(wǎng)站入口

    站內(nèi)搜索

    《格薩爾》說唱語音的自動識別與格薩爾學(xué)的創(chuàng)新中期檢查報(bào)告

    2017年12月11日10:20來源:全國哲學(xué)社會科學(xué)工作辦公室

    一、 研究進(jìn)展情況

    1、課題開題與子課題進(jìn)展情況

    研究計(jì)劃順利執(zhí)行,各子課題取得進(jìn)展。

    2016年4月1日,“《格薩爾》說唱語音的自動識別與格薩爾學(xué)的創(chuàng)新發(fā)展”項(xiàng)目啟動暨專家咨詢會在西藏大學(xué)召開。來自西藏本地和北京的7位專家在認(rèn)真聽取項(xiàng)目總體情況和研究方案優(yōu)化情況,以及各個(gè)子課題的匯報(bào)情況后,紛紛發(fā)表意見,提出建議,充分肯定并高度評價(jià)《格薩爾》項(xiàng)目,給予項(xiàng)目組成員以極大的幫助和鼓勵。各子課題分別消化吸收了專家咨詢會上各位專家的意見建議。項(xiàng)目首席專家召開了子課題負(fù)責(zé)人第一次例會,各子課題負(fù)責(zé)人分別匯報(bào)了修訂完善后的研究方案和研究計(jì)劃,并進(jìn)行了相關(guān)任務(wù)的對接。一年多來,各子課題均取得了基礎(chǔ)性的進(jìn)展:

    子課題一“基于文獻(xiàn)計(jì)量分析的《格薩爾》研究歷史、現(xiàn)狀和趨勢”。一是定制專門的文獻(xiàn)計(jì)量分析軟件工具,包括基于文獻(xiàn)計(jì)量學(xué)方法的論文形式和關(guān)鍵詞內(nèi)容分析工具研發(fā),以及基于詞向量的短文本分析技術(shù)的文獻(xiàn)內(nèi)容挖掘工具研發(fā),已經(jīng)運(yùn)用其他領(lǐng)域的數(shù)據(jù)集進(jìn)行了多次測試和優(yōu)化,很快即可在本項(xiàng)目應(yīng)用;二是篩選《格薩爾》研究的學(xué)術(shù)文獻(xiàn),尤其是藏文文獻(xiàn),已經(jīng)選出187篇藏文研究論文。

    子課題二“《格薩爾》說唱語音的聲學(xué)和韻律建模及音字轉(zhuǎn)換研究”。一是錄制了斯塔多吉說唱本4部,計(jì)200多個(gè)小時(shí);二是對多語言言語識別方法開展了相關(guān)研究,提出了基于多尺度特征的語音識別建模方法、基于參數(shù)共享神經(jīng)網(wǎng)絡(luò)的雙語語音識別建模方法;三是基于言語中的多層次線索,對融合發(fā)音姿態(tài)信息的深層神經(jīng)網(wǎng)絡(luò)語音識別建模方法進(jìn)行了探索;四是提出了基于深層循環(huán)條件隨機(jī)場的中文自動分詞方法并對藏語的分詞和注音進(jìn)行了探索,實(shí)現(xiàn)了藏文分詞以及藏語方言國際音標(biāo)轉(zhuǎn)換的系統(tǒng)。

    子課題三“《格薩爾》的多媒體數(shù)據(jù)庫及文本自動標(biāo)引和知識檢索系統(tǒng)”。一是建立了54049詞條的藏語短語詞條庫和133226詞條的藏語詞語庫,為藏文連續(xù)文本的切分提供了依據(jù),并對藏文虛詞的自動識別方法和技術(shù)進(jìn)行了探索;二是結(jié)合子課題一的“短文本分析技術(shù)”和子課題二的“基于深層循環(huán)條件隨機(jī)場的中文自動分詞方法”,設(shè)計(jì)并初步論證了中文文獻(xiàn)內(nèi)容的自動標(biāo)引和檢索的技術(shù)路線。

    子課題四“基于《格薩爾》知識圖譜的格薩爾學(xué)創(chuàng)新發(fā)展”。一是在分析格薩爾學(xué)的成長特征和成長空間的基礎(chǔ)上,從情報(bào)學(xué)的多個(gè)視角探討了格薩爾學(xué)的多方面成長機(jī)制,為前面三個(gè)子課題的研究目標(biāo)實(shí)現(xiàn)提供進(jìn)一步的參考;二是在西藏大學(xué)組建了“格薩爾史詩研究科研創(chuàng)新團(tuán)隊(duì)”。

    2、調(diào)查研究及學(xué)術(shù)交流情況

    調(diào)查研究工作主要是對非在線的藏文有關(guān)文獻(xiàn)的調(diào)查篩選、《格薩爾學(xué)集成》(5卷)等早期文獻(xiàn)的復(fù)制、在線中英文有關(guān)文獻(xiàn)的抓取等。學(xué)術(shù)交流還僅限于項(xiàng)目組內(nèi)部,等基礎(chǔ)性研究更加充分并在說唱語音自動識別有重大突破后再進(jìn)行國內(nèi)外學(xué)術(shù)交流活動。

    3、成果推介與宣傳

    成果宣傳推薦方面,報(bào)送了兩期《工作簡報(bào)》,因尚處基礎(chǔ)研究階段,還沒有舉行成果發(fā)布會、沒有向國家社科基金專刊投稿。

    二、 研究成果情況

    代表性成果:實(shí)現(xiàn)了藏文分詞以及藏文文本到藏語方言國際音標(biāo)轉(zhuǎn)換的系統(tǒng)。

    要實(shí)現(xiàn)藏語方言語音的識別和分析,需要以國際音標(biāo)IPA的形式分析藏文文本到藏語方言的發(fā)音,構(gòu)建不同藏文方言由文本到發(fā)音的轉(zhuǎn)換對照表。該系統(tǒng)由藏文文本分詞系統(tǒng)和藏語方言國際音標(biāo)轉(zhuǎn)換系統(tǒng)兩個(gè)子系統(tǒng)構(gòu)成,后者又包括藏文詞匯國際音標(biāo)轉(zhuǎn)換系統(tǒng)和藏文單音節(jié)方言國際音標(biāo)轉(zhuǎn)換系統(tǒng)兩個(gè)部分。

    藏語在書面語上是統(tǒng)一的,即藏語方言在書寫形式上是一樣的。藏語主要劃分為衛(wèi)藏、康以及安多三大方言。不同的藏語方言在語音上體現(xiàn)在多個(gè)方面,主要特性包括:方言是否有聲調(diào)、是否有清濁聲母的對立以及輔音韻尾是否多寡。首先,基于《格西曲扎藏文辭典》中的藏文詞匯,經(jīng)人工整理、挑選和校對,最終獲得七萬五千條藏文詞匯的電子詞典。分詞詞典的每條詞匯都包含藏文、對應(yīng)的中文、部分詞匯帶有詞性以及對應(yīng)的拉丁形式。基于格助詞添接法,將詞典中的名詞等轉(zhuǎn)換為對應(yīng)格的形式,然后將名詞的格形式作為詞典詞條進(jìn)行詞典的擴(kuò)充,最后在分詞時(shí)使用擴(kuò)充后的詞典,實(shí)現(xiàn)對緊縮詞的識別。其次,基于對藏文三大方言六大話系的分析,歸納出了拉薩、日喀則、德格、巴塘、澤庫和拉卜楞等六個(gè)話系的藏文文本到國際音標(biāo)的聲母、韻母以及聲調(diào)的轉(zhuǎn)換對照表。

    該系統(tǒng)的實(shí)現(xiàn),將有力地推進(jìn)針對斯塔多吉說唱語音的自動識別和音字轉(zhuǎn)換的研究工作。

    課題組供稿

    (責(zé)編:王瑤)
    熟女精品视频一区二区三区| 久久99九九99九九精品| 国产精品国产三级国快看| 2020亚洲男人天堂精品| 精品人妻中文av一区二区三区 | 午夜精品不卡电影在线观看| 精品久久久久久国产潘金莲| 99亚洲精品高清一二区| 久热这里只精品99国产6_99| 国产亚洲综合成人91精品| 亚洲精品无码永久中文字幕| 日韩精品无码视频一区二区蜜桃| 国产精品免费αv视频| 国产成人精品无人区一区| 国产99视频精品免费视频76| 精品人妻一区二区三区四区在线| 国产精品情侣自拍| 四虎AV永久在线精品免费观看| 国产精品免费_区二区三区观看 | 国产精品国产国产aⅴ| 国产精品成人国产乱| 99亚洲乱人伦aⅴ精品| 日韩在线视精品在亚洲| 国产精品亚洲精品日韩动图| 精品一区二区三区3d动漫| 青青热久久国产久精品| 国产精品一区二区久久精品无码| 国产精品免费在线播放| 国产亚州精品女人久久久久久| 日日噜噜噜噜夜夜爽亚洲精品| 久久线看观看精品香蕉国产| 午夜精品久久久久久毛片| 7m精品福利视频导航| 97精品人妻系列无码人妻 | 久久亚洲国产午夜精品理论片| 久久这里只有精品66| 538精品在线观看| 四虎国产精品永久在线无码| 国产精品模特hd在线| 国产精品99久久久久久www| 真实国产乱子伦精品视频|