• <samp id="sgkyk"><pre id="sgkyk"></pre></samp>
    
    

    舊版網(wǎng)站入口

    站內(nèi)搜索

    祁瑞華:跨學(xué)科研究 典籍英譯海外評論挖掘的有效路徑

    祁瑞華2020年05月13日14:08來源:中國社會科學(xué)報(bào)國家社科基金專刊

    作者系國家社科基金項(xiàng)目“典籍英譯國外讀者網(wǎng)上評論觀點(diǎn)挖掘研究”負(fù)責(zé)人、大連外國語大學(xué)教授

    典籍英譯是中國文化“走出去”的重要途徑,讀者評論是譯本被接受的最終標(biāo)準(zhǔn)。當(dāng)前典籍英譯讀者觀點(diǎn)挖掘的研究趨勢為:在讀者接受理論指導(dǎo)下,引入自然語言處理技術(shù)和文本挖掘技術(shù),擴(kuò)大讀者觀點(diǎn)研究的視野,通過互聯(lián)網(wǎng)環(huán)境獲取大規(guī)模評論語料,對評論觀點(diǎn)進(jìn)行自動(dòng)挖掘和定量分析,梳理讀者評論關(guān)注的重點(diǎn)主題,以便系統(tǒng)深入發(fā)現(xiàn)有價(jià)值的觀點(diǎn)信息,為掌握讀者評論提供準(zhǔn)確可靠的數(shù)據(jù)分析。而綜合運(yùn)用自然語言處理技術(shù)、機(jī)器學(xué)習(xí)方法和語義分析的跨學(xué)科研究,是典籍英譯觀點(diǎn)挖掘的有效途徑,具體實(shí)施路徑如下。

    第一,構(gòu)建典籍英譯評論語料庫,擴(kuò)大讀者觀點(diǎn)研究視野。以美國和英國讀者的評論文本為主要研究對象,通過Amazon海外網(wǎng)站API接口收集評論語料,目前尚無典籍英譯圖書評論的標(biāo)準(zhǔn)實(shí)驗(yàn)語料,運(yùn)用自然語言處理技術(shù)進(jìn)行去停用詞和噪聲數(shù)據(jù)、詞性標(biāo)注等預(yù)處理,在上下文環(huán)境中進(jìn)行句子的句法分析、指代消解和省略恢復(fù),建立典籍英譯評論語料庫。

    第二,抽取典籍英譯評論主題詞表和修飾語,梳理讀者評論的重點(diǎn)。針對網(wǎng)絡(luò)評論文本篇幅短小、特征稀疏等特點(diǎn),通過依存句法分析和語義分析等技術(shù)提取主題詞和觀點(diǎn)詞的搭配關(guān)系,探究主題詞和修飾語的固定搭配組合模式,分析評論文本中隱含的評論主題,識別評論語料的文本模式,自動(dòng)抽取評論中的顯性主題詞,如譯本的文體、結(jié)構(gòu)、語言風(fēng)格等,探究評論語料中未直接描述但可以通過語義推理得出的隱性主題詞。

    語義分析和領(lǐng)域知識表示是提高網(wǎng)絡(luò)評論觀點(diǎn)挖掘精準(zhǔn)程度的關(guān)鍵。語義分析的基礎(chǔ)是詞匯表示,在情感詞匯極性分類任務(wù)中采用詞向量表示、前饋神經(jīng)網(wǎng)絡(luò)和卷積神經(jīng)網(wǎng)絡(luò)等深度學(xué)習(xí)算法,有效提高了情感詞匯極性分析、語義分析等任務(wù)的準(zhǔn)確率。

    引入領(lǐng)域知識庫分析上下文語境能夠理解讀者真正要表達(dá)的情感,完善領(lǐng)域知識庫的基本任務(wù)是知識圖譜補(bǔ)全,現(xiàn)有知識圖譜補(bǔ)全算法耗時(shí)長、準(zhǔn)確率有限,跨學(xué)科深度學(xué)習(xí)算法是解決這一問題的有效研究途徑。

    第三,判別觀點(diǎn)情感極性,建立典籍英譯評論觀點(diǎn)摘要。評論情感極性判別是探究潛在觀點(diǎn)態(tài)度的關(guān)鍵步驟。從機(jī)器學(xué)習(xí)的角度看,情感極性識別可以看作多類別、單標(biāo)簽文本分類任務(wù)。機(jī)器學(xué)習(xí)分類算法結(jié)合情感詞典,能夠有效標(biāo)注觀點(diǎn)修飾語的情感極性,為定量研究典籍英譯讀者的正負(fù)面評論觀點(diǎn)提供客觀數(shù)據(jù);結(jié)合聚類算法可以發(fā)現(xiàn)評論主題間的內(nèi)在聯(lián)系和客觀規(guī)律;通過在語法層面進(jìn)行句法分析和模式挖掘分析表達(dá)讀者觀點(diǎn)的修飾語,能夠?qū)υu論觀點(diǎn)主題摘要及情感極性進(jìn)行精確分析;基于機(jī)器學(xué)習(xí)和情感詞典形成觀點(diǎn)主題摘要,探究蘊(yùn)含網(wǎng)絡(luò)評論中潛在的觀點(diǎn)態(tài)度,能夠幫助譯者和出版社基于可信數(shù)據(jù)準(zhǔn)確掌握讀者對譯本的正負(fù)面評論。

    第四,深度挖掘評論語義主題,獲取隱性讀者觀點(diǎn)。典籍英譯評論觀點(diǎn)挖掘既要從譯本風(fēng)格、用詞遣句等微觀層面考察,又要從全局把握觀點(diǎn)主題的內(nèi)在聯(lián)系和重要性排序。網(wǎng)絡(luò)評論噪聲大、表達(dá)方式隨意、語料規(guī)模大、觀點(diǎn)稀疏分散。為梳理讀者關(guān)注的重點(diǎn),需要構(gòu)建深度語義挖掘的觀點(diǎn)主題模型,在語義層面揭示評論主題,將高維評論文本映射到低維主題空間,使其具有更好的可解釋性,從多維度分析挖掘隱含的有價(jià)值主題,結(jié)合領(lǐng)域知識,對抽取出的主題詞進(jìn)行分類,繪制主題詞共詞聚類圖譜,通過可視化的相似度映射技術(shù)和加權(quán)的模塊參數(shù)化聚類算法呈現(xiàn)海外讀者共同高度關(guān)注的主題類簇,結(jié)合知識網(wǎng)絡(luò)節(jié)點(diǎn)中心度呈現(xiàn)各個(gè)類簇中的關(guān)鍵主題詞,可以突破原有圖書評論主題抽取囿于主觀分析和小樣本數(shù)據(jù)的局限,從冗雜的評論信息中抽取句子覆蓋面更廣、主題詞匯多樣性更豐富的隱性知識。

    第五,文本可視化分析,系統(tǒng)分析讀者評論觀點(diǎn)。整合觀點(diǎn)摘要中的顯性觀點(diǎn)和主題模型中的隱性觀點(diǎn),根據(jù)語義上的等同、等級和相關(guān)關(guān)系,對主題詞進(jìn)行合并、上下位或相關(guān)關(guān)系的描述和表示;將主題詞按照重要性排序;匯總讀者對哪些譯者、譯本的哪些主題詞進(jìn)行對比;基于主題聚類視角對目前廣為接受的中國文化典籍譯本讀者評價(jià)進(jìn)行對比研究,挖掘典籍英譯作品暢銷的深層次原因;分析主題詞和修飾語情感極性的分布情況,了解國外讀者對特定譯者或譯本所持有的具體態(tài)度,為譯者和出版社進(jìn)一步了解讀者需求提供科學(xué)可靠的依據(jù)。可進(jìn)一步采用統(tǒng)計(jì)上浮原理以主題詞云方式顯示典籍英譯評論中頻繁使用的主題詞,并將匯總后的主題詞按照重要性排序。分析觀點(diǎn)主題之間的語義關(guān)系,對網(wǎng)絡(luò)評論中的顯式對比關(guān)系進(jìn)行語義描述,計(jì)算話題簇之間的相似度,基于深層次的語言分析對評估觀點(diǎn)進(jìn)行語義聚類,系統(tǒng)分析讀者評論觀點(diǎn)。

    第六,適應(yīng)多語言跨領(lǐng)域環(huán)境,迎接國際化挑戰(zhàn)。互聯(lián)網(wǎng)的國際化特質(zhì)決定了在多語言、跨領(lǐng)域上下文環(huán)境下研究典籍英譯評論尤為重要,句法分析、情感極性判別等基本分析方法與語言環(huán)境問題領(lǐng)域高度相關(guān),不同領(lǐng)域數(shù)據(jù)的情感特征并不完全相同,在某一領(lǐng)域數(shù)據(jù)中訓(xùn)練的情感預(yù)測模型,通常不能直接用于其他領(lǐng)域。隨著用戶評論數(shù)量和各種領(lǐng)域數(shù)量的持續(xù)增加,對所有領(lǐng)域單獨(dú)訓(xùn)練模型需要消耗大量的時(shí)間和資源。

    跨領(lǐng)域情感分類通過相關(guān)源領(lǐng)域的知識改進(jìn)目標(biāo)領(lǐng)域,具體實(shí)現(xiàn)通過相近領(lǐng)域遷移學(xué)習(xí)或者領(lǐng)域適配模型,例如用圖書評論領(lǐng)域已標(biāo)注評論得到的情感分類器,遷移或者適配到數(shù)字視頻光盤領(lǐng)域,節(jié)省該領(lǐng)域評論的標(biāo)注時(shí)間和資源。評論情感在不同領(lǐng)域通常存在特征漂移問題,在書籍領(lǐng)域常用“可讀性強(qiáng)”“有思想”等表達(dá)積極情感,用“平淡”“無情節(jié)”等表示消極情感;而在數(shù)字視頻光盤領(lǐng)域,通常用“清晰度高”“光滑”等表示積極情感,用“模糊”“有劃痕”等表示消極情感。由于領(lǐng)域之間的差異,在源領(lǐng)域中訓(xùn)練的情感分類模型,在直接應(yīng)用于目標(biāo)領(lǐng)域時(shí)往往表現(xiàn)不佳。采用基于深度學(xué)習(xí)的方法,可以為跨領(lǐng)域環(huán)境下的情感特征漂移問題提供解決方案,需要解決的難點(diǎn)是如何處理語義豐富的評論短文本。

    跨語言情感分析是利用源語言文本對目標(biāo)語言文本進(jìn)行情感傾向分析,具體實(shí)現(xiàn)可通過基于資源遷移和基于聯(lián)合學(xué)習(xí)的方法。資源遷移方法由于語言語料標(biāo)注體系各異而難以實(shí)施,基于聯(lián)合學(xué)習(xí)方法主要依賴機(jī)器翻譯,受翻譯結(jié)果質(zhì)量影響較大。近年,深度學(xué)習(xí)成為跨語言情感分析研究的熱點(diǎn),目前主要圍繞粗粒度層面,跨語言細(xì)粒度情感分析需要進(jìn)一步研究。

    (責(zé)編:孫爽、程宏毅)
    亚洲精品成人片在线观看精品字幕| 精品国产污污免费网站aⅴ| 国产精品卡一卡二卡三| 久久久久国产精品| 国产精品国产三级国产av中文| 久久99九九99九九精品| 无码精品蜜桃一区二区三区WW | 久久免费精品一区二区| 蜜臀亚洲AV无码精品国产午夜.| 久久影院综合精品| 久久99精品久久久久久齐齐| 国产精品成人免费视频网站京东| 午夜精品射精入后重之免费观看 | 国产精品一品二区三区的使用体验| 久久精品国产99国产精2020丨| 国产一区二区精品久久岳√| 国产精品夜色一区二区三区| 老司机99精品99| 国产精品香蕉在线观看| 国产精品亚洲а∨天堂2021| 精品人妻无码区二区三区| 久久国产精品2020盗摄| 中文字幕无码精品亚洲资源网| 国产精品久久久久久久网站| 日韩精品人妻一区二区三区四区| 久久66热人妻偷产精品9| 日韩精品久久久久久| 久久青青草原精品国产软件| 夜夜高潮夜夜爽国产伦精品| 国产精品亚洲lv粉色| 精品午夜国产福利观看| 91久久精品午夜一区二区| 久久久91精品国产一区二区三区 | 久久精品国产99国产精品| 国产乱码一二三区精品| 在线观看国产精品麻豆| 国产精品videossexohd| 亚洲国产成人综合精品| 国产精品中文久久久久久久| 国产精品久久久久久搜索| 91精品国产91热久久久久福利|