英文語音辨識系統增進辨識率之策略研究__臺灣博碩士論文知識 ...

文章推薦指數: 80 %
投票人數:10人

詳目顯示 ; 洪明昌 · Ming-Chang Hung · 英文語音辨識系統增進辨識率之策略研究 · A Design of Recognition Rate Improving Strategy For English Speech Recognition System. 資料載入處理中... 跳到主要內容 臺灣博碩士論文加值系統 ::: 網站導覽| 首頁| 關於本站| 聯絡我們| 國圖首頁| 常見問題| 操作說明 English |FB專頁 |Mobile 免費會員 登入| 註冊 功能切換導覽列 (159.65.137.222)您好!臺灣時間:2022/07/1908:37 字體大小:       ::: 詳目顯示 recordfocus 第1筆/ 共1筆  /1頁 論文基本資料 摘要 外文摘要 目次 參考文獻 電子全文 紙本論文 QRCode 本論文永久網址: 複製永久網址Twitter研究生:洪明昌研究生(外文):Ming-ChangHung論文名稱:英文語音辨識系統增進辨識率之策略研究論文名稱(外文):ADesignofRecognitionRateImprovingStrategyForEnglishSpeechRecognitionSystem指導教授:陳志堅指導教授(外文):Chih-ChienChen學位類別:碩士校院名稱:國立中山大學系所名稱:電機工程學系研究所學門:工程學門學類:電資工程學類論文種類:學術論文論文出版年:2011畢業學年度:99語文別:中文論文頁數:73中文關鍵詞:隱藏式馬可夫模型、線性預測倒頻譜係數、英文語音辨識系統、音位結構學、梅爾頻率倒頻譜係數外文關鍵詞:Mel-frequencycepstralcoefficients、Phonotactics、HiddenMarkovmodel、Linearpredictivecepstralcoefficients、Englishspeechrecognitionsystem相關次數: 被引用:1點閱:224評分:下載:11書目收藏:0 1588年大英帝國的海上霸權確立之後,英國的殖民活動將英文拓展到北美、印度、非洲以及澳大利亞等地。

1918年第一次世界大戰結束後,美國成爲世界第一大經濟強國,同時世界金融中心也由倫敦轉移到紐約。

1945年第二次世界大戰結束,美國在國際政治、經濟以及科技方面的地位更加崇高。

1945年10月24日聯合國成立,訂定英文與中文、法文、西班牙文、阿拉伯文以及俄文同為聯合國的六大正式工作語言。

這些歷史事件促成了一連串語言使用地域之擴展,使英文成為國際上使用最為廣泛的語言。

除了政治、經濟以及科技方面的優勢之外,英國擁有世界上規模最大的綜合博物館--大英博物館。

這座在1753年成立於倫敦市區的博物館,收藏來自世界各地超過1,300多萬件的考古文物,文化資源相當豐富。

本研究之目的在於建立一套英文語音辨識系統,提升吾人學習英文的成效,進而擴大視野增長見聞。

本論文探討英文語音辨識系統增進辨識率之策略。

以英文常用的989個單音節作為主要的訓練與辨識之基礎。

將每個單音節類別以一聲錄製一輪,再以四聲錄製下一輪。

兩種不同聲調交替錄音,共錄製十四輪的聲紋特性作為訓練語料。

並使用音高週期判斷語音尾部端點,以強化端點標示的準確性。

系統採用梅爾頻率倒頻譜係數及線性預測倒頻譜係數作為特徵參數,運用隱藏式馬可夫模型,作為單音辨識模型,且調整模型狀態數目到10,再利用音位結構學做比對,以增進辨識率。

本系統在時脈為2.4GHz的IntelCorei5CPUM450之筆記型電腦與Fedora14之作業系統環境下,針對6,812個英文語詞做辨識,可達到92.94%之正確辨識率,而平均所需辨識時間約在1.5秒以內。

Britainestablishedthestatusofmaritimehegemonyin1588.TheEnglishlanguagealongwiththeBritishcolonizedactivitieswasspreadtoNorthAmerica,India,AfricaandAustralia.AftertheendofWorldWarIin1918,theU.S.becamethemostpowerfulnationintheworldeconomy.Andatthesametime,theworldfinancialcenterwasshiftedtoNewYorkfromLondon.In1945,theWorldWarIIended,theU.S.furtherplayedindispensableroleineachaspectofinternationalpolitics,economyandtechnologies.TheUnitedNation,foundedonOctober24,1945,adoptedEnglish,Chinese,French,Spanish,ArabicaswellasRussianasthesixworkinglanguages.ThesehistoricaleventsfacilitatedasuccessionoflanguageexpansionandcausedEnglishtobethemostwidelyusedinternationallanguage.Besidethepolitical,economicandtechnologicalsuperiority,Britainownsthelargestcomprehensivemuseumintheglobe,theBritishMuseum.ThisMuseumwaslocatedinLondon,builtin1753,andmorethan13millionculturalrelicsofarchaeologyfromaroundtheworldwerecollected.Herculturalresourcesareremarkablyrich.ItisourobjectivetobuildalanguagesystemthatcanhelpustolearnEnglishmoreeffectivelyandtowidenourvisionoflivingatthesametime.ThisthesisinvestigatestherecognitionrateimprovementstrategiesforanEnglishspeechrecognitionsystem.Itutilizesthespeechfeaturesofthe989commonEnglishmono-syllablesasthemajortrainingandrecognitionmethodology.Atrainingdatabaseisestablishedbyreadingeachmono-syllable14rounds.Eachoneofthe989mono-syllablesisconsecutivelyreadwithtwodifferenttonesatalternaterounds.Theoddpronouncedroundshavehighpitchoftone1,whiletheevenroundshavefallingpitchoftone4.Thepitchperiodframemethodisappliedforenhancingtheaccuracyofendpointdetection.Mel-frequencycepstralcoefficients,linearpredictivecepstralcoefficients,andhiddenMarkovmodelareusedasthetwofeaturemodelsandtherecognitionmodelrespectively.ThenumberofHMMstatesisadjustedto10andthephonotacticalruleisusedfortherecognitionrateimprovement.UndertheCore™i5CPUM450notebookcomputerwith2.4GHzclockrateandFedora14operatingsystemenvironment,a92.94%correctphraserecognitionratecanbereachedfora6,812Englishphrasedatabase.Theaveragecomputationtimeforeachphraseiswithin1.5seconds. 論文審定書i致謝ii摘要iiiAbstractiv目錄v圖次viii表次ix第一章緒論11-1研究動機11-2研究目標11-3章節概要2第二章英文的歷史演變及其發音特性32-1語系的分類及使用概況32-2英語的演變歷史52-3英語的發音7第三章語音訊號處理相關技術介紹103-1音節端點標示103-1-1能量(Energy)103-1-2越零率(ZeroCrossingRate)113-1-3線性預測係數誤差能量(LinearPredictionCoefficientsErrorEnergy)123-2梅爾倒譜係數特徵萃取(MFCCFeatureExtraction)143-2-1預強濾波器(Pre-emphasis)143-2-2音框化(FrameBlocking)153-2-3加窗(Windowing)153-2-4離散傅氏轉換(DiscreteFourierTransform)163-2-5梅爾濾波器組(Mel-FrequencyFilterBank)163-2-6離散餘弦轉換183-2-7線性預測倒頻譜係數(LPC-Cepstrum)19第四章隱馬可夫模型(HIDDENMARKOVMODEL,HMM)224-1信號模型224-2隱馬可夫模型介紹224-3隱馬可夫模型解三項問題244-4建立隱馬可夫模型254-4-1初始化254-4-2狀態觀察序列機率計算264-4-3參數重估(ParameterEstimation)274-5參數重估計算(Reestimation)284-5-1向前程序(ForwardProcedure)284-5-2向後程序(BackwardProcedure)294-5-3向前向後程序(Forward-BackwardProcedure)294-5-4狀態轉移機率矩陣參數重估304-5-5狀態觀察機率矩陣參數重估304-6維特比演算法(ViterbiAlgorithm)32第五章英文語音辨識系統介紹345-1系統架構345-1-1模型訓練系統架構345-1-2辨識系統架構355-2設備環境365-3設計方法365-3-1音標代碼365-3-2音節類別的選取與語詞資料庫的建置385-3-3語音的活動與停止判別425-3-4音節的端點標示425-3-5聲學特徵的萃取475-3-6HMM模型訓練方式475-3-7決策方式48第六章辨識策略研究及實驗設計496-1實驗參數設定與模擬語詞數量496-2調整模型訓練次數及訓練方式之實驗506-2-1單音節類別模型之訓練次數506-2-2單音節類別模型之訓練方式526-3改變端點標示方式實驗556-3-1保留完整子音的端點標示方式對辨識率的影響556-4採用多元聲學特徵參數實驗576-4-1單一聲學特徵與多元聲學特徵對辨識率的影響576-5調整HMM狀態數實驗586-5-1HMM狀態數對辨識率的影響58第七章結論與未來展望607-1結論607-2未來展望60參考文獻61 [1]王小川,語音訊號處理,全華圖書出版社,民國93年[2]胡航,語音信號處理,哈爾濱工業大學出版社,2009[3]陳永銘,英文語音辨識系統之設計研究,國立中山大學電機工程研究所碩士論文,民國98年7月[4]越力,語音信號處理,機械工業出版社,2009[5]維基百科,http://zh.wikipedia.org/wiki/%E8%AA%9E%E8%A8%80[6]劉樂和宋庭新,語音識別與控制應用技術,科學出版社,2008[7]BenGoldandNelsonMorgan,SpeechandAudioSignalProcessing,JohnWiley&Sons,inc.,1999[8]Chin-HuiLee,HaizhouLi,BinMa,DonglaiZhu,“OptimizingthePerformanceofSpokenLanguageRecognitionWithDiscriminativeTraining”,IEEETransactionsonaudio,Speech,andlanguageprocessing.Vol.16,No.8,pp.1642-1652,November2008[9]EmmanuelDerutyandGeoffroyPeeters,“SoundIndexingUsingMorphologicalDescription”,IEEETransactionsonAudio,Speech,andLanguageprocessing,Vol.18,No.3,pp.675-687,March2010[10]J.R.Deller,J.G.Proakis,andJ.H.L.Hansen,Discrete-TimeProcessingofSpeechSignal,IEEEPress,NewYork,2000.[11]Kai-FuLee,AutomaticSpeechRecognition,KluwerAcademicPublishers,FourthPrinting1999.[12]ThomasF.Quatieri,Discrete-TimeSpeechSignalProcessingprinciplesandpractice,PrenticeHall,Taiwan,2005[13]X.Huang,A.Acero,andH.W.Hon,SpokenLanguageProcessing,PrenticeHall,Taiwan,2005  電子全文  國圖紙本論文 推文 網路書籤 推薦 評分 引用網址 轉寄                                                                                                                                                                                                                    top 相關論文 相關期刊 熱門點閱論文 1. 英文語音辨識系統之設計研究 2. 中文語音辨識系統增進辨識率之策略研究-以地址系統與二、三、四字詞系統為例 3. 語言辨識與檢索在中文口語處理之研究 4. 國語、客語及瑞典語三語言語音辨識系統之設計研究 5. 國語、俄語及泰語三語言語音辨識系統之設計研究 6. 國語、土耳其語及塔米爾語三語言語音辨識系統之設計研究 7. 國語、義大利語及波斯語三語言語音辨識系統之設計研究 8. 國語、阿拉伯語及荷蘭語三語言語音辨識系統之設計研究 9. 國語、英語及越南語三語言語音辨識系統之設計研究 10. 國語、葡萄牙語及印地語三語言語音辨識系統之設計研究 11. 國語、台語及粵語三語言語音辨識系統之設計研究 12. 土耳其文語音辨識系統之設計研究 13. 義大利文語音辨識系統之設計研究 14. 阿拉伯文語音辨識系統之設計研究 15. 俄文語音辨識系統之設計研究   1. 許美蘭、那愷庭、李靜怡、蔡瑛瑛(2006,5月)‧供應中心手術器械包滅菌效期改進方案‧榮總護理,25(2),188-195。

2. 許美蘭、那愷庭、李靜怡、蔡瑛瑛(2006,5月)‧供應中心手術器械包滅菌效期改進方案‧榮總護理,25(2),188-195。

3. 許美蘭、那愷庭、李靜怡、蔡瑛瑛(2006,5月)‧供應中心手術器械包滅菌效期改進方案‧榮總護理,25(2),188-195。

4. 許美蘭、那愷庭、李靜怡、蔡瑛瑛(2006,5月)‧供應中心手術器械包滅菌效期改進方案‧榮總護理,25(2),188-195。

5. 吳孟凌、黃麗菁、梁儷瓊(2006)‧降低加護病房護理人員積假天數方案‧北市醫學雜誌,3(9),931-941。

6. 吳孟凌、黃麗菁、梁儷瓊(2006)‧降低加護病房護理人員積假天數方案‧北市醫學雜誌,3(9),931-941。

7. 吳孟凌、黃麗菁、梁儷瓊(2006)‧降低加護病房護理人員積假天數方案‧北市醫學雜誌,3(9),931-941。

8. 吳孟凌、黃麗菁、梁儷瓊(2006)‧降低加護病房護理人員積假天數方案‧北市醫學雜誌,3(9),931-941。

  1. 英文語音辨識系統之設計研究 2. 英文與泰文文字語音辨識系統之設計研究 3. 俄文語音辨識系統之設計研究 4. 語音辨識系統之聲學模型訓練研究 5. 利用隱藏馬可夫模型於中文語音辨識之應用 6. 土耳其文語音辨識系統之設計研究 7. 阿拉伯文語音辨識系統之設計研究 8. 台語語音辨識系統之設計研究 9. 朗誦式詩詞歌賦搜尋系統之設計研究 10. 兩岸四地與日韓地址語音辨識系統之設計研究 11. 人臉偵測與辨識系統之設計研究 12. 日文與韓文文字語音辨識系統之設計研究 13. 中日韓印葡阿六國語音辨識系統之設計與研究 14. 32位元嵌入式語音辨識系統之改進 15. 國語、客語及瑞典語三語言語音辨識系統之設計研究     簡易查詢 | 進階查詢 | 熱門排行 | 我的研究室



請為這篇文章評分?