英文語音辨識系統增進辨識率之策略研究__臺灣博碩士論文知識 ...
文章推薦指數: 80 %
詳目顯示 ; 洪明昌 · Ming-Chang Hung · 英文語音辨識系統增進辨識率之策略研究 · A Design of Recognition Rate Improving Strategy For English Speech Recognition System.
資料載入處理中...
跳到主要內容
臺灣博碩士論文加值系統
:::
網站導覽|
首頁|
關於本站|
聯絡我們|
國圖首頁|
常見問題|
操作說明
English
|FB專頁
|Mobile
免費會員
登入|
註冊
功能切換導覽列
(159.65.137.222)您好!臺灣時間:2022/07/1908:37
字體大小:
:::
詳目顯示
recordfocus
第1筆/
共1筆
/1頁
論文基本資料
摘要
外文摘要
目次
參考文獻
電子全文
紙本論文
QRCode
本論文永久網址: 複製永久網址Twitter研究生:洪明昌研究生(外文):Ming-ChangHung論文名稱:英文語音辨識系統增進辨識率之策略研究論文名稱(外文):ADesignofRecognitionRateImprovingStrategyForEnglishSpeechRecognitionSystem指導教授:陳志堅指導教授(外文):Chih-ChienChen學位類別:碩士校院名稱:國立中山大學系所名稱:電機工程學系研究所學門:工程學門學類:電資工程學類論文種類:學術論文論文出版年:2011畢業學年度:99語文別:中文論文頁數:73中文關鍵詞:隱藏式馬可夫模型、線性預測倒頻譜係數、英文語音辨識系統、音位結構學、梅爾頻率倒頻譜係數外文關鍵詞:Mel-frequencycepstralcoefficients、Phonotactics、HiddenMarkovmodel、Linearpredictivecepstralcoefficients、Englishspeechrecognitionsystem相關次數:
被引用:1點閱:224評分:下載:11書目收藏:0
1588年大英帝國的海上霸權確立之後,英國的殖民活動將英文拓展到北美、印度、非洲以及澳大利亞等地。
1918年第一次世界大戰結束後,美國成爲世界第一大經濟強國,同時世界金融中心也由倫敦轉移到紐約。
1945年第二次世界大戰結束,美國在國際政治、經濟以及科技方面的地位更加崇高。
1945年10月24日聯合國成立,訂定英文與中文、法文、西班牙文、阿拉伯文以及俄文同為聯合國的六大正式工作語言。
這些歷史事件促成了一連串語言使用地域之擴展,使英文成為國際上使用最為廣泛的語言。
除了政治、經濟以及科技方面的優勢之外,英國擁有世界上規模最大的綜合博物館--大英博物館。
這座在1753年成立於倫敦市區的博物館,收藏來自世界各地超過1,300多萬件的考古文物,文化資源相當豐富。
本研究之目的在於建立一套英文語音辨識系統,提升吾人學習英文的成效,進而擴大視野增長見聞。
本論文探討英文語音辨識系統增進辨識率之策略。
以英文常用的989個單音節作為主要的訓練與辨識之基礎。
將每個單音節類別以一聲錄製一輪,再以四聲錄製下一輪。
兩種不同聲調交替錄音,共錄製十四輪的聲紋特性作為訓練語料。
並使用音高週期判斷語音尾部端點,以強化端點標示的準確性。
系統採用梅爾頻率倒頻譜係數及線性預測倒頻譜係數作為特徵參數,運用隱藏式馬可夫模型,作為單音辨識模型,且調整模型狀態數目到10,再利用音位結構學做比對,以增進辨識率。
本系統在時脈為2.4GHz的IntelCorei5CPUM450之筆記型電腦與Fedora14之作業系統環境下,針對6,812個英文語詞做辨識,可達到92.94%之正確辨識率,而平均所需辨識時間約在1.5秒以內。
Britainestablishedthestatusofmaritimehegemonyin1588.TheEnglishlanguagealongwiththeBritishcolonizedactivitieswasspreadtoNorthAmerica,India,AfricaandAustralia.AftertheendofWorldWarIin1918,theU.S.becamethemostpowerfulnationintheworldeconomy.Andatthesametime,theworldfinancialcenterwasshiftedtoNewYorkfromLondon.In1945,theWorldWarIIended,theU.S.furtherplayedindispensableroleineachaspectofinternationalpolitics,economyandtechnologies.TheUnitedNation,foundedonOctober24,1945,adoptedEnglish,Chinese,French,Spanish,ArabicaswellasRussianasthesixworkinglanguages.ThesehistoricaleventsfacilitatedasuccessionoflanguageexpansionandcausedEnglishtobethemostwidelyusedinternationallanguage.Besidethepolitical,economicandtechnologicalsuperiority,Britainownsthelargestcomprehensivemuseumintheglobe,theBritishMuseum.ThisMuseumwaslocatedinLondon,builtin1753,andmorethan13millionculturalrelicsofarchaeologyfromaroundtheworldwerecollected.Herculturalresourcesareremarkablyrich.ItisourobjectivetobuildalanguagesystemthatcanhelpustolearnEnglishmoreeffectivelyandtowidenourvisionoflivingatthesametime.ThisthesisinvestigatestherecognitionrateimprovementstrategiesforanEnglishspeechrecognitionsystem.Itutilizesthespeechfeaturesofthe989commonEnglishmono-syllablesasthemajortrainingandrecognitionmethodology.Atrainingdatabaseisestablishedbyreadingeachmono-syllable14rounds.Eachoneofthe989mono-syllablesisconsecutivelyreadwithtwodifferenttonesatalternaterounds.Theoddpronouncedroundshavehighpitchoftone1,whiletheevenroundshavefallingpitchoftone4.Thepitchperiodframemethodisappliedforenhancingtheaccuracyofendpointdetection.Mel-frequencycepstralcoefficients,linearpredictivecepstralcoefficients,andhiddenMarkovmodelareusedasthetwofeaturemodelsandtherecognitionmodelrespectively.ThenumberofHMMstatesisadjustedto10andthephonotacticalruleisusedfortherecognitionrateimprovement.UndertheCore™i5CPUM450notebookcomputerwith2.4GHzclockrateandFedora14operatingsystemenvironment,a92.94%correctphraserecognitionratecanbereachedfora6,812Englishphrasedatabase.Theaveragecomputationtimeforeachphraseiswithin1.5seconds.
論文審定書i致謝ii摘要iiiAbstractiv目錄v圖次viii表次ix第一章緒論11-1研究動機11-2研究目標11-3章節概要2第二章英文的歷史演變及其發音特性32-1語系的分類及使用概況32-2英語的演變歷史52-3英語的發音7第三章語音訊號處理相關技術介紹103-1音節端點標示103-1-1能量(Energy)103-1-2越零率(ZeroCrossingRate)113-1-3線性預測係數誤差能量(LinearPredictionCoefficientsErrorEnergy)123-2梅爾倒譜係數特徵萃取(MFCCFeatureExtraction)143-2-1預強濾波器(Pre-emphasis)143-2-2音框化(FrameBlocking)153-2-3加窗(Windowing)153-2-4離散傅氏轉換(DiscreteFourierTransform)163-2-5梅爾濾波器組(Mel-FrequencyFilterBank)163-2-6離散餘弦轉換183-2-7線性預測倒頻譜係數(LPC-Cepstrum)19第四章隱馬可夫模型(HIDDENMARKOVMODEL,HMM)224-1信號模型224-2隱馬可夫模型介紹224-3隱馬可夫模型解三項問題244-4建立隱馬可夫模型254-4-1初始化254-4-2狀態觀察序列機率計算264-4-3參數重估(ParameterEstimation)274-5參數重估計算(Reestimation)284-5-1向前程序(ForwardProcedure)284-5-2向後程序(BackwardProcedure)294-5-3向前向後程序(Forward-BackwardProcedure)294-5-4狀態轉移機率矩陣參數重估304-5-5狀態觀察機率矩陣參數重估304-6維特比演算法(ViterbiAlgorithm)32第五章英文語音辨識系統介紹345-1系統架構345-1-1模型訓練系統架構345-1-2辨識系統架構355-2設備環境365-3設計方法365-3-1音標代碼365-3-2音節類別的選取與語詞資料庫的建置385-3-3語音的活動與停止判別425-3-4音節的端點標示425-3-5聲學特徵的萃取475-3-6HMM模型訓練方式475-3-7決策方式48第六章辨識策略研究及實驗設計496-1實驗參數設定與模擬語詞數量496-2調整模型訓練次數及訓練方式之實驗506-2-1單音節類別模型之訓練次數506-2-2單音節類別模型之訓練方式526-3改變端點標示方式實驗556-3-1保留完整子音的端點標示方式對辨識率的影響556-4採用多元聲學特徵參數實驗576-4-1單一聲學特徵與多元聲學特徵對辨識率的影響576-5調整HMM狀態數實驗586-5-1HMM狀態數對辨識率的影響58第七章結論與未來展望607-1結論607-2未來展望60參考文獻61
[1]王小川,語音訊號處理,全華圖書出版社,民國93年[2]胡航,語音信號處理,哈爾濱工業大學出版社,2009[3]陳永銘,英文語音辨識系統之設計研究,國立中山大學電機工程研究所碩士論文,民國98年7月[4]越力,語音信號處理,機械工業出版社,2009[5]維基百科,http://zh.wikipedia.org/wiki/%E8%AA%9E%E8%A8%80[6]劉樂和宋庭新,語音識別與控制應用技術,科學出版社,2008[7]BenGoldandNelsonMorgan,SpeechandAudioSignalProcessing,JohnWiley&Sons,inc.,1999[8]Chin-HuiLee,HaizhouLi,BinMa,DonglaiZhu,“OptimizingthePerformanceofSpokenLanguageRecognitionWithDiscriminativeTraining”,IEEETransactionsonaudio,Speech,andlanguageprocessing.Vol.16,No.8,pp.1642-1652,November2008[9]EmmanuelDerutyandGeoffroyPeeters,“SoundIndexingUsingMorphologicalDescription”,IEEETransactionsonAudio,Speech,andLanguageprocessing,Vol.18,No.3,pp.675-687,March2010[10]J.R.Deller,J.G.Proakis,andJ.H.L.Hansen,Discrete-TimeProcessingofSpeechSignal,IEEEPress,NewYork,2000.[11]Kai-FuLee,AutomaticSpeechRecognition,KluwerAcademicPublishers,FourthPrinting1999.[12]ThomasF.Quatieri,Discrete-TimeSpeechSignalProcessingprinciplesandpractice,PrenticeHall,Taiwan,2005[13]X.Huang,A.Acero,andH.W.Hon,SpokenLanguageProcessing,PrenticeHall,Taiwan,2005
電子全文
國圖紙本論文
推文
網路書籤
推薦
評分
引用網址
轉寄
top
相關論文
相關期刊
熱門點閱論文
1.
英文語音辨識系統之設計研究
2.
中文語音辨識系統增進辨識率之策略研究-以地址系統與二、三、四字詞系統為例
3.
語言辨識與檢索在中文口語處理之研究
4.
國語、客語及瑞典語三語言語音辨識系統之設計研究
5.
國語、俄語及泰語三語言語音辨識系統之設計研究
6.
國語、土耳其語及塔米爾語三語言語音辨識系統之設計研究
7.
國語、義大利語及波斯語三語言語音辨識系統之設計研究
8.
國語、阿拉伯語及荷蘭語三語言語音辨識系統之設計研究
9.
國語、英語及越南語三語言語音辨識系統之設計研究
10.
國語、葡萄牙語及印地語三語言語音辨識系統之設計研究
11.
國語、台語及粵語三語言語音辨識系統之設計研究
12.
土耳其文語音辨識系統之設計研究
13.
義大利文語音辨識系統之設計研究
14.
阿拉伯文語音辨識系統之設計研究
15.
俄文語音辨識系統之設計研究
1.
許美蘭、那愷庭、李靜怡、蔡瑛瑛(2006,5月)‧供應中心手術器械包滅菌效期改進方案‧榮總護理,25(2),188-195。
2.
許美蘭、那愷庭、李靜怡、蔡瑛瑛(2006,5月)‧供應中心手術器械包滅菌效期改進方案‧榮總護理,25(2),188-195。
3.
許美蘭、那愷庭、李靜怡、蔡瑛瑛(2006,5月)‧供應中心手術器械包滅菌效期改進方案‧榮總護理,25(2),188-195。
4.
許美蘭、那愷庭、李靜怡、蔡瑛瑛(2006,5月)‧供應中心手術器械包滅菌效期改進方案‧榮總護理,25(2),188-195。
5.
吳孟凌、黃麗菁、梁儷瓊(2006)‧降低加護病房護理人員積假天數方案‧北市醫學雜誌,3(9),931-941。
6.
吳孟凌、黃麗菁、梁儷瓊(2006)‧降低加護病房護理人員積假天數方案‧北市醫學雜誌,3(9),931-941。
7.
吳孟凌、黃麗菁、梁儷瓊(2006)‧降低加護病房護理人員積假天數方案‧北市醫學雜誌,3(9),931-941。
8.
吳孟凌、黃麗菁、梁儷瓊(2006)‧降低加護病房護理人員積假天數方案‧北市醫學雜誌,3(9),931-941。
1.
英文語音辨識系統之設計研究
2.
英文與泰文文字語音辨識系統之設計研究
3.
俄文語音辨識系統之設計研究
4.
語音辨識系統之聲學模型訓練研究
5.
利用隱藏馬可夫模型於中文語音辨識之應用
6.
土耳其文語音辨識系統之設計研究
7.
阿拉伯文語音辨識系統之設計研究
8.
台語語音辨識系統之設計研究
9.
朗誦式詩詞歌賦搜尋系統之設計研究
10.
兩岸四地與日韓地址語音辨識系統之設計研究
11.
人臉偵測與辨識系統之設計研究
12.
日文與韓文文字語音辨識系統之設計研究
13.
中日韓印葡阿六國語音辨識系統之設計與研究
14.
32位元嵌入式語音辨識系統之改進
15.
國語、客語及瑞典語三語言語音辨識系統之設計研究
簡易查詢 |
進階查詢 |
熱門排行 |
我的研究室
延伸文章資訊
- 1什麼是像素、解析度、DPI、PPI,看這篇文章就夠了
電子設計路上,難免遇到需要液晶顯示以及影像處理的場合,那麼,下面的知識點,你就要必須掌握了。 1.像素像素,英文pixel。其中,pix是picture(圖片) ...
- 2辨識的英文是什麽- 英漢詞典 - 漢語網
孤獨癥發病率的上升可能要歸於家長和醫生辨識能力的提高,診斷標準的放寬,和診斷服務更為普遍等因素。 the increase in the prevalence of autism is prob...
- 3識別速率;辨識率- 電子工程- 英文翻譯 - 三度漢語網
- 4指紋辨識英文- 英語翻譯 - 查查詞典
指紋辨識英文翻譯: tcfingerprinting…,點擊查查綫上辭典詳細解釋指紋辨識英文發音,英文單字,怎麽用英語翻譯指紋辨識,指紋辨識的英語例句用法和解釋。
- 5readability - 辨識度;可讀度 - 國家教育研究院雙語詞彙
出處/學術領域, 英文詞彙, 中文詞彙. 學術名詞 教育學名詞-科教名詞, readability, 可讀性. 學術名詞 國防部新編國軍簡明美華軍語辭典