語音生成簡介
時(shí)間:2019-10-28 14:05:37 作者:無名 瀏覽量:52
語音生成是經(jīng)過機(jī)械的、電子的方法產(chǎn)生人造語音的技能。TTS技能(又稱文語轉(zhuǎn)化技能)隸屬于語音組成,它是將計(jì)算機(jī)自己產(chǎn)生的、或外部輸入的文字信息轉(zhuǎn)變?yōu)槟軌蚵牭枚、流利的漢語白話輸出的技能。采用世界領(lǐng)先的語音組成技能,研制出來的“語音組成助手”軟件能夠完美的完結(jié)語音組成作業(yè)。
概述
語音生成是利用電子計(jì)算機(jī)和一些專門裝置模擬人,制作語音的技能。
專業(yè)技能
語音組成和語音辨認(rèn)技能是完成人機(jī)語音通訊,建立一個(gè)有聽和講才能的白話體系所必需的兩項(xiàng)關(guān)鍵技能。使電腦具有類似于人相同的說話才能,是當(dāng)今時(shí)代信息產(chǎn)業(yè)的重要競爭商場。和語音辨認(rèn)
比較,語音組成的技能相對說來要老練一些,并已開端向產(chǎn)業(yè)化方向成功邁進(jìn),大規(guī)模應(yīng)用指日可下。
語音生成,又稱文語轉(zhuǎn)化(Text to Speech)技能,能將恣意文字信息實(shí)時(shí)轉(zhuǎn)化為標(biāo)準(zhǔn)流暢的語音
朗讀出來,相當(dāng)于給機(jī)器裝上了人工嘴巴。它觸及聲學(xué)、言語學(xué)、數(shù)字信號(hào)處理、計(jì)算機(jī)科學(xué)等多個(gè)學(xué)科技能,是中文信息處理范疇的一項(xiàng)前沿技能,處理的首要問題就是如何將文字信息轉(zhuǎn)化為可聽的聲響信息,也即讓機(jī)器像人相同開口說話。咱們所說的“讓機(jī)器像人相同開口說話”與傳統(tǒng)的聲響回放設(shè)備(體系)有著實(shí)質(zhì)的差異。傳統(tǒng)的聲響回放設(shè)備(體系),如磁帶錄音機(jī),是經(jīng)過預(yù)先錄制聲響然后回放來完成“讓機(jī)器說話”的。這種方式無論是在內(nèi)容、存儲(chǔ)、傳輸或者方便性、及時(shí)性等方面都存在很大的限制。而經(jīng)過計(jì)算機(jī)語音組成則能夠在任何時(shí)候?qū)㈨б馕谋巨D(zhuǎn)化成具有高天然度的語音,然后真正完成讓機(jī)器“像人相同開口說話”。
轉(zhuǎn)化體系
文語轉(zhuǎn)化體系實(shí)際上能夠看作是一個(gè)人工智能體系。為了組成出高質(zhì)量的言語,除了依賴于各種規(guī)矩,包含語義學(xué)規(guī)矩、詞匯規(guī)矩、語音學(xué)規(guī)矩外,還必須對文字的內(nèi)容有很好的了解,這也觸及到天然言語了解的問題。下圖顯示了一個(gè)完整的文語轉(zhuǎn)化體系示意圖。文語轉(zhuǎn)化進(jìn)程是先將文字序列轉(zhuǎn)化成音韻序列,再由體系根據(jù)音韻序列生成語音波形。其間第一步觸及言語學(xué)處理,例如分詞、字音轉(zhuǎn)化等,以及一整套有效的韻律操控規(guī)矩;第二步需求先進(jìn)的語音組成技能,能按要求實(shí)時(shí)組成出高質(zhì)量的語音流。因此一般說來,文語轉(zhuǎn)化體系都需求一套雜亂的文字序列到音素序列的轉(zhuǎn)化程序,也就是說,文語轉(zhuǎn)化體系不只要應(yīng)用數(shù)字信號(hào)處理技能,并且必須有很多的言語學(xué)常識(shí)的支撐。
- 軟件性質(zhì):國產(chǎn)軟件
- 授權(quán)方式:免費(fèi)版
- 軟件語言:簡體中文
- 軟件大。11345 KB
- 下載次數(shù):4821 次
- 更新時(shí)間:2019/10/28 10:01:16
- 運(yùn)行平臺(tái):WinXP,Win7,...
- 軟件描述:文字轉(zhuǎn)成語音生成器是一款免費(fèi)版的文字轉(zhuǎn)換語音軟件,采用了國際領(lǐng)先的語音合成技術(shù),... [立即下載]
相關(guān)資訊