자연스럽게 들리는 우분투 용 텍스트 음성 변환 소프트웨어를 쉽게 설치할 수있는 방법을 찾고 있습니다. 내가 설치 한 Festival
, Gespeaker
등,하지만 아무것도 매우 자연스러운 소리를하지 않습니다. 모두 매우 합성적이고 이해하기 어렵다.
어떤 추천이 있습니까?
답변
SVOX pico2wave
매우 미니멀리즘적인 TTS로 말하거나 mbrola보다 더 좋은 소리를냅니다 (제 생각에는). 여기에 몇 가지 정보가 있습니다 .
왜 pico2wave가 espeak 또는 mbrola와 비교하여 거의 논의되지 않았는지 이해할 수 없습니다. 작지만 정말 좋은 소리입니다. 수정하지 않으면 자연스러운 여성 목소리가 들립니다.
그리고 … Mbrola와 비교할 때 단위를 인식하고 올바른 방식으로 말합니다!
예를 들면 다음과 같습니다.
- 2 ° C → 2도
- 2m → 2 미터
- 2kg → 2 킬로그램
설치 후 스크립트에서 사용합니다.
#!/bin/bash
pico2wave -w=/tmp/test.wav "$1"
aplay /tmp/test.wav
rm /tmp/test.wav
그런 다음 원하는 텍스트로 실행하십시오.
<scriptname>.sh "hello world"
또는 전체 파일의 내용을 읽습니다.
<scriptname>.sh "$(cat <filename>)"
이것으로 Ubuntu에서 가볍고 안정적인 TTS를 사용할 수 있습니다.
답변
말해봐!
“SpeakIt”이라는 Google Chrome 확장 프로그램을 사용하여 무료로 최고의 TTS 소프트웨어를 찾았습니다. 이것은 우분투의 Chrome 브라우저에서만 작동합니다. 어떤 이유로 Chromium과 작동하지 않습니다. SpeakIt에는 두 가지 여성 목소리가 함께 제공되어 다른 모든 것에 비해 매우 사실적으로 들립니다. ‘TTS’를 검색어로 사용하여 Chrome 웹 스토어를 검색하면 Chrome 확장 프로그램에 남성 및 여성 음성이 4 개 이상 나열됩니다.
사용법 : 웹 사이트에서 사용합니다. 읽을 텍스트를 강조 표시 한 다음 마우스 오른쪽 버튼을 클릭하고 “SpeakIt”을 클릭하거나 Chrome 상단 표시 줄에 고정 된 SpeakIt 아이콘을 클릭하십시오.
Firefox 사용자에게는 두 가지 옵션이 있습니다. Firefox 애드온에서 TTS를 검색 하면 “Click Speak”와 “Text to Voice”가 표시됩니다. 음성은 Chrome SpeakIt 음성만큼 좋지는 않지만 확실히 사용할 수 있습니다.
SpeakIt 확장 프로그램은 iSpeech 기술을 사용하며 1 년에 $ 20의 가격으로 텍스트를 MP3 오디오 파일로 변환 할 수 있습니다. TXT, DOC 및 PDF와 같은 문서뿐만 아니라 텍스트, URL, RSS 피드를 입력하고 MP3로 출력 할 수 있습니다. 팟 캐스트, 내장 오디오 등을 만들 수 있습니다. 여기 링크 및 오디오 샘플이 있습니다 (링크 지속 시간을 모름).
답변
Pico와 espeak는 재미 있고 일하기가 쉽지만 그다지 좋은 것은 아닙니다. 기본 페스티벌 목소리도 그다지 좋지 않습니다. 그러나 Festival은 많은 연구원들이 훨씬 더 나은 플러그인 음성을 구축 한 체계 기반의 음성 프레임 워크입니다. 이러한 음성 중 하나가 기성품 패키지로 제공되므로 우분투 스톡에서 pico2wave 품질을 쉽게 능가 할 수 있습니다.
축제 사운드를 자연스럽게 만들려면 다음을 수행하십시오.
sudo apt-get install festival
sudo apt-get install festvox-us-slt-hts
festival -i
festival> (voice_cmu_us_slt_arctic_hts)
festival> (SayText "Don't hate me, I'm just doing my job!")
-b
(또는 --batch
)를 사용하고 각 명령을 작은 따옴표로 묶어 명령 행에서 수행 할 수 있습니다 .
festival -b '(voice_cmu_us_slt_arctic_hts)' \
'(SayText "The temperature is 22 degrees centigrade and there is a slight breeze from the west.")'
Nitech 저장소에서 다른 좋은 음성을 얻을 수 있지만 설치가 까다 롭고 기본 경로가 변경되어 번들 구성표 파일의 파일 이름 참조를 수동으로 편집하여 재고 우분투에서 작업 할 수 있습니다.
답변
간단한 Google ™ TTS
프로젝트 페이지에서 업데이트 (2019-02) : 이 프로젝트는 현재 유지 관리되지 않으며 가까운 미래에도 계속 유지 될 예정입니다.
더 나은 대안이 없기 때문에 Michal Fapso의 perl 스크립트 와 인터페이스하여 Google Translate를 통해 TTS를 제공 하는 bash 스크립트 를 작성했습니다 . 프로젝트 설명에서 :
Google의 음성 합성 시스템을 통해 텍스트 음성 변환 출력에 사용하기 쉬운 인터페이스를 제공하고자합니다. 인터넷에 연결되어 있지 않은 경우 pico2wave를 사용하는 폴백 옵션은 자동으로 TTS 합성을 제공합니다.
래퍼는 표준 입력, 일반 텍스트 파일 및 X 선택 (강조 표시된 텍스트)에서의 읽기를 지원합니다.
주요 특징은 다음과 같습니다.
- Google 번역을 통한 온라인 TTS 합성
- pico2wave를 통한 오프라인 TTS 합성
- 다양한 언어를 지원합니다
- CLI, 텍스트 파일 및 강조 표시된 텍스트에서 읽을 수 있습니다
- 고정 형식의 강조 표시된 텍스트 (예 : PDF 파일)를 읽을 수 있습니다
설치 및 사용법은 프로젝트 페이지에 설명되어 있습니다.
시도해 보니 기쁘다. 버그 리포트 및 기타 피드백 은 환영합니다!
답변
나는 Ubuntu의 텍스트 음성 변환을 고품질로 보았습니다. 없습니다. 내 성대가 마비되었으므로 우분투 비디오에 음성 안내를 추가하려면 TTS가 필요했습니다 . 상용 고품질 Linux 텍스트 대 음성 소프트웨어를 여기서 얻을 수 있습니다 . 정말 비싸요. 나는 Windows 용 Natural Reader (우분투 와인에서는 작동하지 않음)를 40 달러에 구입했습니다. 나중에 나는 리눅스를 얻을 것이다.
답변
최고의 소리를 내고 텍스트를 음성으로 쉽게 조정할 수있는 연구를 진행하고 있습니다. 아래는 제가 음질 순서대로 상위 5 개 제품이라고 생각한 목록입니다. 이 제품과 관련된 대부분의 웹 사이트에는 사용자가 직접 결정할 수있는 대화식 데모가 있습니다.
- 네오 음성
- 아이 보나
- 아카 풀라
- AT & T 자연스러운 목소리
- CereProc 목소리