Tokyo Institute of Technology Multilingual Speech Corpus - Icelandic (TITML-ISL)

音声認識用の学習データとして現地で収集した,3種類の読み上げ音声データベース. 1. 音素バランス文:アイスランド語の音素バランス文 256文(アルファベットの読み上げ,20~30の自由発話もあり),各話者1セット(256文,1名のみ異なる184文) 2. 天気に関する質問文:MITのJupiterコーパスをアイスランド語に翻訳した短文 1000文(読み上げは660文のみ),1話者あたり約200文 3.ニュース文:アイスランド国営放送のニュース文 400文,1話者あたり約20文 The Icelandic speech corpus was developed for training the...

Full description

Bibliographic Details
Main Authors: 篠田浩一教授,古井貞熙名誉教授(東京工業大学), Prof. Koichi Shinoda and Prof. Sadaoki Furui (Tokyo Institute of Technology), 篠田 浩一(代表著作権者), Copyright holder: Koichi Shinoda
Format: Other/Unknown Material
Language:English
Published: 国立情報学研究所 音声資源コンソーシアム (NII-SRC) 2012
Subjects:
Online Access:https://dsc.repo.nii.ac.jp/?action=repository_uri&item_id=4380
http://id.nii.ac.jp/1457/00004363/
Description
Summary:音声認識用の学習データとして現地で収集した,3種類の読み上げ音声データベース. 1. 音素バランス文:アイスランド語の音素バランス文 256文(アルファベットの読み上げ,20~30の自由発話もあり),各話者1セット(256文,1名のみ異なる184文) 2. 天気に関する質問文:MITのJupiterコーパスをアイスランド語に翻訳した短文 1000文(読み上げは660文のみ),1話者あたり約200文 3.ニュース文:アイスランド国営放送のニュース文 400文,1話者あたり約20文 The Icelandic speech corpus was developed for training the acoustic models of an automatic speech recognition system.This database contains 3 kinds of read speech. These were collected in Iceland. 1. PB text: 256 Icelandic bi-phonetically balanced sentences. (alphabets and around 20 spontaneous utterances are also included.) 1 set per speaker (one of speakers uttered different 184 sentences). 2. Weather information queries: 1000 sentences which was translated from MIT's JUPITER corpus (660 sentences were actually uttered). Roughly 200 sentences per speaker. 3. News: 400 sentences from the news domain. Roughly 20 sentences per speaker.