Sinteza si recunoasterea vorbirii

Master in Informatica
Specializarea Metode si Modele in Inteligenta Artificiala
FISA DISCIPLINEI

Anul academic 2011- 2012



  Departament Home

Cod: MMIA214
Titular curs: Prof.Dr.N.Tandareanu
Anul: 2;
Ciclul: II;
Sem. 1: Curs: 28h, Lab: 28h
Credite: 8
Profil: informatica
Tip disciplina: optional
Obiective:
  • Asimilarea conceptelor legate de sinteza si recunoasterea vorbirii.
  • Formarea deprinderilor necesare implementarii aplicatiilor prin voce.
I. Apache Ant.
  1. Generalitati cu privire la acest produs.
  2. Instalarea produsului Apache Ant
  3. Proiecte, proprietati, taguri
  4. Fisiere build. Exemple.
II. Interfete prin voce
  1. Aplicatii prin voce
  2. Utilizarea aplicatiilor prin voce
  3. Proiectarea aplicatiilor prin voce
  4. Tehnologia prin voce.
  5. Sinteza vorbirii
III. Sinteza vorbirii prin Java Speech API
  1. Ce este JSAPI?
  2. Motor Speech, proprietati
  3. Starile unui motor speech
  4. Localizare, selectare si creare de motoare
  5. Evenimente Speech
  6. Sintetizatorul ca motor
  7. Sinteza Speech: javax.speech.synthesis
  8. Trimiterea unui text pentru a fi pronuntat
IV. Recunoasterea vorbirii
  1. Generalitati
  2. Arhitectura produsului Sphinx
  3. Modulul FrontEnd
  4. Modulul Linguist
  5. Recognizere. Selectarea unui recognizer.
V Java Speech Grammar Format
  1. Introducere
  2. Definitii
    2.1 Nume de gramatici si nume de pachete
    2.2 Nume de reguli
    2.3 Tokenuri
    2.4 Comentarii
  3. Header de gramatica
    3.1 Self-Identifying Header
    3.2 Declararea numelui de gramatica
    3.3 Importuri
  4. Corpul unei gramatici
    4.1 Definirea regulilor
    4.2 Expansiunea regulilor
    4.3 Compunerea
    4.4 Gruparea
    4.5 Operatori unari
    4.6 Taguri
    4.7 Precedenta
    4.8 Recursia
    4.9 Utilizarea entitatilor NULL si VOID
  5. Exemple
Bibliografie:
  1. Java Speech Grammar Format Specification - JSGF documentation
  2. The CMU-Cambridge Statistical Language Modeling Toolkit v2 ,
    http://svr-www.eng.cam.ac.uk/~prc14/toolkit_documentation.html
  3. Willie Walker, Paul Lamere, Philip Kwok, Bhiksha Raj, Rita Singh, Evandro Gouvea, Peter Wolf, Joe Woelfel - Sphinx-4: A Flexible Open Source Framework for Speech Recognition, SMLI TR2004-0811 c 2004 SUN MICROSYSTEMS INC.
Lucrari practice
Lucrari de laborator
Documentatie
Sinteza si Recunoasterea vorbirii
Apache Ant
FreeTTS
Sphinx 4-1.0
JSAPI.html

Last update: January 2012