Around and About .NET World

Il blog di Marco Minerva
posts - 1671, comments - 2232, trackbacks - 2135

My Links

News

Contattami su Live Messenger:


MCTS: Windows, Web, Distributed Applications & SQL Server

MCPD: Enterprise Applications

Tag Cloud

Archives

Post Categories

Links

Uno Speech Server mininale con il .NET Framework 3.0

La classe SpeechSynthesizer del .NET Framework 3.0 (di cui ho già parlato in questo post) consente di redirezionare l'output del Text-To-Speech su varie destinazioni, ovvero l'uscita audio del PC (default), un file WAV oppure un generico Stream. Sfruttando quest'ultimo, è possibile realizzare uno Speech Server minimale in grado di fornire funzionalità di Text-To-Speech anche a sistemi che non hanno la potenza adatta per gestire un motore di TTS oppure che non dispongono di una sua implementazione (come nel caso dei Pocket PC con il .NET Compact Framework 2.0).

L'idea è semplice: sul server è in esecuzione un servizio che accetta le connessioni dai vari client, quindi legge la stringa che si vuole venga pronunciata, crea uno stream contenente il "parlato" e lo restituisce indietro. In tal modo, quest'ultimo non deve fare altro che riprodurre lo stream (che è semplicemente uno stream WAV) per ottenere l'effetto del Text-To-Speech. Il cuore dello Speech server è il seguente:

1 using(MemoryStream ms = new MemoryStream()) 2 { 3 //Legge la stringa dalla connessione TCP. 4 //... 5 6 //Genera il Text-To-Speech. 7 using (SpeechSynthesizer ss = new SpeechSynthesizer()) 8 { 9 ss.SelectVoice("ScanSoft Silvia_Dri40_16kHz"); 10 ss.SetOutputToWaveStream(ms); 11 ss.Speak(text); 12 } 13 14 //Converte lo stream in array di byte e lo invia al client. 15 //... 16 }

In particolare, la riga 10 redireziona l'output del Text-To-Speech su un MemoryStream, che poi viene convertito in byte e rispedito al mittente. Naturalmente è possibile tutta una serie di ottimizzazioni: ad esempio, si può comprimere l'array di byte prima di inviarlo al client, in modo da limitare la quantità di dati che passano sulla rete e riducerre così il tempo di risposta.

Print | posted on venerdì 5 gennaio 2007 15:08 | Filed Under [ C# .NET Compact Framework .NET 3.0 ]

Feedback

Gravatar

# re: Uno Speech Server mininale con il .NET Framework 3.0

Sto sviluppando per la mia tesi un'applicazione client/server che tra le altre cose deve fare esattamente quello che tu descrivi nell'articolo circa il server minimale etc.
In pratica devo inviare un flusso audio ad un client su pda che lo deve eseguire!
Gentilmente potresti darmi una mano a risolvere il mio problema, magari sviluppando in grandi linee le parti in verde!
Nello specifico il server mi da errore non appena indirizzo il flusso audio sullo stream.

Public Sub Sendtts(ByVal voice As String, ByVal text As String)
Dim spk As New SpeechSynthesizer

SyncLock client.GetStream
spk.SelectVoice(voice)
-----------------------------------------------------------------------
spk.SetOutputToWaveStream(client.GetStream)
-----------------------------------------------------------------------
spk.Speak(text)
End SyncLock
End Sub

Spero tu abbia un po di tempo per darmi una mano, e cmq ti ringrazio anticipatamente!
18/01/2007 04:38 | Alf
Comments have been closed on this topic.

Powered by:
Powered By Subtext Powered By ASP.NET