The Echoes of Modern Voice Recognition Software

"Siri, dis-moi le temps aujourd'hui."

Le logiciel de reconnaissance vocale peut encore être loin d'être parfait, mais le niveau de progrès qu'elle a atteint au cours des décennies est indéniable. En fait, nous sommes à un point où son utilisation est plus ou moins omniprésente, quelque chose que vous verriez couramment dans les gadgets, les smartphones, les tablettes…

… Mais attendez, quelle est exactement la technologie de reconnaissance vocale?

Voici une courte histoire du logiciel de reconnaissance vocale, de son aspect pratique et d'un aperçu de ce à quoi nous pouvons nous attendre à l'avenir.

 

Syllabes en mots

Bien que la technologie de reconnaissance de la parole numérique existe dès les années 1950, les premiers vestiges de la version que nous reconnaissons aujourd'hui provenaient des efforts d'algorithme et de vocabulaire par l'Union soviétique et le DARPA vers les années 1970. Les développements de leurs recherches se termineraient plus tard dans les premiers logiciels de reconnaissance de la parole commerciaux de la fin du 20e siècle, qui sont devenus par la suite la base de ce que nous finirions par adopter au 21e siècle.

Aujourd'hui, la plupart des logiciels de reconnaissance vocale utilisent des algorithmes complexes et des bases de données extrêmement énormes pour le langage et le vocabulaire. Dragon naturellement parlant Par Dragon Systems, par exemple, est capable d'utiliser des fonctions d'entrée pour fournir des systèmes de dictée de discours sur 7 langues différentes. Les systèmes cloud intégrés permettent aux logiciels d'assistant personnel tels que Siri et Cortana d'analyser et de comprendre les requêtes vocales et de fournir des informations pertinentes en fonction de ce qui est demandé verbalement. Les développements continus de la reconnaissance, de la prédiction et de l'analyse des modèles continuent de pousser encore plus loin la technologie.

 

Mots dans le sens

Bien qu'il soit impressionnant de voir un système numérique capable de comprendre la parole humaine, quelles sont les applications pratiques? Si nous pouvons simplement taper une entrée ou sélectionner une option dans un menu d'affichage tactile, avons-nous besoin d'un logiciel pour analyser la parole? Même sans considérer la génialité pure de faire comprendre une machine quand vous parlez, la réponse est toujours un oui retentissant!

 

Jetons un coup d'œil à certains des avantages et des applications pratiques:

Assistance automatisée - Il s'agit de l'une des utilisations les plus fondamentales des systèmes de reconnaissance vocale aujourd'hui. Bien que parler à une machine automatisée ne soit pas toujours idéal, cette fonction nous permet de répondre aux demandes de base sans avoir à attendre en attente pendant une heure pour atteindre un «agent en direct. Nous pouvons même interagir et être guidés à travers des instructions de base, certainement un gain de temps (parfois).

Entrée de données à distance - Avec le logiciel de reconnaissance vocale, les utilisateurs qui ne peuvent pas utiliser les modes d'entrée standard tels que la saisie peuvent simplement verbaliser les données et avoir le discours pour appliquer le texte numériser l'entrée. Cette même caractéristique peut également être utilisée pour inverse pour diverses fonctions de texte à la parole.

Entrée de commande distante - Une fois que vous pouvez saisir des données à l'aide de la parole, la traduction de ces données en commandes devient une tâche simple. Il suffit de mapper certains mots clés et phrases simples aux réponses souhaitées.

Transcription très rapide - Admettons-le, même si les ordinateurs dominent une partie importante de notre vie, nous sommes encore loin d'être des dactylographiques professionnels en matière de vitesse d'entrée manuelle. Le logiciel de reconnaissance vocale élimine cette limitation, en vous aidant à transcrire instantanément des mots en quelque chose qui peut être édité par des professionnels plus tard.

Authentification alternative - Enfin, les systèmes de reconnaissance vocale peuvent être utilisés comme méthode alternative d'accès à la sécurité, par opposition aux entrées de mot de passe standard ou à l'autorisation matérielle. Bien que son efficacité ultime soit encore discutable, l'utiliser en tandem avec d'autres systèmes de sécurité offre une couche supplémentaire de protection pour les fichiers et les données qui nécessitent des mesures de sécurité plus strictes.

 

Signification dans les idées

Une chose que vous avez peut-être remarquée au cours des deux dernières années, c'est que les systèmes de reconnaissance de la parole ou de la voix se sont améliorés à pas de géant! Même l'année dernière, la plupart des systèmes de reconnaissance vocale ont une note d'amélioration observée par plus de trente pour cent. La meilleure partie de cela est que ces technologies sont actuellement intégrées aux systèmes d'IA, c'est pourquoi Siri semble plus perk plus qu'elle ne l'était il y a une demi-décennie.

Il ne s'agit pas seulement d'utiliser le cloud pour croquer d'énormes quantités de données à analyser. Même la voix au texte ou le texte à des applications en ligne de la parole est devenue plus répandue. Les logiciels qui permettent la création de systèmes de reconnaissance vocale personnalisés permettent désormais aux utilisateurs de configurer leur propre réseau d'accès qui est non seulement accessible via le clavier ou la souris, mais peut également être consacré à l'ordre idéal en parlant simplement à votre ordinateur.

Avec tous ces développements, une interface de reconnaissance vocale de type informatique Star Trek, facilement accessible, peut être plus proche que nous ne le pensons.

Laisser un commentaire

Tous les commentaires sont modérés avant d'être publiés