Une serrure à ouverture vocale

Cet appareil reconnaît un mot de passe prononcé par 4 usagers différents : les trois mots qui le composent sont préalablement mémorisés. La technique mise en oeuvre est connue sous le nom de “Speaker Dependent” et le microcontrôleur est un RCS-300 de Sensory. Un relais permet la commande de la serrure ou de tout autre dispositif électrique.


Tous les systèmes de contrôle d’accès du même type suivent le même processus : tout d’abord une première identification de l’usager cherchant à entrer a lieu et ensuite on vérifie que ce dernier est autorisé ou non. Les premiers systèmes d’identification créés ont recours à un couplage personne/objet univoque : par exemple, la serrure de la porte d’entrée d’une maison utilise la clé comme objet identificateur et pour contrôler que la personne qui la détient est autorisée ou non à entrer.
Si, à la place de la clé, on utilise des systèmes à cartes magnétiques ou badges à transpondeurs, la logique du lien objet/usager demeure identique. De même, pour les systèmes informatiques, le mécanisme de base est analogue : si nous devons accéder à des ressources partagées, un mot de passe personnel et univoque nous est demandé afin de permettre au programme réalisant le contrôle à distance de nous reconnaître et par suite de nous autoriser ou non l’entrée.
L’inconvénient de ces systèmes est que parfois la relation objet univoque/identification usager peut disparaître : si par exemple nous perdons la clé de la serrure ou la carte magnétique ou le badge à transpondeur, ou bien si quelqu’un réussit à intercepter le mot de passe, etc., le système n’est plus en mesure de reconnaître que celui qui se tient là devant n’est pas l’usager autorisé mais une autre personne.
Une des solutions consiste alors à identifier chaque usager par quelque chose qui ne puisse être ni perdu ni cloné : empreinte digitale ou iris, structure de la rétine de l’oeil ou format de la fréquence vocale. Dans ce dernier domaine précisément, la technologie a fait récemment un pas en avant remarquable : autrefois les applications utilisant la reconnaissance vocale étaient réservées à des secteurs particuliers et coûtaient très cher, mais aujourd’hui il n’en est plus ainsi. En effet, on trouve dans le commerce des programmes pour PC destinés à la gestion des applications par commande vocale.

Notre réalisation
Le montage décrit dans ces pages entre dans cette dernière catégorie : c’est en effet un contrôleur pour serrure électrique basé sur la reconnaissance vocale. Le fonctionnement en est très simple : chaque personne est identifiée par le circuit grâce à sa propre signature vocale. Si tel usager a déjà été mémorisé par la mémoire “fl ash” du dispositif, un relais consacré au contrôle d’un périphérique externe (par exemple une serrure électrique, une alarme, le portillon de la maison, etc.) permet l’accès à la personne reconnue.

Fonctionnement du mot de passe vocal
Pour exécuter la reconnaissance vocale, le “Voice Pass word” s’appuie sur un microcontrôleur RCS300 (dénommé aussi VE-IC) de Sensory. Le nombre des usagers pouvant être identifiés est égal à 4. Pour reconnaître chaque usager, le circuit mémorise le modèle (“template”) vocal de 3 mots différents prononcés par lui. Les 12 signatures vocales différentes sont mémorisées par la mémoire “fl ash” pour être ensuite utilisées à titre de références ou critères au cours des contrôles d’identification.
Le premier mot de chaque usager est utilisé pour le reconnaître à l’intérieur du groupe de 4, les deux autres forment le mot de passe proprement dit. En effet, quand le VE-IC reconnaît qu’un mot a été prononcé, il calcule le modèle correspondant et le compare aux 4 premiers modèles mémorisés.
S’il trouve une correspondance, il restreint alors le champ de recherche à un seul usager, il attend la prononciation des deux autres mots et les compare avec les deux signatures restantes : si la correspondance est bonne, l’identification a réussi et le circuit déclenche le relais, sinon c’est que la personne n’est pas ou plus autorisée.
Pour toutes les comparaisons, la technique de reconnaissance utilisée est du type “Speaker Dependent” : cela signifie que le microcontrôleur est capable de percevoir si un même mot est prononcé par une personne ou par une autre. Il n’y paraît peut-être pas mais cette fonction garantit un haut niveau de sécurité : si, en effet, une personne étrangère, par hasard ou intentionnellement, réussissait à entendre quels sont les trois mots “magiques” permettant d’ouvrir la porte, elle n’aurait de toute façon pas la possibilité d’y réussir, elle, car la signature de sa voix n’est pas mémorisée.
Le circuit est caractérisé par certains paramètres de fonctionnement pouvant être introduits de l’extérieur. Deux niveaux de sécurité sont proposés (“Speaker Dependent Performance” et “Security Level”) concernant respectivement la reconnaissance du premier et des deux modèles vocaux suivants. Ils peuvent prendre des valeurs entre 1 et 5, où 1 est le niveau minimum de sécurité et 5 le niveau maximum (dans ce dernier cas, un mot, pour être reconnu, doit être prononcé de manière très semblable à la signature mémorisée). Il existe ensuite un paramètre nommé “Impulse/Toggle” (impulsion/bascule de changement d’état) indiquant que le relais est en mode mono stable (paramètre 1) ou bistable (paramètre 2). Si l’on choisit le mode 1 monostable, il est possible de spécifier la durée d’activation du relais : ce paramètre mémorisé est le “Time Impulse” (durée de l’impulsion), il peut prendre des valeurs entières entre 1 et 5, indiquant respectivement 1 ou 5 secondes. Enfin un “Input/CL” permet d’indiquer si le circuit fonctionne en mode “Input” (paramètre 1) ou “Continuous Listening”, écoute continue (paramètre 2) : avec le premier de ces modes, la reconnaissance est activée par une commande externe sur l’entrée IN, avec le second en revanche le circuit est toujours en attente d’un mot.
Pour entrer en mode de configuration et pour régler les divers paramètres, 7 touches se trouvent sur la platine : “Config”, “Security Level” SL, “Speaker Dependent Performance” SD, “Impulse/Toggle”, “Time Impulse”, “Input/CL” et “Reset”. A part “Config” et “Reset”, il y a une relation directe entre les 5 autres touches et les 5 paramètres du circuit.
Les deux premières touches servent en effet pour entrer en mode de configuration, les autres servent en revanche pour changer les paramètres.
La procédure pour entrer en mode de configuration est la suivante : pressez et maintenez en même temps les touches “Reset” et “Config” pendant quelques secondes après l’émission d’un bip par le haut-parleur du circuit, relâchez “Config” et vous entrez en mode de configuration. Si vous pressez l’une des 5 autres touches, les paramètres correspondants se modifient : à chaque modification, la valeur courante est soulignée par la voix du guide dans le haut-parleur. Quand la configuration est terminée, appuyez sur “Reset” et vous retournez au fonctionnement normal.
Comme on l’a vu, pour exécuter l’identification de chaque personne, le microcontrôleur utilise 3 modèles de mots prononcés. Pour mémoriser ces modèles, une procédure de “Training” (entraînement) est disponible : l’usager prononce chaque mot deux fois. Le VE-IC réalise ensuite le modèle de comparaison grâce aux deux modèles qu’il vient d’obtenir.
Pour entrer dans le mode “Training”, on utilise à nouveau les 7 touches : dans ce cas cependant, la fonction de chaque touche change. Le “Reset” a toujours la même fonction mais les autres touches identifient le numéro de l’usager. La touche SL identifie l’usager 1, la touche SD l’usager 2, la touche “Impulse/Toggle” le 3 et enfin “Time Impulse” le 4.
La procédure d’activation de l’entraînement est la suivante : pressez “Reset” en même temps que la touche identifiant le numéro de l’usager, puis relâchez “Reset” en maintenant l’autre touche appuyée quelques secondes après le bip : une voix guide l’usager dans la mémorisation des modèles vocaux, elle demande de prononcer 3 mots et de répéter chacun deux fois. En outre, si un mot n’est pas échantillonné correctement, le VE-IC demande qu’on le répète.
Est disponible, en plus, une procédure utilisée pour effacer de la mémoire les 3 modèles correspondant à un usager particulier. Pressez “Reset” en même temps que la touche de l’usager en question, relâchez ensuite “Reset” et, un instant après le bip, relâchez la touche de l’usager : ses 3 modèles sont effacés.
Pour communiquer avec les usagers externes, le “Voice Password” utilise une interface constituée de 3 LED (verte, jaune et rouge) et d’un haut-parleur. La LED verte indique que le circuit est alimenté et qu’il fonctionne correctement, la LED jaune est en revanche allumée chaque fois qu’un mot est reconnu (attention : elle ne l’identifie pas comme mot déjà présent en mémoire mais le reconnaît seulement comme modèle valide). La LED rouge est reliée au relais de sortie et elle indique s’il est excité ou non. Enfin, le hautparleur est utilisé par la voix du guide. Comme entrées, outre les touches que nous avons analysées, on a un microphone, utilisé pour convertir le signal vocal en un signal de tension et le connecteur IN, utilisé dans le cas où l’on sélectionne le mode “Input” pour le paramètre “Input/CL”.

Le schéma électrique
Le coeur du circuit (figure 1) est le module RCS300, capable de commander le microphone d’entrée et le haut-parleur de sortie et de s’interfacer avec les 7 touches de configuration, avec le relais de sortie, avec les LED et avec le connecteur IN. Le signal vocal analogique de sortie est fourni par la broche DAC-OUT : avant d’être envoyé au haut-parleur, il est amplifié par l’amplificateur U3 (TBA820M).
Le trimmer R6 permet en revanche de faire varier le volume de sortie, ce qui permet éventuellement de couper le haut-parleur. Le microphone d’entrée est en revanche relié au port MIC-IN à travers le circuit R12/C14 : si on fait varier leurs valeurs, il est possible de modifier le gain du microphone en fonction de la distance microphone/usager. Nous avons choisi 1 kilohm et 10 nF et c’est idéal pour moins de 25 cm.
Le relais de sortie est relié au port P0-2 du VE-IC : on a cependant ajouté un transistor de commande T3. La valeur du connecteur IN, à travers T1, est en revanche reportée au port P0-3.
Le circuit prévoit une alimentation 12 Vcc, utilisée pour le relais. Un premier régulateur de tension U2 7809 fournit le 9 V utilisé pour alimenter le bloc U3, le connecteur IN et la LED LD2 jaune. Un second régulateur U1 LM317 fournit le 3 V utilisé pour alimenter le module VE-IC.

Figure 1 : Schéma électrique de la commande vocale.

Liste des composants
R1 = 1 kΩ
R2 = 200 Ω 1 %
R3 = 300 Ω 1 %
R4 = 22 kΩ
R5 = 22 kΩ
R6 = 47 kΩ trimmer
R7 = 150 Ω
R8 = 56 Ω
R9 = 1 Ω
R10 = 1 Ω
R11 = 100 Ω
R12 = 1 kΩ
R13 = 10 kΩ
R14 = 4,7 kΩ
R15 = 1 kΩ
R16 = 10 kΩ
R17 = 1 kΩ
R18 = 10 kΩ
R19 = 47 kΩ
R20 = 10 kΩ
C1 = 100 nF multicouche
C2 = 100 nF multicouche
C3 = 100 nF multicouche
C4 = 470 μF 25 V électrolytique
C5 = 220 μF 16 V électrolytique
C6 = 220 μF 16 V électrolytique
C7 = 100 nF 63 V polyester
C8 = 100 μF 25 V électrolytique
C9 = 47 μF 25 V électrolytique
C10 = 220 pF céramique
C11 = 220 μF 16 V électrolytique
C12 = 100 nF 63 V polyester
C13 = 220 μF 16 V électrolytique
C14 = 10 nF 100 V polyester
C15 = 10 μF 63 V électrolytique
C16 = 100 nF multicouche
LD1 = LED verte 5 mm
LD2 = LED jaune 5 mm
LD3 = LED rouge 5 mm
U1 = LM317
U2 = 7809
U3 = TBA820M
U4 = Voice Extreme Module
T1 = BC547
T2 = BC547
T3 = BC547
RL1 = Relais miniature 12 V
MIC = Capsule microphone
SPK = Haut-parleur 8 Ω 1W

Divers :
1 Support 2 x 4
7 Micro-poussoirs
5 Borniers 2 pôles
1 Bornier 3 pôles
2 Connecteurs 17 pôles au pas de 2,54 mm
4 Entretoises 10 mm
4 Boulons 3MA 5 mm


Figure 2a : Schéma d’implantation des composants de la commande vocale.

Figure 2b : Photo d’un des prototypes de la platine de la commande vocale.

Figure 2c : Dessin, à l’échelle 1, du circuit imprimé de la commande vocale.

Figure 3 : Le module Voice Extreme.

Le cerveau du circuit dans son ensemble est le circuit intégré Voice Extreme IC disponible monté sur un petit module où trouve place aussi le mémoire “flash” contenant le programme de notre Mot de passe Vocal et les données utilisées par celui-ci. Le VE-IC est un microcontrôleur à 8 bits programmable en C, caractérisé par le fait qu’il peut remplir la fonction de reconnaissance de la parole. L’article traite ce module comme une “boîte noire”, un bloc du schéma électrique auquel correspond un connecteur à 34 broches. La broche 15 reçoit la tension d’alimentation (entre 2,85 et 3,3 V) : contrôlez, avec un multimètre, que la tension sur cette broche du support est bien dans ces limites. Les broches 1, 2, 3, 7, 8, 33 et 34 vont à la masse. La broche 6 (DAC-OUT) est la sortie du signal vocal : le signal sort au format analogique mais le microcontrôleur est déjà doté d’un convertisseur analogique/ numérique interne. La broche 4 (MIC-IN) est l’entrée du signal provenant du microphone. Parmi les broches restantes nous avons utilisé les lignes de I/O suivantes : les ports compris entre P1-0 (broche 25) et P1-5 (30) sont reliés aux 6 poussoirs externes, le port RST (14) est en revanche connecté au poussoir “Reset”. Le port P1-6 (31) est utilisé pour commander la LED LD2, le port P0-2 (19), enfin, comme “output” pour commander le relais et le port P0-3 (20) comme entrée pour le connecteur IN.

La réalisation pratique
Une fois que l’on a réalisé le circuit imprimé (la figure 2c en donne le dessin à l’échelle 1), ou qu’on se l’est procuré, on monte tous les composants dans un certain ordre en regardant fréquemment la figure 2 a et b et la liste des composants.
Montez tout d’abord les supports du circuit intégré U3 et le connecteur à 2 x 17 pôles au pas de 2,54 du VE-IC U4 : vérifiez bien les soudures (ni court-circuit entre pistes et pastilles, ni soudure froide collée). Montez toutes les résistances sans les intervertir et en distinguant bien les deux à 1 % R2 et R3 (elles sont différentes des 1/4 de W ordinaires à 5 %). Montez le trimmer R6 en haut à droite. Montez tous les condensateurs en respectant bien la polarité des électrolytiques (la patte la plus longue est le +).
Montez les deux régulateurs U1 et U2, debout, sans les confondre et semelle métallique tournée vers C3 pour U1 et C2 pour U2. Montez les 3 transistors BC547 méplat repère-détrompeur orienté dans le bon sens indiqué par la figure 2a.
Montez le relais miniature 12 V RL1.
Montez les 7 micro-poussoirs au bord droit de la platine. Montez les 5 borniers sur le bord gauche : un à 3 pôles pour la charge, un à 2 pôles pour le haut-parleur, un à 2 pôles pour le microphone, un à 2 pôles pour l’entrée IN et un à 2 pôles pour l’alimentation PWR.
Montez le bornier à 2 pôles restant LD2 en bas à droite.
Montez les 3 LED rouge, jaune et verte en respectant bien la polarité (la patte la plus longue est le +).
Vous pouvez maintenant enfoncer U3 dans son support, en orientant bien son repère-détrompeur en U dans le sens indiqué par la figure 2a, soit vers R7 et mettre en place le module VE-IC U4.
Installez les périphériques externes : microphone MIC, haut-parleur SPK, interrupteur IN et alimentation. Pour cette dernière, attention à la polarité +/–.
Pour l’interrupteur, souvenez-vous qu’il met la platine sous tension lorsque les deux pôles sont court-circuités. Sur le bornier à 3 pôles (sorties relais), montez la charge (serrure électrique par exemple). Le montage est terminé.
Connectez l’alimentation externe 12 Vcc au bornier PWR : la LED verte s’allume.
Pressez “Reset” : si tout a été monté correctement, vous pouvez commencer l’entraînement et mémoriser les modèles de comparaison.

L’entraînement vocal
Notre appareil utilise la technologie de reconnaissance Speaker Dependent, capable de reconnaître des mots de passe préalablement appris au moyen de la procédure “Training”. Chaque mot provenant du microphone est converti par Voice Extreme en une séquence de données numériques mémorisées dans la mémoire “fl ash” sous le nom de “templates” (modèles). Etant donné que chaque modification de l’état de la sortie est produite par la reconnaissance d’une suite de trois mots et comme le dispositif prévoit 4 utilisateurs différents au maximum, les “templates” nécessaires pour notre appli cation sont au maximum 12. Le premier des trois mots est utilisé pour distinguer les quatre usagers, les deux autres pour un contrôle supplémentaire de sécurité. Nous avons vu déjà comment réaliser la procédure d’entraînement vocal. Voyons ici quelques règles de base pour obtenir le meilleur fonctionnement possible du dispositif :
- Le microphone a été réglé pour une distance usager/MIC inférieure à 25 cm. Il est conseillé, par conséquent, de respecter cette contrainte, tout en se souvenant cependant de maintenir une distance de quelques centimètres entre les lèvres et le microphone, sans quoi le signal serait distordu et échantillonné de manière erronée. De plus, parler toujours face au microphone.
- Effectuer les enregistrements dans un silence absolu, aucun bruit ambiant.
Bien que le dispositif soit capable de reconnaître les mots, même avec un certain bruit de fond, la phase d’entraînement est la plus délicate et la réaliser avec un bruit de fond ne permettra pas ensuite une identification plus sûre.
- Eviter d’interposer des objets entre lèvres et microphone, car cela pourrait altérer le signal vocal.
- Ne pas superposer la prononciation du mot à reconnaître à celui du guide vocal : attendre environ une seconde après que le dispositif ait prononcé le Prompt, le silence n’est pas enregistré.
- Parlez sur le ton le plus naturel et le plus normal possible, ni trop lentement ni trop rapidement - Ne pas utiliser des monosyllabes ou des dissyllabes, car cela pourrait rendre difficile la création des modèles vocaux par le circuit.
Si le “training” est exécuté en respectant ces quelques règles, le bon fonctionnement de notre dispositif vocal vous laissera muets d’étonnement !

Les modes “INPUT” ou “Continuous Listening” (écoute continue)
Le dispositif se caractérise par deux modes différents de fonctionnement : “Input” ou “Continuous Listening”.
Dans le premier mode, le circuit ne commence la procédure de vérification vocale qu’après la fermeture de l’interrupteur IN. Ce type de fonctionnement a été conçu pour réaliser, par exemple, un contrôle d’accès domestique : quand le poussoir du carillon de porte est pressé, le VE-IC s’active et réclame les trois mots de passe d’entrée. Ou bien, l’entrée IN peut être reliée à un détecteur optique reconnaissant la présence d’une personne et elle active alors le microcontrôleur.
En revanche, en mode CL, le module RCS300 est toujours en attente d’un signal vocal provenant de l’entrée du microphone : quand la prononciation d’un mot est détectée, elle est analysée et ensuite comparée avec les modèles présents en mémoire.

À Découvrir

Schema Electronique