Sprachschalter SLS6E

Fernschalten mit Sprache

Für das Schalten mit Sprache aus der Entfernung benötigt man besondere akustische Vorverarbeitungsverfahren. Eine gute Sprachfernschalttechnik zeichnet sich durch drei besondere Eigenschaften aus:

  • Sie ist sehr robust gegenüber Klangänderungen.
  • Sie ist in der Lage, ein gegebenes Kommando sicher vom vorhandenen Hintergrund, der aus Sprache, Musik und anderen Geräuschen bestehen kann, zu unterscheiden.
  • Sie verursacht keine ungewollten Schaltvorgänge, obwohl sie non-stop aktiv ist.

Toleranz gegen Klangänderungen

Wie sich etwas anhört, hängt stark davon ab, wo sich die Quelle befindet. Das liegt vor allem daran, dass der Schall viele verschiedene Wege nimmt, und dabei verschieden oft reflektiert wird. Jede Reflektion nimmt dem Schall etwas von seiner Energie. Zusammen mit den unterschiedlichen Laufzeiten bewirkt das einen Effekt, den man Nachhall nennt.

Unsere Sprachfernschalttechnik ist auf Grund ihres Funktionsprinzips vollkommen immun gegen Nachhall. Das ermöglicht eine freie Bewegung im Raum und hat weiterhin den positiven Nebeneffekt, dass der Benutzer auch dann noch erkannt wird, wenn er sich erkältet hat.

Erkenner und Klassifikatoren

Es macht einen großen Unterschied, ob man etwas wirklich erkennen möchte oder sich nur zwischen mehreren bekannten Alternativen zu entscheiden braucht. Zur Verdeutlichung ein Beispiel:

 

Stellen Sie sich vor, jemand erhält eine Zitrone, kennt aber nur Äpfel und Birnen. Ist die Zitrone eine Birne, nur weil die Birne ebenfalls gelb ist? Nein, aber da dieser jemand nie zuvor eine Zitrone gesehen hat, wird er sich wohl eher für die Birne entscheiden.

Unsere Sprachlichtschalter sind daraufhin optimiert ein einzelnes eingegebenes Geräusch zu erkennen. Sie entscheiden sich nicht für eine von vielen Alternativen, so wie es bei Spracherkennungsanwendungen mit hinterlegten Sprachdatenbanken der Fall ist.

Sprecherunabhängigkeit

Sprecherunabhängigkeit bedeutet, dass eine Spracherkennungstechnologie sofort von jedem benutzt werden kann. Für unsere Sprachlichtschalter würde das zur Folge haben, dass sie mit einem fest vorgegebenen Kommando ausgeliefert werden müssten. Das ist natürlich nicht sinnvoll. Insbesondere dann nicht, wenn mehrere Schalter verwendet werden sollen.

Aus diesem Grund überlassen wir es dem Benutzer, ein Schaltkommando durch Vorsprechen einzugeben. Damit ist unser Sprachlichtschalter eigentlich nicht sprecherunabhängig, obwohl er aufgrund seiner hohen Klangrobustheit Personen mit ähnlicher Sprechweise (nicht Stimmlage sondern Diealektfärbung) in der Regel akzeptiert. Falls diese Toleranz nicht ausreicht, kann eine Aussprachevariante auch als Alternativkommando abgespeichert werden. Gleichzeitig können bis zu drei verschiedene Kommandos aktiv sein.

Störgeräuschtoleranz

Eine hohe Toleranz gegenüber Störgeräuschen ist wünschenswert.

Störgeräusche überlagern sich mit dem Kommando, das erkannt werden soll. Der Schalter hat daher die Entscheidung zu treffen, ob es sich bei Kommando plus Störung noch um das zu erkennende Kommando oder schon um etwas anderes handelt. Aus diesem Grund ist die Störgeräuschtoleranz unserer Schalter begrenzt. Leises Hintergrundgeräusch stellt kein Problem dar, sofern das Schaltkommando deutlich lauter ist.

Ungewollte Erkennungen

Unsere Sprachlichtschalter sind sehr robust. Bei Kommandos mit genügend vielen Silben treten praktisch niemals Fehlerkennungen auf, selbst wenn Sie gerade eine Party feiern, fernsehen oder sich mit jemanden unterhalten.

Warum ist jedoch die Silbenanzahl von Bedeutung? Der Grund ist, dass die Wahrscheinlichkeit ein ähnliches Geräusch zu hören, mit zunehmender Länge des Kommandos dramatisch absinkt. Dieser Effekt nennt sich "Kombinatorische Explosion" und wird beispielsweise auch bei der Verschlüsselung von Daten ausgenutzt.