Genaue Spracherkennung
Dieses Tool transkribiert hochpräzise Texte aus gesprochener Diktation und ist sowohl in der kostenlosen als auch in der kostenpflichtigen Version von Word auf jeder wichtigen Computerplattform enthalten. Diese App ist auf umfangreiches branchenspezifisches Vokabular trainiert, was sie für Nutzer mit speziellen Bedürfnissen und der Bereitschaft, sie auf ihre Stimme zu trainieren, zu einer lohnenden Zusatzinvestition machen kann.
Sie funktioniert nicht auf Macs. Diktiersoftware ist nur dann nützlich, wenn sie genau das tippt, was Sie sagen. Es sollte einfach sein, mit so wenigen Schritten wie möglich mit der Diktation von Text zu beginnen, idealerweise in der Software, in der Sie am häufigsten mit Text arbeiten.
Diktiersoftware sollte Befehle für Satzzeichen, Absatzumbrüche und andere Formatierungen enthalten, um verwendbare Texte vollständig per Sprache zu erstellen. Die meisten Diktierprogramme sind für eine einzelne Plattform gebündelt oder dafür entwickelt.
Herausragende Diktierprogramme sind plattformübergreifend nutzbar. Microsoft Word Dictate transkribiert Texte über eine Reihe von Akzenten hinweg mit hoher Genauigkeit und schreibt medizinische Begriffe und weniger gebräuchliche Wörter korrekt, und das besser als die meisten Konkurrenzprodukte.
Es unterstützt 34 Sprachen, enthält Befehle für Satzzeichen, Emojis und andere häufig verwendete Sonderzeichen und ermöglicht Ihnen die Formatierung und Navigation von Texten mit Sprachbefehlen. Dieses Tool erfordert eine Internetverbindung, funktioniert nicht in anderen Programmen als Word und anderen Microsoft-Programmen und enthält keine Werkzeuge zum Trainieren auf neues Vokabular.
Trotz dieser Einschränkungen machen seine Genauigkeit, sein Preis und seine plattformübergreifende Verfügbarkeit es zur besten Diktiersoftware für die meisten Menschen. Nuance Dragon Professional Anywhere ist eine eigenständige Diktiersoftware, die seit einiger Zeit kommerziell erhältlich ist.
In unseren Tests war sie bei der ersten Verwendung weniger genau als andere Diktierprogramme, aber im Gegensatz zu unserer Top-Auswahl lernt sie Ihre spezifische Stimme und Sprachmuster durch Wiederholung, sodass sich die Ergebnisse mit der Nutzung verbessern.
Diese Lernfähigkeit, gepaart mit seinem umfangreichen integrierten Vokabular und branchenspezifischen Editionen, z. für das Gesundheitswesen, die Strafverfolgung und Juristen, macht Dragon zu einem festen Bestandteil für professionelles Diktieren.
Dragon Professional Anywhere enthält auch eine Funktion für benutzerdefinierte Wörter, mit der es einzigartige Vokabulare, einschließlich Namen und Markentermini, versteht, und seine Windows-Version unterstützt Formatierungsbefehle, die anwendungsübergreifend funktionieren.
Ich teste und schreibe seit einiger Zeit professionell über Software. Jeder kann von Diktiersoftware profitieren. Kurze Sprach-zu-Text-Interaktionen erfordern keine spezielle Software. Dieser Leitfaden richtet sich an Personen, die Diktate professionell nutzen, um Absätze oder Seiten Text per Sprache zu tippen.
Dazu gehören Menschen mit Behinderungen, die auf Diktiersoftware zum Tippen angewiesen sind, Menschen mit beruflichen Herausforderungen, die das Tippen erschweren, wie z. Ärzte in einem klinischen Umfeld, und Menschen, die ihren Fingern und Handgelenken bei der Arbeit eine Pause gönnen möchten.
Wir haben Diktierprogramme getestet, indem wir sowohl zuvor getippten Text vorgelesen als auch kürzere, spontane Texte diktiert haben, einschließlich Antworten auf E-Mail-Nachrichten. Beides sind legitime Anwendungen für solche Software, obwohl Sie möglicherweise mehr Tippfehler feststellen, wenn Sie Diktate verwenden, um einen ersten Entwurf zu erstellen, da Menschen selten so klar oder korrekt sprechen, wie sie schreiben.
Wir haben uns nicht darauf konzentriert, Diktierwerkzeuge zur vollständigen Computersteuerung zu nutzen, was etwas ist, auf das Menschen mit motorischen Behinderungen zur Navigation auf ihren Computern per Sprache angewiesen sind.
In diesem Leitfaden vermerken wir jedoch, wo diese Funktionen verfügbar sind. Wenn Sie bereits aufgenommene Audiodaten transkribieren müssen oder ein Meeting mit mehreren Teilnehmern live transkribieren müssen, schauen Sie sich unseren Leitfaden zu den besten Transkriptionsdiensten an; diese Tools eignen sich besser, um Aufnahmen in Text umzuwandeln.
Dieser Leitfaden konzentriert sich auf die Eingabe von Text in Ihren Computer oder Ihr Telefon und dessen Echtzeit-Transkription. Tatsächlich war in unserer jüngsten Testrunde jedes Diktatmodell genauer als noch vor drei Jahren. Anstatt Wort für Wort zu tippen, tippt die meisten Diktierprogramme heute in Stößen und fügt Sätze und Phrasen hinzu, während sie die Bedeutung aus dem Kontext ableiten und gelegentlich zurückgehen, um bereits getippten Text zu bearbeiten.
Das Endergebnis ist, dass die Diktation im Allgemeinen mit zunehmender Nutzung genauer wird, aber außer Kontrolle geraten kann, wenn sie falsch rät. Wie ChatGPT und andere große Sprachmodelle wird Diktiersoftware sowohl durch ihre Trainingsdaten angetrieben als auch durch diese eingeschränkt.
OpenAI Whisper ist ein Paradebeispiel. Es wurde auf 14 Millionen Stunden englischer Sprache trainiert, aber nur 100.000 Stunden aller anderen Sprachen zusammen. Eine Studie zu Sprach-zu-Text-Tools von Amazon, Apple, Google, IBM und Microsoft ergab, dass die durchschnittliche Wortfehlerrate für afroamerikanische Sprecher fast doppelt so hoch war wie die von weißen Sprechern.
Es wurden Verbesserungen mit größeren Trainingsdatensätzen erzielt, doch eine Studie, die im Journal of the Acoustical Society of America veröffentlicht wurde, ergab, dass die OpenAI Whisper-Diktation für Sprecher mit nicht-englischen Akzenten immer noch zwei- bis dreimal weniger genau war.
Solche Schwierigkeiten erstrecken sich auf Menschen mit Sprachstörungen, da Stottern und andere Arten von unterbrochenen oder unvorhersehbaren Sprechmustern es schwierig machen, brauchbare Texte auf einen Computer zu diktieren. Und die Fehlerraten werden wahrscheinlich weiter sinken, da diese Modelle zusätzliche Daten sammeln.
Für diesen Leitfaden berücksichtigten wir die Kernanwendungen der Diktion und untersuchten, wie sich Diktiersoftware seit der vorherigen Ausgabe dieses Leitfadens im Jahr 2023 verändert hat. Diese Quellen halfen uns bei der Identifizierung, welche Diktiersoftware wir testen und welche Funktionen wir priorisieren sollten, darunter die folgenden:.
Wir haben jeden Dienst mit denselben Textskripten getestet, wobei wir sowohl integrierte On-Device-Mikrofone als auch Headsets mit Mikrofonen in Büroumgebungen verwendet haben, darunter die folgenden:. Wir haben während der Tests gesprochene Satzzeichen verwendet und vermerkt, wo die Software korrekt Punkte, Absätze und mehr gemäß Anweisung hinzufügte.
Und wir haben vermerkt, wo die Diktiersoftware anders funktionierte, einschließlich, ob sie Wörter sequenziell tippte oder ganze Sätze auf einmal hinzufügte. Anschließend verglichen wir die Fehlerraten basierend auf dem endgültigen, besten Diktierergebnis jedes Testskripts und zählten falsche oder fehlende Wörter, um die Genauigkeit zu vergleichen.
Die Diktierfunktion in Microsoft Word ist die beste Diktiersoftware für die meisten Menschen. Obwohl grundlegende Diktierfunktionen seit Jahren in Word enthalten sind, hat Microsoft in letzter Zeit einen stärkeren Fokus auf Diktate auf seinen Plattformen gelegt.
Das Unternehmen erwarb Nuance, den Hersteller der Dragon-Diktier-Software, im Jahr 2022. Seitdem hat es die Diktierfunktion unter Windows überarbeitet, eine neue Funktion namens Windows Voice Access in Windows 11 eingeführt und zahlreiche Office-Diktat-Updates hinzugefügt, darunter zuletzt eine überarbeitete Diktat-Symbolleiste in Word.
Diese Bemühungen haben sich ausgezahlt. Das Starten der Diktion erfordert einen einzigen Klick. Während der Diktion können Sie weiterhin tippen, um Fehler zu korrigieren, oder den Cursor dorthin bewegen, wo Sie Text hinzufügen möchten. Und Sie können das Diktat-Tool im Hintergrund laufen lassen, bereit, mit der Spracheingabe zu beginnen, wann immer Sie wieder sprechen.
Es behält auch den zuletzt transkribierten Text in einer helleren grauen Schrift bei und korrigiert gelegentlich, was es basierend auf neuen Kontextinformationen getippt hat. Das sorgt für insgesamt deutlich genauere Diktate, insbesondere bei längeren Absätzen.
Es kann aber auch manchmal schiefgehen, indem es etwas korrekt tippt, dann aber zurückgeht und diesen Text falsch bearbeitet. Die Diktierqualität verbessert sich, je mehr Sie es verwenden. Wenn unsere Tester einzelne Wörter oder Phrasen diktierten, funktionierte die integrierte Diktion unter iOS und Gboard unter Android beide tendenziell besser als die von Microsoft Word.
Als wir jedoch Absätze diktierten, schnitt Microsoft Word regelmäßig besser ab, wobei sich die Diktierqualität im Laufe der Zeit verbesserte. Es zeichnet sich durch die Transkription einer Vielzahl von Akzenten aus. Und es funktionierte auch in mäßig lauten Umgebungen gut, z.
B. wenn wir direkt auf einem Telefon in einem Bahnhof diktierten. Satzzeichen- und Formatierungsbefehle funktionieren nach einer Pause besser. Sie können kontinuierlich sprechen, die Satzzeichen verbalisieren und sofort mit dem nächsten Satz oder der nächsten Phrase fortfahren – aber wenn Sie dies tun, erhalten Sie eine etwas höhere Fehlerrate bei Satzzeichen, insbesondere bei neuen Absätzen.
Für beste Ergebnisse pausieren Sie nach dem Verbalisieren der Satzzeichen, damit Word aufholen kann, bevor Sie einen neuen Abschnitt diktieren. Sie können Diktate in Echtzeit mit Sprachbefehlen bearbeiten. Ähnliche Befehle dienen zum Auswählen von Wörtern oder Absätzen, zum Hinzufügen oder Entfernen von Formatierungen, zum Erstellen von Listen, zum Hinzufügen von Kommentaren und zum Stoppen der Diktion.
Es neigt dazu, Slang in standardmäßigeres Englisch zu korrigieren. Es enthält Datenschutzfunktionen. Das Windows-Diktatool, ebenfalls von Microsoft bereitgestellt, ermöglicht es Ihnen, Ihre Audioaufnahmen für Trainingszwecke zu verwenden.
Wenn Sie dies zulassen, werden Ihre Diktataufzeichnungen laut Microsoft auch anonymisiert. Die Diktion pausiert, wenn Sie die Anwendung wechseln. Wenn Sie Anwendungen oder Tabs in Ihrem Browser wechseln, stoppt die Diktion. Sie müssen in Word tippen.
Aber Sie haben keine Möglichkeit, Wörter zu Dictate hinzuzufügen oder es auf benutzerdefiniertes Vokabular zu trainieren. Ordnungszahlen sind problematisch. Letztendlich ist Dragon mehr, als die meisten Menschen benötigen oder ausgeben wollen. Die Ausnahme sind Personen, die Wörter mit fortgeschrittenem Vokabular diktieren, wie z.
B. im juristischen, medizinischen oder strafverfolgungstechnischen Bereich. Es gibt drei Versionen. Dragon Professional ist eine eigenständige Windows-Diktier-Software, die offline läuft. Dragon Professional Anywhere ist eine Windows-Diktier-Software, die diktiertes Audio online in Text umwandelt; dies ist die Kernversion, die Nuance heute bewirbt.
Keine Edition von Dragon funktioniert auf Macs. Die Desktop-Versionen bieten auch branchenspezifische Unterstützung für Anwälte und medizinische Fachkräfte, die jeweils auf ein breiteres Vokabular trainiert sind. Dragon Anywhere benötigt eine Internetverbindung, um Text zu transkribieren.
Genaues Tippen erfordert Zeit und Übung. Daher wird Dragon pro Benutzer lizenziert. Seine Diktion funktioniert in jeder Anwendung auf einem Windows-Computer. Wenn Sie auf das Mikrofon klicken, beginnt Dragon zuzuhören, und dann – im Gegensatz zu Dictate, das nur in Word selbst tippt – können Sie überall auf Ihrem Computer klicken und sprechen, um zu tippen.
Sie können Dragon verwenden, um Formulare auszufüllen, Daten in CRM-Software einzugeben oder E-Mails zu beantworten. Oder in Microsoft Word und anderen Textverarbeitungsprogrammen mit Standard-Tastenkombinationen können Sie Dragon-Befehle verwenden, um standardisierte Formatierungen hinzuzufügen.
Dragon kann auch Befehle verstehen, um eine E-Mail in Outlook zu senden, ein Dokument in Word zu drucken oder bestimmte Anwendungen zu öffnen, wenn Sie Auto-Texte erstellen (mehr dazu weiter unten). Stattdessen wartet Dragon darauf, dass Sie aufhören zu sprechen, und fügt dann den vollständigen Satz in einem Durchgang ein.
Sie können neues Vokabular zum Wörterbuch hinzufügen und es auf Ihre Aussprache trainieren. Sie können ein neues Wort sprechen, um Dragon zu trainieren, und Sie können auch eine Ausspracheanleitung eingeben – eine Funktion, die auch zum Hinzufügen benutzerdefinierter Abkürzungen dienen kann.
Es kann Text basierend auf Befehlen tippen. Ähnlich wie bei Text-Expander-Software ist Dragon Auto-Texte eine zeitsparende Funktion, die mehrere Textzeilen eingeben oder andere Aufgaben basierend auf einem einzigen, gesprochenen Befehl ausführen kann.
Es funktioniert auf Mobilgeräten – aber mit eingeschränkter Funktionalität. Die Dragon Anywhere App für iOS und Android verwendet die gleichen Diktier-Modelle wie die Desktop-Versionen, um Text auf Ihrem Telefon zu transkribieren. Obwohl sie die gleichen Vokabellern- und Auto-Text-Funktionen enthält, läuft Dragon Anywhere nur innerhalb der Dragon-App.
Um den erzeugten Text zu teilen oder zu veröffentlichen, müssen Sie in Dragon Anywhere diktieren und den Text dann in eine andere App kopieren und einfügen. Die App enthält jedoch eine spezielle Schaltfläche zum Kopieren, um das Teilen zu vereinfachen.
Audio und transkribierter Text werden während der Übertragung und im Ruhezustand verschlüsselt.