ロシア語での Windows 7 コンピューターの音声コントロール。 タイプ - コンピューターの音声制御

今日は私たちのスピーチについて話します。 私はあなたを望む 音声でコンピュータを制御する、指を使わずに? そして、彼らが言うように、思考の力で! 確かに、私たちは思考の力でコンピューターを制御することはできませんが、声の力を使えばそれは十分に可能です。

典型的なプログラムは、音声でコンピュータを制御するためのこれまでで最高のプログラムの 1 つです。 この番組へのコメントサイトでは、意見が集まります。

確かに、欠点もあります。 しかし、それについては後で詳しく説明します。 ちなみに、興味があれば私のレビューを読んでください。

プログラムはここからダウンロードできます: http://freesoft.ru/type

それの使い方? まず、それを起動して、メインのコントロール ボタンを見てみましょう。

プログラムは私たちを歓迎し、すぐに Typle の使用方法に関するヒントを提供します。 まず、「追加」ボタンをクリックして、「開く」などの単語を書き留めます。 これを行うには、マイクに向かって次の単語を言ってみましょう。

次に、「追加」をクリックします。 そこで、「開く」という単語を音声でプログラムに保存しました。 マイクに向かって他の言葉を話すこともできます。 重要なことは混乱しないことです。

次のステップはコマンドを追加することです。 これを行うには、次の点に進みましょう。

次に、必要な項目の横にあるボックスをチェックします。

プログラム、アプリケーション、またはアクションを選択し、赤い記録ボタンをクリックします。 コンピューターが私たちの音声を受け入れた場合は、「追加」をクリックします。

これで、プロフィールに音声コマンドが 1 つ表示されるようになります。 で この場合 7-Zip を開くもの:

そして最後の「会話を開始」ボタンをクリックすると、

「セブンジップを開けて」という言葉があります。 私の場合、すべてうまくいきます。 7-zip プログラムが開きます。 このフレーズを覚えておいてください: 自分自身を開いてみましょう? これはほぼ同じものです。

プログラムは常に適切に動作するとは限りません。 現在、強力なロシア語は言語学者プログラマーによって十分に研究されていません...しかし、コンピューターがあなたの言うことを聞いてくれるのは、それでも素晴らしいことです。

したがって、テストや平凡な好奇心には、Typle プログラムが 100% 適しています。

このビデオでは、最初の音声エンジンの作成の歴史と、他に取り組む必要があるものを見ることができます。

このプログラムの他の類似物には、Gorynych、Perpetuum、Dictograph、Voice Commanderなどの恐ろしい名前があります。 しかし、それらはすべて「間違い」です。 彼らは価値のあるプログラムに対する批判を受け入れません。

このプログラムをマスターするのに 5 分かかりました。 これはかなり長い時間です (ほとんどの場合、このようなプログラムは 1 ~ 2 分で理解できます)。 ご質問がございましたら、お書きください。 友達、また会いましょう:)!

ハンズフリー、つまりキーボードやマウスに触れずに声だけを使って制御することを望まないコンピューター ユーザーがいるでしょうか。 そして、障害を持つ人々にとって、この機能はまさにかけがえのないものです。 Windows 7 のオリジナル (ロシア語化されていない) バージョンにはこの機能がありますが、英語の音声のみを対象として設計されています。 ただし、ロシア語版の Windows 7 では、Windows 7 を実行しているコンピューターを音声で制御する機能を導入できます。 これを行うためのサードパーティ プログラムがいくつかあります。

これは、Windows 7 コンピュータの音声コントロール用の最も一般的なユーティリティの 1 つで、インターネットからダウンロードできます。 無料と有料 (プレミアム) の 2 つのバージョンがあります。 以下では無料版について説明します。

プログラムを起動すると、メイン ウィンドウが表示されます。

ここで、ユーザー名とコマンドのテキスト内容を指定する必要があります。 次に、赤いボタン (録音) を押して、マイクに向かって目的のコマンドを言う必要があります (例: 「ジップ セブンを開いて」)。 次に「追加」ボタンをクリックします。 これらのアクションにより、ユーティリティ内の制御コマンドのサウンド イメージが作成されます。

次のステップでは、指定したサウンド イメージをコンピュータ上の特定のプログラムまたはファイルにリンクします。 これを行うには、メイン ウィンドウの ボタンをクリックします。

そして、必要なボックスにチェックを入れます。

リストが表示されます インストールされているプログラムコンピュータで 7-Zip File Manager を選択する必要があります。 次に、「記録」と「追加」をクリックする必要があります。

この後、作成されたコマンドがメイン ウィンドウのユーザー プロファイルに追加されます。

あとは実装を確認するだけです。 これを行うには、メイン ウィンドウで [話し始める] をクリックし、大切にしているフレーズ「zip seven を開いてください。その後、7-zip ユーティリティが開きます。」を言う必要があります。

残念ながら、Typle がすべての場合においてロシア語の音声を正しく認識しているとは言えませんが、これはほとんどの音声認識プログラムの欠点です。

Windows 7 を搭載したコンピュータを音声制御するための Speechka プログラム

Speechka は、ロシア語を認識するシンプルで便利なプログラムです。 このユーティリティを使用すると、プログラム、ファイル、フォルダ、インターネット ページを音声で開いたり、インターネットを検索したりできます。 プログラムは無料で、ダウンロードとインストールが簡単です。

メイン ウィンドウは次のようになります。

ユーザーは意図に応じて、メイン ウィンドウのいずれかのボタンをクリックする必要があります。 いずれかをクリックすると、メイン ウィンドウの右側に音声コマンド パラメータを設定するためのウィンドウが表示されます。 たとえば、「インターネット」をクリックすると、次のようなウィンドウが開きます。

天気予報を含む Yandex ページを起動するために必要な設定がすでに表示されています。 「追加」ボタンをクリックした後、このコマンドを音声で入力する必要があります。 これは次のように行われます。 ホームページ、「Ctrl」と「Win」を同時に押してから、「天気」などの単語またはフレーズをマイクに向かって言い、キーを放す必要があります。 プログラム設定では、「Ctrl」+「Win」の組み合わせを使用するか、単にサウンドレベルによってサウンド録音をアクティブにすることができます。

ちなみに、このユーティリティは起動直後にマイクで動作を確認したり、マイクに向かって一言言うだけで音量を調整したりすることができます。 レベルインジケーターが反応しない場合は、マイクの接続に問題があるか、音量が不十分です。

開発、テスト、デバッグの段階にある Windows 10 用の Cortana インターフェイスがリリースされる前から、ユーザーはコンピューターの音声制御を整理しようとしていました。 今日の記事では、10 より前にリリースされた Windows でこのような機能を実装する方法について説明します。

コルタナ

Cortana は、Microsoft が Windows 10、Phone、Android 向けに開発した AI 音声アシスタントであり、このプロジェクトは XBox や iOS にもさらに配布されています。 従来の検索バーに代わるもので、主に情報やシステム コマンドの検索に関連する多くのアクションを実行し、音声コマンドの形式でユーザーからそれらを受け取ります。 Windows 10 への緊密な統合、(現時点では)ロシア語の欠如、Microsoft サーバーへの送信によるユーザーに関する事実上すべての情報の収集、および最終バージョンの欠如により、ほとんどのユーザーは完全な音声コントロールを取得できません。自分のコンピューター。

Cortana に加えて、ユーザーの音声コマンドを通じて PC を制御できるアプリケーションが多数あります。 Windows 7 および 10 でこの問題を解決するための最も一般的な製品を見てみましょう。

タイプ

このアプリケーションは、音声でコンピュータを制御したいロシア語を話すユーザーの間で主導的な地位を占めています。 このユーティリティは、Windows 10 上の Cortana の機能の重要な部分を簡単に置き換えることができ、「セブン」では、人々が声を使ってコンピューターを制御する映画でよくデモンストレーションされる機能が追加されます。

作業を開始する前に、アカウントを作成し、アプリケーションをアクティブにするキーフレーズを聞いて考え出します。 それから設定します 音声コマンドコンピューターを制御したり、特定のアクションを実行して操作を割り当てたりすること (アプリケーションの起動、指定されたサイトへの移動)。 作成したコマンドを編集するウィンドウでは、アプリケーションを起動するパラメータの設定や起動モード(フルスクリーン、ウィンドウ)を指定することが可能になります。

このユーティリティの機能は非常に限定されており、インターフェイスは Windows 10 に実装されている Metro スタイルとは程遠いものです。Typle を使用した PC の完全な音声制御は実装できません。ファイル、アプリケーション (引数付き) を開くこと、および事前定義されたリンクに従うことのみがサポートされます。 。 プレーヤーの制御 (一時停止、次のトラックの再生) もサポートされていません。

スピーカー

  • スクリーンショットを撮る。
  • キーボードレイアウトの切り替え。
  • Windows 7 をシャットダウンします。
  • アプリケーションを起動する。
  • ファイルを開いています。

マイクで受信した情報を読み取り、認識するプロセスは、特定のキーを押した後に開始されます (プログラムの誤検知を避けるために、使用頻度が最も低いボタンを選択することをお勧めします)。 音声の処理、認識、コマンドの実行には 5 秒以上と非常に時間がかかり、安さの代償としてそれを支払わなければなりません。 キーワードは単語ではなくテキストで指定されるため、認識された音声と入力されたテキストが比較されますが、これは理想とは程遠いものです。 アプリケーションにはプレーヤー コントロールはありません。

ゴルイニチ

Windows 7および10のコンピュータを管理するためのソフトウェアパッケージの開発者は、この種の問題を解決するためのアプリケーションをリリースした最初の国内チームです。 アプリケーションの中核は西側の「Dragon Dictate」で、ロシア語音声認識用の国産ソフトウェアモジュールが導入されました。

OS 開発者は、障害のある人だけでなく、障害のある人のために、コンピュータの音声制御を開発しました。 ユーザーは音声を使用して情報を入力できます。 特定の単語を発音すると、デバイスは音声認識を開始し、音声信号をデジタル情報に変換します。 入力された情報が正しく認識されると、プログラムは指定されたアクション アルゴリズムに進み、特定のコマンドに関連付けられた機能を実行します。

すべてはとてもシンプルです。 音声が常に正しく認識されるとは限らないため、解決するには 複雑なタスクオペレーティング システムを制御するために、コンピューターの音声制御プログラムは集中的に使用されません。 ファイルの開閉、ローカルおよびネットワークの検索などの基本的な機能を実行するために使用されます。

音声制御開発の歴史

  • 最初の音声認識システムであるオードリーは、20 世紀の 50 年代に作成されました。 彼女は一声で話された数字だけを解読しました。
  • 1962 年に、最初の単語認識システムが作成されました。 彼女は15の英単語を解読した。
  • コンピューターの発展に伴い、1990 年に Dragon Dictate プログラムが開発されました。 毎分最大 100 語を認識できましたが、高価でした。
  • 2000 年代初頭に、Google Voice Search 音声認識アプリケーションが iPhone に登場しました。 2010 年に、Android に検索システムが追加されました。
  • Siriが搭載されているのは、 ソフトウェア Phone 4S 2011 年 10 月初旬。
  • Windows の音声アシスタントである Cortana は 2014 年に導入されました。

現在の Cortana と音声入力機能

Cortana は、次の仮想アシスタントです。 オペレーティング·システムウィンドウズ。 このサービスは、ユーザーがタスクを計画するのに役立ち、タスクを思い出させます。
特定のリクエストに対して、このサービスは特定の情報を収集し、明確な構造を作成して、可能な限り最も処理された形式でユーザーに提示するのに役立ちます。
興味深いのは、仮想アシスタントをオンにするとすぐに、入力されたリクエストと個人データに関するすべての情報を収集し、個々のユーザーにできる限り適応しようとすることです。


仮想アシスタントを使用した Windows 7 コンピュータの音声制御は不可能です。これは 10 番目のバージョンにのみ統合されています。 しかし、残念なことに、開発者はわざわざロシア語版をリリースしませんでした。
主な役割は検索であり、10では「スタート」から開くことができます。 この関数は、ほぼすべてのリクエストを検出します。 エントリが認識されない場合は、ポップアップ ウィンドウに適切なコマンドを入力すると、コンピュータの音声制御プログラムがテキスト情報を読み上げます。

不快なのは、キーボードから入力されたすべてのデータを収集し、Microsoft に送信することです。

サードパーティのプログラム

タイプ

インストールが完了したら、次のステップであるアカウントの作成に進みます。 ここでキーフレーズを考え出す必要があります。その後、アクティベーション通知が鳴ります。


次に、目的に関係なく、音声コマンドを考え出して作成する必要があります。 「dog」コマンドは、アプリケーションを起動したり、まったく異なるアクションを実行したりできます。




音声コマンドを作成し、それを特定のアクションに割り当てるだけです。 ファイルやフォルダーを開くなどの基本的な操作の実行にのみ適しています。機能は制限されています。

スピーカー

ここでの機能は Typle よりも幅広いです。


Windows 10 コンピューターの音声制御により、ユーザーはファイルを開いたり閉じたり、スクリーンショットを撮ったり、PC の電源をオフにしたりすることができます。


音声認識には 3 ~ 4 秒以上と非常に長い時間がかかります。 これは、音声がまずテキストに変換され、そのテキスト情報からコンピュータがコマンドを認識するためです。

ライティス

これは、PC の制御とテキストの音声入力の両方を可能にする無料のプログラムです。 インストール後、登録する必要があります。その後、楽しく使用できるようになります。


入力時のオートコレクト機能が面白い。 「引用」と言うと、対応する記号がテキストに表示されます。

Yandex.stringによる音声制御機能

このアプリケーションを使用すると、ローカルまたはネットワークで情報やファイルを検索したり、コンピュータを再起動またはシャットダウンしたりできます。 プログラムやサイトを開く機能があります。
このプログラムを使用するには、まずダウンロードしてインストールする必要があります。

ただし、インストール中に、ソフトウェア製造元がブラウザのインス​​トールとその設定の変更を推奨する項目の横にあるボックスのチェックを外す必要があります。 そうしないと、インストールに時間がかかります より多くの時間ブラウザの設定が変更されます。
最終的に、線は [スタート] ボタンの近くに配置されます。 「Yandexを聞いて」と言うとウィンドウが開きます。

要望を口に出して言います。

一時停止すると、ブラウザで検索バーが開きます。 このように検索を管理するのは楽しいです。
一般に、コンピューターの音声制御はまだ開発されておらず、それは私たちの想像の中にすぎません。 しかし、現在利用できる機能はすでに優れており、次の機能に切り替えるのに大きく役立ちます。 新しいレベルパソコンを使って。

すてきな一日を!

ほとんどの場合、パソコンで作業するときは大きなテキストを入力する必要があります。 モニターの前に座っていると、家事はできるものの、かなりの時間をロスしてしまいます。

前世紀

コンピューターの音声制御とは何かを理解してみましょう。 いくつかの例えをしてみましょう。 以前も今も、仕事中にコンピューターから「手を解放する」非常に一般的な方法は、別の従業員、つまり速記者や秘書を雇うことでした。 しかし、ロシア語で音声制御できるようにする多数のプログラムやユーティリティをパソコンにインストールすることで、不必要な出費を回避できることを知っている人はほとんどいません。

Gorynych や WebSpeach などのソフトウェア製品の登場により、卒業証書、命令書、その他の文書などの作業にどれだけの時間を座って入力しなければならなかったのかを忘れることができます。 コンピュータ技術の発展に伴い、特別な音声認識プログラムを使用するオプションが登場しました。

組み込みユーティリティ

Windows 8 コンピューターの音声制御は、組み込みの Windows 音声認識ユーティリティを使用して実行されます。 残念ながら、現時点ではロシア語でコンピュータを操作することはできません。 Microsoft は最も一般的な言語に焦点を当てようとしているようですが、ロシア語のサポートが間もなくリリースされる可能性があります。

それでも英語を使用して鉄の友人を制御したい場合は、次の手順に従ってください。

  1. 「言語」サブ項目のコントロールパネルに移動します。 システム言語を英語に設定する必要があります。 お持ちでない場合は、適切な言語パックをダウンロードする必要があります。
  2. 言語をダウンロードしてインストールした後、「タイル」のある初期画面に移動します。
  3. 検索ボックスに「Windows 音声認識」と入力し、Enter キーを押します。 これにより、音声認識プログラムが起動します。
  4. 初めて起動すると、マイクを設定するように求められます。 種類を選択して、いくつかの言葉を言ってください。
  5. その後、20分間のトレーニングコースが提供されます。 英語で行われますので、英語が分からない方は飛ばしていただいても問題ありません。 プログラムのインターフェースは非常に明確なので、子供でも理解できます。
  6. コンピュータの音声制御を有効にするには、「聞き始めて」というキーフレーズを言う必要があります。 これは「聞き始める」という意味です。 これで、必要なプログラムを起動して、テキストのディクテーションを開始できます。

一般に、このユーティリティの可能性は無限です。 基本的なコマンドを使用するだけでなく、独自のコマンドを作成することもできます。

発達

ロシア語と英語の音声認識用に多くのアプリケーションが作成されています。

  • 「ディクトグラフ5」;
  • 「永久モバイル」;
  • 音声_PE;
  • ルーセント。
  • 音声タイプ;
  • 秘跡。

ただし、最も人気のあるものは次のとおりです。

  • 「ゴルイニチ」。
  • ウェブスピーチ;
  • リアルスピーカー;
  • スピーチカ。

それらを詳しく見てみましょう。

「ゴルイニチ」

名前が示すように、このアプリケーションはロシアのプログラマーのチームによって作成され、ゴルイニチというロシアのおとぎ話の登場人物にちなんで名付けられました。 コンピューターの音声制御はロシア語で行われますが、英語もサポートされています。 「Gorynych」を使用すると、ユーザーモードでパーソナルコンピュータを制御できます。つまり、マウスとキーボードで実行できるすべてのアクションを実行できます:ウィンドウ、アプリケーション、パーソナルコンピュータ上で実行されているプロセスの操作。 さらに、「Gorynych」は1人の所有者の音声のみを認識しますが、常に認識できるわけではありません。

ただし、かなり大きな欠点が 1 つあります。 実際には、コマンド ベース全体を手動で入力する必要があります。 つまり、音声でコンピュータ上で何かを行う前に、音声で録音されたコマンドを含むデータベース全体を作成する必要があります。 それでも、急に声が枯れたり、声の音色が少しでも変わったりすると、「ゴルイニチ」は全く理解しようとしません。

もう 1 つの落とし穴は、コンピュータにテキストを口述筆記したい場合、まず「ゴルイニチ」があなたの口述内容を理解できるように、豊富な語彙を備えた巨大な辞書を作成する必要があることです。

スピーチカ

彼らはこれを確実にするのに役立ちます サードパーティのアプリケーションパソコンにインストールされています。 そのうちの 1 つは Speechka です。 Google テクノロジーに基づいて作成されたロシアの製品 Gorynych と同様に、Spichka を使用すると、ユーザーは特定のコマンド セットを使用してコンピュータを音声制御できます。 Speechka はあらゆる音声を非常によく認識するため、音声ファイルを録音する必要はありません。 キーボードに単語を入力し、それを何らかのアクションに関連付けるだけで十分です。 簡単に言うと、これは価値のある製品ですが、ウィンドウを閉じたりプログラムを起動したりする機能が追加されたのはつい最近であり、まだ開発中の製品です。

タイピング

コンピュータの音声制御とは何かを理解したところで、タイピングの問題を考えてみましょう。 すでに述べたように、すべてのアプリケーションでこれが許可されるわけではありません。 ほとんどの場合、これには最初に辞書全体をコンパイルする必要があり、Windows 8 ユーザーの場合は、ロシア語の音声をサポートするという問題も発生します。 この問題を解決するために、Google が作成した音声ダイヤル サービスがあります。

Chrome ブラウザでのみ利用できる Google Web Speech アプリケーションは、ロシア語を含む世界の主要な 32 言語を認識します。 音声でテキストを入力するには、適切なブラウザ、インターネット、マイクが必要です。 開発はかなり進んでおり、このユーティリティは読み書きできるロシア語の音声を単語全体で認識し、印刷されたテキストに翻訳できるようになりました。

音声を認識し、それをパーソナル コンピュータに書き込むためのもう 1 つのプログラムは、RealSpeaker です。 彼女は使っています 現代のテクノロジー顔の表情の認識。 あらゆる Web カメラが使用に適しています。 作業中に生じる唯一の不便は、話者の顔がカメラの正反対に、40 センチメートル以内の距離になければならないことです。 このプログラムにはロシア語辞書があり、ユーザーが必要に応じて拡張できます。 一般に、このプログラムはゴルイニチよりもはるかに便利です。

結論

音声でコンピューターを制御することを考えているなら、信じてください、これはまだロシア向けではありません。 現在、適切な認識プログラムは英語でのみ存在しており、自動音声入力には非常に多くのエラーが含まれるため、すべてのタイプミスを修正するよりも、最初からテキストを作成する方が簡単です。 もちろん学んでみるのもいいでしょう 英語コンピューターを操作できますが、完璧な辞書と発音が必要です。