ritの研究室

このページでは、ritが新しく導入したWebプログラミング技術に関する実験結果や、集めた情報のまとめ、技術を使用した簡易ツールを公開しています。

ツールのページは実験的で簡単なものなので、該当ページへ移動しても基本的にはCSSでのページデザイン等は行っておらず、ほぼ素のままのプログラムを置いてあります。

実験結果を放り投げているだけなので、内容について質問があっても答えられる保証はありませんが、配信でこういうことをやりたいので専用にカスタマイズしてほしいというような依頼があれば、汎用性が低く使い方が限られる簡単なもので良ければできる限り提供しようと思います。(twitter:@rit_nd)

後から同技術を使用してWebアプリとして完成したものはAcceleland Applications、ダウンロード式のアプリとして完成したものはritvia worksにて公開します。

Web Speech API

Web Speech APIを使ってブラウザを通して音声を入出力するアプリケーションのテストです。対応ブラウザが限定されるので、環境によっては動作しません。OBSで使用する場合は、ウィンドウキャプチャで取り込んでからカラーキーで背景色を抜く必要があります。精度は「おもちゃにしては使えるね」程度。口とマイクが近いほうが精度が上がるらしい。体感英語のほうが正確。

OBSブラウザ直接取り込み式にする場合は、nodeJS等でサーバーを立ててChromeとOBSブラウザ間でサーバーを介したやり取りを出来るようにすれば可能。作っても多分公開はしません。

音声認識NGワードテスト

Messageボタンを押したらスタート。端末のマイクから音声を取得してAIによって文字に書き起こします。登録されているNGワードが書き起こした文字の中に含まれている場合にOUT演出を出して停止します。NGワードはwebspeech.jsのngwordsの中に配列で定義します。(utf-8)

本体のダウンロードはこちら ただし、ローカル下で使用する場合はマイク許可設定をうまくやらないと毎回聞かれて面倒です

音声認識NGワードテスト正規表現版

中身は大体一緒。上のと同様に配列に正規表現を登録すれば出来ますが、正規表現で登録した場合はマッチングした後に返すワード(OUT時に表示させるワード)を条件分岐させて入力しておく必要があります。(じゃないと[A-Z]みたいに表示されてしまう)

音声認識NGワード縛り切り替え式

縛りの切り替えに対応。チェックで選んでセット更新を押すと、チェックされた縛りワードが全て採用される。オブジェクト内でセットを定義しておくことで、好きな組み合わせを実現可能。