Kue Bacang: 口パクで音声入力できるマスク、東大などが開発約8割の精度で音声を認識

Wednesday, April 27, 2022

口パクで音声入力できるマスク、東大などが開発約8割の精度で音声を認識 - ITmedia NEWS

kuebacang.blogspot.com

Innovative Tech：

このコーナーでは、テクノロジーの最新研究を紹介するWebメディア「Seamless」を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。

　東京大学と産業技術総合研究所の研究チームが開発した「E-MASK: A Mask-Shaped Interface for Silent Speech Interaction with Flexible Strain Sensors」は、マスク着用時に口パク（無声発話）による音声入力が行えるマスク型デバイスだ。口パクによって変形するマスクを内蔵するセンサーで読み取り、音声アシスタントへの入力コマンドに変換する。

（a）柔軟で高感度なひずみセンサー、（b）ひずみセンサーをマスクに取り付ける様子、（c）E-MASK装着時の正面図

　E-MASKでは、口元の動きによるマスクの変形を計測するために、曲がり具合を検出できる柔軟で高感度なひずみセンサーを利用する。マスク1枚に対して8個のひずみセンサーを用いる。マスクには細長い布をアイロンで熱圧着し8個分のポケットを作る。そのポケットにひずみセンサーをそれぞれ挿入する。そのため、ひずみセンサーの着脱が容易で、日常的に使用するマスクに簡単にセンシング機能を付与することが可能である。

センサーの配置とセンサーデータ

　ひずみセンサーの他に、ひずみセンサーの抵抗値変化を測定する回路部分、測定値をノートPCに送るマイクロコンピュータから構成する。現在の回路部分はボックスを首からぶら下げる仕様だが、今後はチップに設計し直しマスクに組み込みたいという。

　実験では、Alexaの基本的な操作コマンド21個を推定対象とした。その結果、座位での発話推定精度は84.4％、歩行での発話推定精度は79.1％を示した。

Source and Image Credits: Yusuke Kunimi, Masa Ogata, Hirotaka Hiraki, Motoshi Itagaki, Shusuke Kanazawa, and Masaaki Mochimaru. 2022. E-MASK: A Mask-Shaped Interface for Silent Speech Interaction with Flexible Strain Sensors. In Augmented Humans 2022 (AHs 2022). Association for Computing Machinery, New York, NY, USA, 26-34. DOI:https://ift.tt/INoxnZu

Kue Bacang

Pages

Wednesday, April 27, 2022

口パクで音声入力できるマスク、東大などが開発約8割の精度で音声を認識 - ITmedia NEWS

Innovative Tech：

関連記事

関連リンク

No comments:

Post a Comment

Arsip Blog

Mengenai Saya

Pages

Wednesday, April 27, 2022

口パクで音声入力できるマスク、東大などが開発 約8割の精度で音声を認識 - ITmedia NEWS

Innovative Tech：

関連記事

関連リンク

No comments:

Post a Comment

Arsip Blog

Mengenai Saya

口パクで音声入力できるマスク、東大などが開発約8割の精度で音声を認識 - ITmedia NEWS