竹内雅樹|病気で失われた声を取り戻すためのデバイス開発を率いる
世界では毎年、30万人もの人が喉頭がんなどの病気によって声を失っていると言われています。そんな声帯あるいは喉頭をなくしてしまった人々が再び声を出せるようにサポートするためのデバイスとして、電気式人工喉頭があります。しかしこのデバイスは、誰が使っても同じ、ロボットのような声でしか話すことができません。
「もとの自分の声で、もっと自然に喋りたい」そんな患者さんの願いを叶えるために、電気式人工喉頭のアップデートに挑む大学院生のチームが「Syrinx(サイリンクス)」です。今回はSyrinxチームのリーダー竹内雅樹さんに、Syrinxで失われた声を再現できる原理や、開発ストーリーについて伺いました。
竹内 雅樹
東京大学大学院 工学系研究科 電気系工学専攻
慶應義塾大学理工学部を卒業後、理化学研究所勤務を経て現所属。ハンズフリー型の電気式人工喉頭「Syrinx」開発チームのリーダー。
病気によって失われた「その人の声」を取り戻せる、画期的なデバイス開発
ーー 竹内さんたちが開発している「Syrix」はどのようなプロダクトなのでしょうか?
Syrinxは喉頭がんや咽頭がんなどの病気によって失われてしまった声を取り戻すためのデバイスです。Syrinxを首に巻くように装着することで、口パクだけで会話ができるようになります。
ーー 自分で声を出せなくても、Syrinxがそこを補ってくれるということでしょうか?
そうです。病気で声を失ってしまった方々は、声を出すための器官、つまり「声帯」をなくしてしまっています。その機能を補完するための器具として「電気式人工喉頭」というものがあるのですが、Syrinxも基本的にはその流れを汲むデバイスです。
ーー 電気式人工喉頭についてもう少し教えていただけますか?
まず人間の声が出る仕組みを簡単に説明します。口から喉を経て奥に入っていった先では、肺につながる気管と胃につながる食道という2つの管に分かれています。気管への分岐部である喉頭には声帯と呼ばれるひだ状の器官があり、これが肺から送り出された空気によって振動することで声のもととなる空気の振動音、「喉頭原音」が作られます。これは「ヴー」という感じのただの音なのですが、これが例えば「あ」と発音するときの舌と唇の形になっている口の中を通ると、「あ」という声として外に出ていきます。
声帯を摘出した方々は、舌や唇を動かすことはできますが、喉頭原音を作り出すことができません。この喉頭原音に変わる振動音を作り出すのが電気式人工喉頭の役割です。
ーー どのようにして使うのでしょうか?
手のひらサイズの筒状のデバイスについているボタンを押すと先端部分が振動します。これを喉に当てることによって喉の中に喉頭原音が生まれます。ただし、誰が使っても同じような声、しかもロボットのような無機質な声になってしまうという問題があります。
ーー デバイスが同じであれば、同じ喉頭原音になってしまうわけですね。
この問題を解決するために、ユーザーそれぞれの特徴を反映した喉頭原音を再現できる技術の開発に取り組むことにしました。端的には、対象となる人の声の録音データを解析アルゴリズムにかけ、実際に振動音として生成します。「その人らしさ」を反映させた喉頭原音を作り出せることがSyrinxの大きな特徴になっています。
ーー 振動のパターンで声の特徴を再現するわけですね。振動のどういった部分に「その人らしさ」が現れてくるんでしょうか?
人間の声は様々な高さの音が混ざり合って構成されています。どの高さの音が、どれくらいの強さで出ているかによって、声の特徴が決まるわけです。
ーー データ解析というと大量のデータが必要なイメージがあります。この解析にはどれくらいの声のデータ量が必要なんでしょうか?
実は全然いらないんです。私の声の特徴を抽出するのに使ったのは、5秒間「あー」と言ったデータだけです。
ーー そんなに少なくていいんですね!
特徴を捉えるにはそれくらいで十分です。ただ、まだまだノイズも発生しているため、現在改良を行っている段階です。むしろ捉えた声の特徴を喉頭原音として精度よく生成することが、「私らしい声」を再現するのに重要になってきます。
ーー 振動の特徴を実際に喉頭原音として再現するのも難しそうですね。
従来の電気式人工喉頭だと振動を作り出すための振動子が1つしかついていませんでした。Syrinxでは振動子を2つに増やすことで、様々な特徴の喉頭原音を再現できるように工夫しています。
ーー データ解析による声の特徴の抽出から、喉頭原音としてその特徴を再現するところまで、色々な工夫が詰まっているんですね!
大学時代に参加した音声と福祉に関わるワークショップがSyrinx開発の原点
ーー Syrinxを開発するきっかけはなんだったんでしょうか?
大学の学部時代に参加していた「マイボイス」というプロジェクトが原点です。マイボイスでは筋萎縮性側索硬化症(ALS)などで将来声を失ってしまうとわかっている患者さんの声をあらかじめ録音しておき、声が失われた後もパソコンを使ってその人の声で話せるようにすることを目指していました。このプロジェクトのワークショップへの参加を通して、音声と福祉という観点に非常に興味を持ちました。
その後、大学院に入学する前に理化学研究所で働いていた時期があったのですが、そこで先生にある動画を紹介されました。それが声帯を摘出した人の動画で、先ほど紹介した電気式人工喉頭などの既存の代替発声法の質が非常に悪いことを知りました。これはなんとかできないかな、と考えたのがSyrinx開発のきっかけでした。
ーー 具体的にはどういうことから取り組みを始めたのでしょうか?
まず初めに「銀鈴会」という声帯摘出した方々の支援団体に問い合わせをしました。するとありがたいことに「ぜひ来て見てみてください」と言っていただけたんです。そこで実際に銀鈴会に伺って、困りごとのインタビューを行いました。そこでやはり「人に近い声を出したい」という要望があったので、「じゃぁなんとかしよう」と。
実際のプロジェクトとしての活動は、東京大学のSummer Founders Program(SFP)で始めました。SFPは見つけた課題を「モノづくり」で解決する学生主体のプログラムで、私もそこで一緒に課題に取り組む仲間と出会うことができました。さらに色々な工具や3Dプリンターが揃っている施設が利用できて、技術を持っているスタッフさんの支援を受けながら実際にデバイス開発を行うことができました。
ーー Syrinxの構想を初めからSFPに持ち込んだんでしょうか?
実は最初は少し違うところから入りました。声を失った人の中には、食道発声というゲップをしながら話すというテクニックを持っている方がいて、その方の支援というアイデアでSFPに通りました。ただ食道発声というのは習得するのが難しく、声を失った人全員ができることではないという問題があったんです。そこで、もっと簡単な方法がないか探していたところ、電気式人工喉頭に辿り着きました。
この電気式人工喉頭が20年近くもアップデートされておらず、使うときに片手が塞がってしまうという問題もありました。そこでこのデバイスを改良してやろう、ということになりました。
ーー 現在のSyrinxはとてもスタイリッシュですよね。どうやって現在のデザインまでたどり着いたんでしょうか?
最初は市販の喉頭マイクを買って振動子をつけたところからスタートして、最初のプロトタイピングは1ヶ月くらいでできました。
ーー すごいスピード感ですね!
その後、デバイス自体を軽くするために振動子を1つにしてたんですが、音量が出ないということでやっぱり2つにして。そして「まだまだデザインが」ということでデザインエンジニアの小笠原佑樹さんにチームに入ってもらって、現在のデザインになりました。
ーー 必要なリソースをタイムリーに獲得されて、爆速でプロジェクトを押し進められているのが素晴らしいなと感じます!
抑揚を再現することで、より「その人らしい声」へ
ーー 今後はどのような活動を行なっていく予定なのでしょうか?
まずはデバイスの改良に取り組むのが最優先です。1つは完全ハンズフリー化ですね。現状のデバイスでは、振動音を流すタイミングでボタンを1回押す必要があるのですが、例えば喋り始めたら自動的に振動が始まるようにしたいと考えています。
もう1つは首からの振動音の漏れの低減です。喉の中からのみ振動音を出せるのが理想なのですが、どうしてもデバイスと首の間から漏れてしまいます。これをいかに低減できるかも課題になっています。
そして、最大の課題は「抑揚」です。自然な声に聞こえるため抑揚が非常に重要で、例えば「こんにちは」というときにも「ん」の部分で少し音が高くなっていますよね。ただ現状のデバイスだと実はまだ抑揚再現ができておらず、ずっと平らな振動音になってしまっています。この問題を解決して、より自然な声を再現するための技術開発に取り組みたいと考えています。
ーー 最後に、竹内さんが研究者を志したきっかけを教えていただけますか?
Syrinxの活動やそれに付随する修士研究を通じて、「発声代替デバイス」には未解決の研究課題が数多く存在しており、これらを少しでも解決したいという思いで研究者を志しました。先ほど述べたようにまずはデバイスの改良に取り組んで、「失われた声を取り戻せる世界」を実現することをひたすらに目指していきたいと考えています。
ーー まさに社会価値創造のための研究活動なんですね! これからも応援しています! 今回はありがとうございました!
この記事を書いたのは