【情報理工学部・先端情報学研究科】平井重行教授の分担執筆した図書が発刊されました!

2025.05.08

発刊された図書の書影
2025年4月10日に、平井重行教授が分担執筆した図書「進化するヒトと機械の音声コミュニケーション Vol.2 ~AIの活用と感情に寄り添う音声認識・合成の新展開~」がエヌ・ティー・エス社から発刊されました。

本図書は、エヌ・ティー・エス社から2015年に発刊された「進化するヒトと機械の音声コミュニケーション」の続巻として、2024年時点での音声認識・合成やコミュニケーション関連テクノロジーについて編集・執筆されたものです。この10年の間に深層学習技術の発展・進展と共に音声認識や音声合成、また音声コミュニケーションに関連する技術は大きく進化し、世の中に普及し、様変わりしました。そのような社会や科学技術の背景を元に執筆された今回の図書は、前半が最先端の音声認識および音声合成の技術についてまとめてあり、後半はそれらを活用したロボットとのコミュニケーションや障がい者支援などの先端的な応用の取り組みについてまとめられています。


この図書で平井教授が分担執筆したのは、前半の音声合成の一つの章ですが、執筆した内容は音声合成の技術ではなく、非音声である環境音や効果音を合成する技術の研究について述べられています。環境音・効果音の深層学習による合成技術は、最近になって立ち上がってきた研究分野であることから、平井教授の執筆分の前半はその研究分野の経緯や先行研究に関してまとめてあり、後半では平井研究室で行っている非言語な口真似音声からリアルな効果音を合成する技術 PronounSE について紹介しています。非音声の合成技術に関する内容であるため、音声関連技術をまとめた本書の中では異色な位置付けではあるものの、人の非言語な発音能力を最大限活かす音響合成手法として新たな展開や応用が可能な研究として注目されています。音声関連や音響合成に関する研究者の方は、PronounSE研究プロジェクトのページから論文を辿って読んでもらうほうが詳しい情報が得られますが、関連技術の研究者ではない方は、この図書を見てもらえると研究分野の経緯やPronounSEの技術概要は理解・把握してもらえる内容となっています。

書籍情報

「進化するヒトと機械の音声コミュニケーション Vol.2
~AIの活用と感情に寄り添う音声認識・合成の新展開~」
 ISBN 978-4-86043-936-1 C3004
 サイズ 冊子版B5 / PDF版
 ページ数 280ページ
 価格 45,000円(税別)
 出版日 2025/4/10
 [エヌ・ティー・エス社]
PAGE TOP