転職サイトGreen(グリーン)
ログイン会員登録
転職サイトGreen(グリーン)

勤務地

年収
ログイン会員登録
企業トップ画像
企業トップ画像
企業トップ画像

株式会社テクノスピーチ

  • IT/Web・通信・インターネット系

感情豊かな人の声や歌声をAIでリアルに再現する大学発ベンチャー

自社サービス製品あり
残業少なめ

企業について

AIによる音声合成テクノロジーを提供している、株式会社テクノスピーチ。名古屋工業大学発のベンチャーだ。

同社は、従来の波形接続型音声合成手法ではなく、最新のAI音声合成手法を独自開発。録音された音声から、音声の特徴を学習したAIモデルを作り、そのAIモデルの出力を元に音声を合成するという手法だ。ディープラーニングによって、飛躍的に肉声へ近づけることができ、多様な感情・発話スタイルの音声を合成できるようにした。この画期的な技術で、同社単独または名古屋工業大学との共同で特許を取得している。

同社が提供している技術・サービスは、次のとおり。

●テキスト音声合成ソフトウェア開発キット
テキストを入力し、「怒った声」「悲しい声」といった感情を表す音声を合成するエンジン。顧客が開発するアプリケーションに組み込んで活用する形。
●テキスト音声合成用オリジナルボイス作成
数時間分の収録音声データから自動的に声の特徴を学習し、音声合成ボイスを作成する。
●歌声合成ソフトウェア開発キット
歌詞付きの楽譜を入力し、歌声を合成する歌声合成エンジン。
●歌声合成用オリジナルボイス作成
CD1~2枚程度の歌声データから自動的に歌唱者の声の特徴や歌い方を学習し、歌声合成ボイスを作成する。

具体的な活用例として最も話題となったのは、人気アイドルグループと賛同企業13社による夢を応援するプロジェクト『HELLO NEW DREAM.PROJECT』のコンテンツである『A・NA・TA for DREAM』。ユーザーは、自分の夢と名前を入力するだけで、『A・RA・SHI』をオリジナルの歌詞で歌ってくれるというものだ。

そのほか、カラオケ「JOYSOUND」の歌唱補助機能『ボーカルアシスト』や、一般向け音声創作ソフト『CeVIO AI』、故人となったアーティストの新譜CD作成といったエンターテインメント領域、オンデマンド授業の動画作成、AIや音声対話システムの発声モジュール等への活用が進んでいる。さらに、咽頭がんで声帯を摘出する患者が摘出後も自分の声で発話できるようにしたり、自動翻訳機に搭載して本人の声で発話できるようにするといった活用法が想定されている。もちろん、カーナビやゲーム、アプリ、Webサービス等での活用は言うまでもない。

2009年11月に同社を設立した代表取締役の大浦圭一郎氏は、それまで名古屋工業大学で音声合成技術の研究に取り組んでいた。同社をスタートさせた経緯を、次のように説明する。
「研究成果を学会や論文などで発表しても、当時は世の中で活用されることがあまり多くありませんでした。せっかく感情のこもった声を合成できたり、歌声まで合成できるのに、音声合成技術が使われるのはテキストを棒読みするカーナビぐらい。一般的に論文から具体的な製品開発フェーズに至るまで、下手をすると5~10年かかることもしばしばです。ならば、自分が製品化すれば早いと考えました。たまたま当時、大学内にインキュベーション機能が整い始めたこともあり、この研究成果はこうやって世の中で使ってもらえる、という模範演技をしてやろうという気持ちもありました」

大学の特任助教・特任准教授としての職を得ながら研究活動を続け、会社では専任の技術者が開発を手掛けるという安定的な事業環境を得ることができた。設立から4年ほどはこれといって積極的なビジネスは進めていなかったが、その後、市販ソフトウェア製品への導入や「JOYSOUND」への提供といった案件が徐々に出始める。

2018年末にAIでリアルな音声合成ができたというリリースを出すと、ゲーム会社やレコード会社といったところから反響があり、問い合わせが続出したという。
「マンパワーに限界があるので、社会的なインパクトの大きいものや、面白そうなものから優先的に手掛けるようにしてきました」と大浦氏。

そんな同社のビジョンについて、大浦氏は次のように続ける。
「当社がやりたいのは、AI等のテクノロジーを人間の武器やパートナーとして共生させることです。こういう技術ができると、アナウンサーや声優が不要になるといった話になりがちですが、そういう方向には進みたくありません。技術が人間を駆逐するのではなく、両者は共生すべきと考えているからです」

それまで、ライブでしか活動できなかった声楽家は、レコードが発明されたことで、多くの人に自分の歌声を届けることができるようになり、著作権という財産がもたらされるようになった。それと同様に、音声合成で声優は自ら発声しなくても、自分の声という価値を再生産できるようになる。その声でファンになった人が、実声による作品を見聞きするために足を運ぶようになればいい。
「メジャーデビューによってCDを出せることがステータスであるように、音声合成も歌手や声優等のステータスに繋げたいと思っています」(大浦氏)。

同社の技術は、まだまだ道半ばだ。笑いながら怒る、だみ声でシャウトする、といった人間の複雑な発声をトレースできていない部分が沢山残っているという。
「今後の研究開発のテーマとして取り組んでいく」という同社が目指すのは、「音声合成ならテクノスピーチ」という存在感を世界で確立させることだ。

同社の従業員は30名ほどで、正社員や時短勤務、パートタイマー、学生アルバイト等、就業形態はまちまち。研究開発職は7名で、大学にも在籍する研究者や博士課程の学生も在籍。事務職が2名で、残りはディープラーニングのためのデータを整理する業務に就いている。「AIの性能を高めるには、いかにデータを整理するかがカギを握る」と大浦氏。

業務の進め方としては、問い合わせが入った開発案件や同社自身の事業ビジョンに基づいて、大浦氏とマネジメントを担うもう1名が協議の上タスク化し、メンバーをアサインする形で行っている。
「タスクごとにゴールを決め、プロセスはそれぞれに任せる形。力を入れているのは、振り返り」と大浦氏は話す。数カ月ごとに振り返りミーティングを開き、よりベターな方法や改善点に対する意見を出し合って、全員で事業や会社をブラッシュアップするカルチャーをつくっている。

働き方としては、コロナ禍となって以降はフルリモート体制を取っている。コミュニケーションのベースはチームコミュニケーションツールだ。
「Web会議システムでは雑談が出にくいという傾向があります。しかし、プライベートの話等の雑談は、チームとしての一体感を深めるのに欠かせません。そこで、チームコミュニケーションツールに雑談のチャンネルをつくって、いつでもコミュニケーションができるようにしています」(大浦氏)。
退勤する際は、“今日の雑感”を書き残す文化があるという。
「例えば、『今日、息子がこんなことを言ってホッコリした』といったことです。そのコメントにメンバーから『いいね!』が付く。そんなフラットなコミュニケーションを大切にしています」(大浦氏)。

リモート体制が定着し、支障なく運営できているので、コロナ禍が落ち着いた後も継続させていく見通しだ。

そんな同社が求める人材像は、主体性を持って新しい技術を探求し続けられる人。そして、フラットなコミュニケーションによるカルチャーを尊重できる人だ。
「メンバー全員、音声合成に夢を抱いて仕事に取り組んでいます。そんな夢を一緒に抱ける方に是非アクセスしていただきたいと願っています」と大浦氏は期待を寄せる。

企業情報

会社名

株式会社テクノスピーチ

業界

IT/Web・通信・インターネット系 > ソフトウェア/パッケージベンダ

企業の特徴
自社サービス製品あり、残業少なめ
資本金

3800万2500円

設立年月

2009年11月

代表者氏名

代表取締役 大浦 圭一郎

事業内容

マルチメディアに関連したコンピュータのソフトウェア・ハードウェアの企画・設計・開発・販売
マルチメディアに関連したコンピュータのソフトウェア・ハードウェアに関する技術コンサルティング

株式公開(証券取引所)

従業員数

30人

本社住所

愛知県名古屋市東区葵1-14-13 アーク新栄ビルディング

この企業と同じ業界の企業

この企業と同じ業界の企業:株式会社 Scalehack
株式会社 Scalehack
人と事業の成長を“ハック”するエコシステムを生み出す。
この企業の募集は終了しました。他にも求人を募集している企業がたくさんあるので、
ぜひ探してみてください🔍
他の企業の求人を探す
この企業の募集は終了しました。他にも求人を募集している企業がたくさんあるので、
ぜひ探してみてください🔍
他の企業の求人を探す
掲載をお考えの企業様
IT転職に強い求人サイト Green
Copyright© Atrae, Inc. All Right Reserved.