DMMボイスは、AI技術を活用した音声生成サービスです。 本サービスの特徴である多彩なボイスモデルから声を選ぶことで、感情あふれるセリフを自在に表現。ドラマティックなシーンのアフレコから心に響くナレーションまで、幅広いシーンにご活用いただけます。
ホロライブ所属の人気VTuberであるさくらみこさんの声を参考にAIによる音声合成を行い、さくらみこさん本人のツイートをそのまま読み上げる「棒読みこち」が公開されています。 さくらみこさんの声を参考にして作られた音声合成AI、棒読みみこち、生まれました‼️ みこちのツイートを、たまーに読み上げます‼️#miko_Art pic.twitter.com/QiQUvck4ME— 棒読みこち (@bouyomiko35) 例えば、以下のさくらみこさんのツイート。 ショーシャンクの空に みこが目の前が真っ暗になったら 思い出してまた観よう、と思った そんな名作でした???? 泣いたけど気持ちよくGW楽しんでいけるぜぇ! 必死に生きよう⛏#みこ市長— さくらみこ????SakuraMiko (@sakuramiko35) これを読み上げたものが以下。本人の声でツイートを読み上げています。やや人工的な
無償かつ入手しやすい音声データセットをメモしています。 ライセンス・利用規約は「商用利用可能」「研究用途のみ」ともに紹介します。 コーパスを探すときに有用なサイト コーパス配布元サイト 音声資源コンソーシアム : 日本語コーパスが豊富、無償または有償で利用可能 緩いライセンスのコーパスでなくても良いときはここ 自発的発話の日本語音声コーパスはだいたいここにある 入手は要申請 所属や責任者を記入する必要があるため、研究者や企業でないと厳しい? (この記事では音声資源コンソーシアムのコーパスは未掲載) Shinnosuke Takamichi: コーパス一覧 : 日本語中心。高道先生が携わっている音声コーパス 大量の日本語音声コーパスが配布されている 音声合成のコーパスをつくろう (Slideshare) : 2021年6月時点の音声コーパス事情 あなたにどうしても伝えたい30の音声コーパス
昨年11月に「AI歌声合成でさとうささらが人のように歌う!来年1~3月発売予定となったCeVIO AIを試してみた」という記事で予告したCeVIO AI(チェビオ・エーアイ)のさとうささら。諸々の事情で、発売がだいぶ遅れたようですが、2021年8月5日より、ついに発売が開始されました。これは2013年にリリースされたCeVIO Creative Studioに搭載されていたキャラクタである、さとうささらが、AI歌声合成、AI音声合成に対応した形で新たにリリースされるものです。 多くの人に親しまれてきた、さとうささらの声でありながら、より滑らかに、より自然に、より人間的に歌い、喋るシステムとなって登場したのです。先月、DTMステーションPlus!の番組内でも実演を交えながら詳しく紹介しましたが、改めてCeVIO AIとはどんなものなのか、さとうささらとはどんなキャラクタなのか、CeVIO C
音声変換による“声の装い”は、社会的課題の解決に向けた意義とニーズがある--ディー・エヌ・エー(DeNA)が5月に一般公開した、AIの活用による音声変換サービスのプロトタイプ 「VOICE AVATAR 七声ニーナ」の狙いとして語られた。 七声ニーナは、DeNAが取り組んでいるAIを活用した「音声変換AI」のトライアルとしてリリース。PCやスマートフォンのブラウザ上で、自分の声で話しかけて音声を入力すると、その音声が七声ニーナ(CV:高田憂希)の声に変換されるというもの。最大10秒間の音声に対応している。入力されたユーザーの音声から、話者に依存しない音の情報を抽出し、それをもとにキャラクターの音声を生成。これにより、事前にユーザーの音声を収録をしたり、文字起こしをしたりすることなく、誰の声であっても自然なキャラクターの声に変換することができるとうたっている。 音声変換に関する取り組みや七声
スマートフォンやスマートスピーカー、銀行ATM、券売機など、あらゆる場面で合成音声が使われるようになって久しい。近年では特に機械学習技術を活用した音声合成システムの製品化やサービス化が進んでいる。 音声合成の研究開発や製品化を行う際には、学習素材として大量の音声が必要だ。しかし学習に適した上質な音声ファイルはネット上にもあまりない。いまだに素材を集めにくい状態にある。 これまでは研究開発用の素材を得るため「音素バランス文」と呼ばれる台本を用意し、それをアナウンサーや声優などに読み上げてもらい、まとまったデータを取得していた。 「しかし、これまでの音素バランス文には『使用料』『ライセンス』『台本の読みにくさ』3つのハードルがありました」 そう話すのは明治大学で音声合成の研究をしている小口純矢さんだ。音声合成ソフトの販売を手掛けるSSS(仙台市)と小口さんが所属する明治大学、九州工業大学は6月
こんな簡単なコマンドで、Windowsは「しゃべって」くれる。画面キャプチャーでは声をお聞かせすることはできないが、お手元のWindows PowerShellで試してほしい スクリプトを作るとき、ちょっとユーザーの気を引きたくなることがある。たとえば、少し時間のかかる処理をするときに、終わったことを通知したい場合などだ。あるいは、実行後にすこし時間が経過してからエラーを通知するような場合にも、気を引きたくなることがある。 こんなとき昔のコンピューターならベル音やビープ音を鳴らすのが一般的だった。端末装置からコンピューターを使っていた頃、Ctrl+Gを出力するとベル音が鳴った。マイクロプロセッサが使われ始め、パソコンの原型ができあがった頃、BEEPと呼ばれる機能ができた。プログラムでビットをオンオフし、これをスピーカーに接続することで音を出していた。今もマザーボード上には、そのための小さな
テキストとして入力した文章を自動的に読み上げてくれるツールが「音声合成ソフト」だ。高齢者や視力の低い人向けのサービスで活用されることが多いが、書いた文章をさまざまな音声で読み上げてくれるので、趣味や遊びでも可能性は広がる。 今回は、30種類もの声を選べるフリーの音声合成ツール「SofTalk」を紹介しよう。 ●シンプルで使いやすいインターフェイス 今回紹介するSofTalk(ソフトーク)は、音声合成のフリーソフトである。 特徴は30種類もの人工音声を選べることだ。また、再生する音声をWAV形式の音声ファイルとして録音する機能も用意されているので、テキストを音声ファイル化したいときも便利だ。 なお、マイクロソフトのWordにも文章を読み上げる機能はあるが、SofTalkのように再生方法を細かく制御したり、WAVファイル化したりする機能は用意されていない。 記事末のサイトからZIPファイルをダ
ディー・エヌ・エー(DeNA)は5月12日、開発を進めているAIを活用した「音声変換AI」のトライアルを試験利用することができる「VOICE AVATAR 七声ニーナ」を公開した。PCやスマートフォンのブラウザ上で体験することが可能となっている。 これは、自分の声で話しかけて音声を入力すると、その音声が七声ニーナ(CV:高田憂希)の声に変換されるというもの。VOICE AVATAR 七声ニーナでは、入力されたユーザーの音声から話者に依存しない音の情報を抽出し、それをもとにキャラクターの音声を生成。これにより誰の声であっても、事前にユーザーの音声を収録をしたり、文字起こしをしたりすることなく、自然なキャラクターの声に変換することを可能としている。同社ではトライアルを通じて、技術進化の方向性を検証するとともに、より大きな発展に向けた技術蓄積を行っていくという。 現在もAIを用いた完全なキャラク
株式会社Yellston 株式会社Yellston(本社:東京都港区、代表:早川 尚吾、以下当社)は、Web音声合成サービス『CoeFont STUDIO』を2021年4月23日(金)にリリース、無料公開いたします。当社は、Web上で音声合成が可能な音声合成サービス『 CoeFont STUDIO』(コエフォントスタジオ) https://coefont.studio/ を2021年4月23日(金)にリリースしました。 CoeFont STUDIOのリリースを記念し、全サービスを期間限定で無料で公開いたします。終了時期は未定ですが、その間本サービス及び出力した音声データは営利・非営利問わずご自由にご利用いただけます。ぜひ当社の音声テクノロジーを用いた「声のフォント」をお試しください。 CoeFont STUDIO編集画面 アクセント・ヨミ編集 『CoeFont STUDIO』は、DeepL
NEUTRINO、CeVIO AI、Synthesizer V……と、まるで人間のように歌う、AI歌声合成の世界が賑わっていますが、今年この世界がさらに大きく変わる可能性が出てきました。一般ユーザーが自分の声を収録し、それを元にAI歌声合成をするための統一した楽曲の規格を作り、公開されることになったのです。その仕組みづくりに貢献したのが、声優であり、マルチクリエイターでもある小岩井ことり(@koiwai_kotori)さん。AI歌声合成のために、小岩井さんが作詞・作曲するとともに、自ら歌唱したデータ、計50曲が公開されることとなり、それをテンプレートにして歌えば、それぞれのAI歌声合成ができる世界が実現できることになりそうなのです。 そのプロトタイプとなる小岩井さんの歌唱データベースが公開に向けて、準備を進めているところですが、正式公開前に、実際に歌わせることができるソフトであるNEUTR
〜AutoMLで実践する〜 ビジネスユーザーのための機械学習入門シリーズ 【第 3 回】 「積ん読」と「体重増」の悩みを AutoML で解決しよう 前回は、AutoML Tables による EC サイトの LTV 分析事例を紹介しました。今回は、同じ AutoML Tables を、より身近な課題の解決に使う方法を紹介します。 その課題とは、筆者自身が抱えていた 2 つの悩みです。ひとつは、スキャンして PDF で保管している書籍の「積ん読」を大量に抱えていたこと。もうひとつは、自宅作業ばかりで増え続けてしまっている体重です。 この 2 つの課題を一挙に解決するソリューションとして筆者が思いついたのが、「PDF 書籍をオーディオブックに変換する」という方法です。読みたかった書籍をオーディオブック化しておけば、ランニングしながら積ん読を解消できます。 この動画のように、Cloud Sto
Tacotron2はGoogle社が提案した「テキストから音声に変換するアルゴリズム」です。 論文発表は2017年。しかし、2020年11月現在でも、その生成音声は最高水準の品質です。 下記にその生成音声を載せておきます。肉声と違いがわからないかもしれません。 Tacotron2を使ってテキストを音声に変換する場合は「テキストからメルスペクトログラムへの変換」のあとに「メルスペクトログラムから音声への変換」を行います。 メルスペクトログラムとは、とてもざっくり説明すると声の設計図のようなものです。 Tacotron2は「テキストからメルスペクトログラムへの変換」のみを行います。 「メルスペクトログラムから音声への変換」は、Tacotron2の論文ではWaveNet、NVIDIA社のソースコードではWaveGlowというアルゴリズムを用いています。 WaveGlowは、WaveNetの処理を
『MarkeZine』が主催するマーケティング・イベント『MarkeZine Day』『MarkeZine Academy』『MarkeZine プレミアムセミナー』の 最新情報をはじめ、様々なイベント情報をまとめてご紹介します。 MarkeZine Day
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く