並び順

ブックマーク数

期間指定

  • から
  • まで

1 - 40 件 / 621件

新着順 人気順

音声の検索結果1 - 40 件 / 621件

音声に関するエントリは621件あります。 技術AI音楽 などが関連タグです。 人気エントリには 『音声合成業界に激震! もはや人間の喋り声、入力文字読み上げソフトVOICEPEAKはビジネス用途でも自由に利用可能|DTMステーション』などがあります。
  • 音声合成業界に激震! もはや人間の喋り声、入力文字読み上げソフトVOICEPEAKはビジネス用途でも自由に利用可能|DTMステーション

    日進月歩というより、秒進分歩で進化している感じのある音声合成、歌声合成の世界ですが、また新たな革命ともいえるAI音声合成ソフトが誕生しました。これまでDTMステーションでも何度も取り上げてきた歌声合成ソフト、Synthesizer Vを開発するDreamtonics株式会社と株式会社AHSと共同開発する形で、もはや人間の喋り声にしか聴こえない音声合成ソフト、VOICEPEAKを発表し、3月11日から発売を開始するのです。Synthesizer Vと同様、Windows、Mac、Linuxでも動くマルチプラットフォームソフトで価格はダウンロード版で23,800円(税込み)となっています。 このソフト「VOICEPEAK 商用可能 6ナレーターセット」という製品名になっていますが、実際には女性3人+男性3人+女の子1人=7人の声を切り替えることが可能なAI音声合成ソフトで、テキストを入力すれば

      音声合成業界に激震! もはや人間の喋り声、入力文字読み上げソフトVOICEPEAKはビジネス用途でも自由に利用可能|DTMステーション
    • VOICEVOX | 無料のテキスト読み上げ・歌声合成ソフトウェア

      オープンソースVOICEVOX は OSS(オープンソース・ソフトウェア)版 VOICEVOX をもとに構築されています。 製品版と OSS 版の違いやモジュール構成は VOICEVOX の全体構成 をご参照ください。 ソフトウェア部分は Electron + Vue 、音声合成エンジン部分は Python + FastAPI です。 追加したい・改善したい機能があれば、ぜひ開発にご参加ください。

      • 「面倒なことはChatGPTにやらせよう」の全プロンプトを実行した配信のリンクを整理しました|カレーちゃん

        Youtubeで配信しながら全プロンプトを実行しましたので、各節へのリンクを整理しました。時間のところにYoutubeへのリンクになっています。 もしずれていたら、その時間まで移動して視聴ください。 はじめに (4:00) 1章 ChatGPTの基礎知識 (5:50) 2章 ChatGPTの基本的な使い方 (6:28) 3章 ChatGPT Plusのセットアップ (7:32) 4章 ファイルのアップロードとダウンロード (12:40)4.1 アップロード・ダウンロード (13:03) 4.2 扱うことができるファイル (16:02) 5章 繰り返し作業を一瞬で (16:55)5.1 文字列操作 (17:20) 5.2 正規表現でのパターンマッチ (25:36) →54ページの正規表現でできることの例の説明 (29:09) 5.3 ファイルの一括操作 (46:20) 5.4 QRコード作成

          「面倒なことはChatGPTにやらせよう」の全プロンプトを実行した配信のリンクを整理しました|カレーちゃん
        • 商用利用OKの音素材、600種以上無料公開 バトルの攻撃音も……「Springin’ Sound Stock」

          プログラミングアプリ「Springin'」(スプリンギン)などを提供するしくみデザインは6月23日、商用利用OKの無償音楽素材サイト「Springin’ Sound Stock」を公開した。戦闘ゲームの攻撃音や、8bitサウンドの効果音、システム音、乗り物の音など、600点以上をそろえた。 過去のプログラミングコンテスト使用音源など、同社のサウンドデザイナーが手掛けた音源を中心に提供。「つくる楽しさを知り、誰でもクリエイターになってほしいという願い」から公開したという。 誰でも無料で使うことができ、スプリンギンでの利用だけでなく、動画制作やイベントなどの商用利用も可能だ。 関連記事 タップやフリックなどのシステム操作音のフリー素材、電通が公開 商用利用も可能 電通は、タップやフリック、文字入力などの操作を想定したオリジナルのシステム操作音をフリー素材として公開した。「SND」と名付けられた

            商用利用OKの音素材、600種以上無料公開 バトルの攻撃音も……「Springin’ Sound Stock」
          • Microsoft、文字起こしアプリ「Group Transcrib‪e‬」を公開 - iPhone Mania

            Microsoft、文字起こしアプリ「Group Transcrib‪e‬」を公開 2021 3/16 Microsoftは3月上旬、対面での会議や会話のためのリアルタイムのテープ起こしと翻訳を提供する「Group Transcrib‪e‬(グループ転写)」のiOSアプリをリリースしました。会議の参加者がそれぞれのデバイスで使用することができます。 メモを取らずに会議に集中できる優れもの 最先端のAI音声・言語技術を搭載したGroup Transcribeで、会話の参加者は共有セッションを開始し、それぞれが携帯電話のマイクを使用して、リアルタイムで誰が何を言ったかを示す、非常に正確なトランスクリプトをキャプチャできます。 会話の高品質な記録に自信を持つことで、ユーザーはメモを取る必要がなくなり、会話そのものに注意を集中させることができます。トランスクリプトは、共有したり、再配置も簡単に行う

              Microsoft、文字起こしアプリ「Group Transcrib‪e‬」を公開 - iPhone Mania
            • 【ドドンッ!】有名YouTuberが使ってる『効果音ラボ』の実態に迫る - イーアイデム「ジモコロ」

              ※この記事は、音を再生できる環境で読むとより楽しめます。イヤフォン等がある方はぜひお手元にご用意ください。(もちろん音無しでも楽しめます!) 突然ですが、これらの音を聞いたことはあるでしょうか? 『和太鼓でドドン』 『男衆「オウ!」』 『ドンドンパフパフ』 YouTubeを見ていれば、必ず一度は耳にする音ばかりですね。実はこれらの効果音、すべて「効果音ラボ」というフリー音源素材サイトが提供している音なんです。 「効果音ラボ」は国内のフリー効果音サイトでは最大手と言っても過言ではありません。YouTubeに限らず、ゲームやコマーシャルでも様々な音が使われています。 効果音ラボ トップページ ただ皆さんご存知でしたか? このサイト、創設から9年の間ずっと、たった1人の方が運営しているんです。 さらに、銃声を録音するために海外に行ったり、録音のためだけにヘリコプターをチャーターしたりと、音源を作

                【ドドンッ!】有名YouTuberが使ってる『効果音ラボ』の実態に迫る - イーアイデム「ジモコロ」
              • 無料で公開されている音声合成サービスが凄いと話題に「ボイロ殺しに来てる」「ベタ打ちで自然に話せる」

                CoeFont (コエフォント) @coefont AI音声プラットフォーム「CoeFont(コエフォント)」の公式アカウント 英語: @coefont_global 採用募集中! coefont.com/recruit Instagram 始めました: https://t.co/CeN8nmcEWN coefont.cloud

                  無料で公開されている音声合成サービスが凄いと話題に「ボイロ殺しに来てる」「ベタ打ちで自然に話せる」
                • 【レビュー】 まるで未来のイヤフォン“自分の耳が高機能に”「IQbuds2 MAX」

                    【レビュー】 まるで未来のイヤフォン“自分の耳が高機能に”「IQbuds2 MAX」
                  • 「AIきりたん」がすごい - すずしめにっき

                    ゆうべ、そろそろ寝ようかなと思っていたらものすごいものが投下され、興奮して結局3時半まで起きてしまいました。 ということで、昨晩公開された「AIきりたん」こと歌声合成エンジンNEUTRINO1について(今の興奮をあとで思い返すためにも)書いておきます。 AIきりたんとは とりあえずこれを聴いてみてください。 これが合成音声か!?と思ってしまうような仕上がりですが、これがAIきりたん……歌声合成エンジンNEUTRINOによって生成されたきりたんの歌声です。 NEUTRINOはSHACHIさん(@SHACHI_KRTN)によって製作されたフリーウェアで、昨晩公開されました。その標準の同梱ライブラリの1つが東北きりたんのものなので、そちらのことが「AIきりたん」または「AIシンガーきりたん」と呼ばれているというわけです。 ニューラルネットワークを用いた歌声シンセサイザー【NEUTRINO】を公開

                      「AIきりたん」がすごい - すずしめにっき
                    • 世界中の伝統音楽のデータベース、慶應大が公開 1026民族、5776件の音声記録を掲載

                      世界地図上にマッピングされたポイントをクリックすることで、その地域の民族にゆかりのある音楽を再生できる。例えば日本の東北地方なら、安全を願うために歌われてきた「津軽山唄」、東京都なら作業時に歌われてきた「木遣節」がある。他にもヨーロッパやアフリカ、米国など世界各国の伝統音楽が聞ける。 2017年に暫定版としてデータベースを一度リリースしていた。研究チームは、改めて楽曲の種別や特徴などを見直し、呼吸方法や楽器情報など、より詳細な情報や会話などの音楽ではない音源も加え、データの正確性を上げて再度リリースしたという。 データベース中の全ての楽曲は、個人や研究での利用など非営利での使用を推奨しており、著作権とその文化継承者が許す範囲内のみで利用できる。今後も継続的に新しいデータも追加していくという。研究チームは「Global Jukeboxが他の研究者に刺激を与え、音楽の伝統や文化の進化に関する多

                        世界中の伝統音楽のデータベース、慶應大が公開 1026民族、5776件の音声記録を掲載
                      • 無料 BGM・効果音のフリー音源素材 | Springin’ Sound Stock

                        無料 BGM・効果音のフリー音源素材 誰でも 報告不要で 商用利用無料! 今すぐ使える BGM・効果音 1,000点以上! 動画制作やイベントに もちろんスプリンギン アプリでも利用可

                          無料 BGM・効果音のフリー音源素材 | Springin’ Sound Stock
                        • ついに音声対話できるようになった ChatGPT が引くほど自然でなんか凄いし怖い「もうこれ人間じゃん!」

                          チキン@ライター @HeroofChickens フリーランスのライター4年目。リストラがきっかけ。Kindle出版1位、Kindleプロデュースで1位・ベストセラー取得。商業出版のブックライティング中(2024年の5月ごろ出版かな?) webwhiter-skill.com/job/

                            ついに音声対話できるようになった ChatGPT が引くほど自然でなんか凄いし怖い「もうこれ人間じゃん!」
                          • DMMボイスはエロゲーを学習している(という仮説とその考察)

                            注意:AI批判目的ではありません。単なる考察結果の共有です。どちらかというと私は思想的にはAI推進過激派です。また、ここでの推測はすべて外れている可能性はあります、あくまで推測です。 DMMボイス最近AI界隈(?)で話題になっている、20人分のアニメ調キャラクターの声で感情的な音声を簡単に生成することができるAIサービス。 https://ai-voice.dmm.com/ それの学習元に、エロゲーのテキスト音声データが使われているのではないかという話。 まずは性能がかなり高くて楽しいのでみんな遊んでみてください。(そして知ってる声優がいないか探してみてください。) 追記11/7現在アクセス増大でサービス一時停止しており、サンプルボイスさえ聞けないので、サンプルボイス集を作っておいた: https://whyp.it/collections/3281/dmm利用規約についてのツッコミ動画が

                              DMMボイスはエロゲーを学習している(という仮説とその考察)
                            • 「iPhoneの音声出力をPCに繋いだら、電話もYouTubeも自動で文字起こしできるようになった」――急遽テレワークを導入した中小企業の顛末記(97)【急遽テレワーク導入!の顛末記】

                                「iPhoneの音声出力をPCに繋いだら、電話もYouTubeも自動で文字起こしできるようになった」――急遽テレワークを導入した中小企業の顛末記(97)【急遽テレワーク導入!の顛末記】
                              • 3秒の音声があれば本人そっくりの声で日本語・英語・中国語合成できる「VALL-E X」はやはり脅威。MSが非公開にした技術のOSS版を試して実感した(CloseBox) | テクノエッジ TechnoEdge

                                わずか3秒の元音声から本人そっくりな音声合成が可能な技術「VALL-E X」が誰でも使える形で公開されました。オープンソース版で、ローカルマシンからWebUIで利用できます。さっそくインストールして使ってみました。 以前、ディープラーニングベースの音声・歌声合成ソフトであるDiff-SVC、リアルタイム処理が可能なAIボイチェンRVCを紹介したとき、自分は記事タイトルに「驚異の」という形容詞を付けました。それでも学習には数十分の本人による音声データが必要で、そこまでのデータを用意するのは容易ではありません。それに対してVALL-E Xでは元データが3秒あれば本人に似た声を生成できるのです。

                                  3秒の音声があれば本人そっくりの声で日本語・英語・中国語合成できる「VALL-E X」はやはり脅威。MSが非公開にした技術のOSS版を試して実感した(CloseBox) | テクノエッジ TechnoEdge
                                • SNSへの写真・動画掲載について、ゴールデンボンバーからのお願い

                                  鬼龍院翔の「プッツンてれび」でお伝えした内容について、音声の聴きとりが難しい方もいらっしゃるため、画像にまとめて掲載をいたします。

                                    SNSへの写真・動画掲載について、ゴールデンボンバーからのお願い
                                  • フォントと画像の管理にはこれ!シンプルで使いやすい、WinMac両対応アプリ「Eagle」が神アップデート

                                    以前当ブログで紹介した時からずっと愛用しているEagleがver.2に神アップデートしたので、改めて紹介したいと思います。 簡単に言うと、フォント(ttf,otf,ttc,woffも)、画像(jpg,png,gif,svg,webpはもちろん、raw,psd,ai,xd,sketch,clipも)、動画、音声、PDFやテキストも管理でき、タグ付けやフォルダ分けやカラーフィルターなどで整理も簡単できるアプリです。 Windows, macOS(M1対応)に対応したアプリで、1ライセンスで2つ使用でき、サブスクではなく買い切り、しかもバージョンアップの追加料金なしです。 ver.2が先日リリースされ、ver.1の人は無料でアップデートできます! Eagle Eagleとは Eagle ver.2の神アップデート Eagleのダウンロード・インストール Eagleの使い方 Eagleとは Eag

                                      フォントと画像の管理にはこれ!シンプルで使いやすい、WinMac両対応アプリ「Eagle」が神アップデート
                                    • 誰の声でも100人の声に変えられる声変換システム - Dwango Media Village(ドワンゴメディアヴィレッジ,dmv)

                                      著者の声を録画・録音して声を変換し元の映像と組み合わせてみた映像です。 このときの変換元の音声は撮影用のスマートフォンで録音しており、部屋の残響が含まれるなど声が少し不鮮明になる収録環境ですが、それでもしっかり声変換できていることがわかると思います。 概要 Dwango Media Villageの廣芝です。 誰の声でも狙った複数の人の声に変えることができる声変換システムを開発し、実際に声を変えることができるデモページを公開しました。 (2022年5月 SeirenVoiceシリーズの製品化に伴いデモページは終了しました。) この記事では、声変換技術を研究開発する際に取り組んだ課題について紹介します。 声の変換技術には、リアルタイム性と品質のトレードオフがあります。 既存の声変換システムはリアルタイム性を重視する傾向がある一方、品質を重視したものはあまり見かけません。 品質を優先した声変換

                                        誰の声でも100人の声に変えられる声変換システム - Dwango Media Village(ドワンゴメディアヴィレッジ,dmv)
                                      • Amazon Alexaは「巨大な失敗」と社員が吐露、損失は年間1兆4000億円のペースに

                                        7000億円以上の営業損失を出したデバイス事業の見直しを進めているAmazonが手がける音声アシスタント「Alexa」は、2022年だけで100億ドル(1兆4000億円)を食いつぶす大きな失敗だったと、Amazonの社員が語りました。 Amazon Alexa is a “colossal failure,” on pace to lose $10 billion this year | Ars Technica https://arstechnica.com/gadgets/2022/11/amazon-alexa-is-a-colossal-failure-on-pace-to-lose-10-billion-this-year/ Amazonは営業不振により最大で1万人を解雇する史上最大規模の人員整理を進めており、その中で最も大きな影響を受けているのが音声アシスタントであるAlexa

                                          Amazon Alexaは「巨大な失敗」と社員が吐露、損失は年間1兆4000億円のペースに
                                        • 日本でオーディオブックやポッドキャストが流行らないワケがわかった気がした|りんがる aka 大原ケイ

                                          米英ではオーディオブックがそのうちEブックと同じぐらいのシェアになりそうなくらい急成長しているって伝えると半信半疑なリアクションされる。iTunesのプログラムリスト見ればわかると思うんだけど、日本のポッドキャストってほんと貧困、何もないよね…とは思ってたさ。 しかも、オーディオブックを聞いてみることもしなくて「やっぱ紙で読む方が好き」とか断言してる人の多いこと。アタシなんて『ハリポタ』オーディオ版聞いたら読書人生、変わっちゃったよ? 聞きたいポッドキャストありすぎて、積ん読どころか、積んキャスト、時間なさすぎて時々泣く泣く消してるよ? 耳でも本を楽しめる、知識を得られるってことなんだけど? なんでこんなに温度差があるんだろう? スマートスピーカーが普及しないのと同じ理由なんだろうか? で、なんでかなー?って考えてみたんだけど、これがまた日本らしいと言うか、こういう文化のどこが美しいのかね

                                            日本でオーディオブックやポッドキャストが流行らないワケがわかった気がした|りんがる aka 大原ケイ
                                          • 「みんな怒って帰っちゃうんだよね。約束して、絶対に帰らないって」…声優・日髙のり子が“地獄の苦しみ”を味わった、ETC音声の収録裏話 | 文春オンライン

                                            地獄の苦しみだった収録 「ETC(※)カードが挿入されました」 車に乗ってエンジンを掛けると車内に響き渡る声、この音声を担当しているのが私だということをご存知ない方はまだまだ多い。なのでイベントなどでご披露すると「おお~」と思わず声を洩らす方もたくさんいる。そしてその声がどのキャラクターを演じたときよりも大きかったりして、私のほうがびっくりしてしまう。 反応の大きさは、その声のシェア率に比例している。どの世代にも満遍なく知られている私の声は、今のところ南ちゃんとETCが半々という感じだ。 いやいや出世しましたなぁ~ETC! 今となってはETC音声に起用していただいてありがとうございます、という気持ちだけれど、その収録は、実は地獄の苦しみだった。 「収録の前に一つだけ約束してほしいことがあるんだけど」 ETC音声収録の当日、機械音声の制作を専門にしている会社の社長さんが誰にも聞こえないように

                                              「みんな怒って帰っちゃうんだよね。約束して、絶対に帰らないって」…声優・日髙のり子が“地獄の苦しみ”を味わった、ETC音声の収録裏話 | 文春オンライン
                                            • スピーク (Speak) | シリコンバレー発のAI英会話アプリ

                                              スピーキング特化の AI英会話アプリ最先端のAI英会話アプリを活用して英語に慣れ、的確なAIフィードバックを通じて自然な英語力を身につけましょう。 はじめる → 英 語 を 習 得 す る に は 声 に 出 し て 練 習 す る こ と が 重 要 で すスピークは、実際に英語を声に出し、繰り返し練習してもらうことを重視しています。

                                                スピーク (Speak) | シリコンバレー発のAI英会話アプリ
                                              • 高性能で無料、誰の声にでもなりきれるAIボイチェン「RVC WebUI」がついに日本語表示に対応(CloseBox) | テクノエッジ TechnoEdge

                                                オープンソースのAI声質変換(ボイスチェンジャー)ソフトウェア「RVC WebUI」が、日本語での表示に対応しました。 VITSという声質変換技術をベースにしたRVC(Retrieval-based Voice Changer)に、Webユーザーインタフェースを付加したのが「RVC WebUI」です。

                                                  高性能で無料、誰の声にでもなりきれるAIボイチェン「RVC WebUI」がついに日本語表示に対応(CloseBox) | テクノエッジ TechnoEdge
                                                • マクドナルドが「ティロリティロリ」音源を配布 「ぜひご活用ください」

                                                  日本マクドナルドは1月17日、ポテトが揚がったときに店内で流すタイマー音「公式ティロリサウンド」の配布を始めた。使い方について「作業用BGMとして流すもよし、アラーム音にして目覚めるもよし、ご自身でリミックスして楽しむもよし。ぜひご活用ください」(同社)としている。 同音源を利用した楽曲「ティロリミックス」の公開に合わせた施策。これまでも音源を加工した楽曲などは公開していたが、オリジナル音源を公式に配布するのは初めてという。 関連記事 チキンを温めるゲーミングPC、KFCが正式発表 「ネタじゃなかったの?」ネットざわつく KFCのゲーム部門KFC Gamingが、プレイ中にフライドチキンを温めるゲーミングPC「KFConsole」を正式に発表した。 「星のカービィ」オーケストラ楽譜を無料配布 結婚式での演奏などに利用可能 オーケストラコンサートなどで使用された「星のカービィ」の楽譜が無料配

                                                    マクドナルドが「ティロリティロリ」音源を配布 「ぜひご活用ください」
                                                  • AI歌声合成は、もう人の歌声と区別できないレベルに。東北イタコも追加されたNEUTRINOの新バージョン、0.400が無料でリリース|DTMステーション

                                                    今年に入り、AI歌声合成の動きが激しく、その進化のすごさ、クオリティーの高さには驚くばかりです。中でも注目すべきは今年2月に彗星のように登場し、フリーウェアとして公開されたNEUTRINO(ニュートリノ)です。これはSHACHI(@SHACHI_NEUTRINO)さんが開発するフリーのソフトであり、これまで東北きりたん、謡子、そしてJSUT(いずれも学術的に公開されている歌声データベースを利用して開発している)の3つの歌声ライブラリが同梱されてました。そこに9月18日、新たに東北イタコが追加されたのです(9月18日現在、公開されている0.400には東北きりたん、東北イタコのみが同梱。それ以外については後日公開される模様です)。 先日、「AIきりたんに次ぐ第2のAIシンガー、東北イタコの歌唱データベース制作プロジェクトのクラウドファンディングスタート」という記事でも紹介し、無事にクラウドファ

                                                      AI歌声合成は、もう人の歌声と区別できないレベルに。東北イタコも追加されたNEUTRINOの新バージョン、0.400が無料でリリース|DTMステーション
                                                    • 韓国の高校で出された日本語の試験問題が全然わからないんだが「全部一緒じゃん」「日本の英語教育もこれ」

                                                      ケン(韓国ブロガー・海外在住日本人) @kenkorea2012 韓国の高校で出された日本語の問題です。 問題の下線部分と発音が同じものを選んで下さい。 日本人の皆さん、なめてかかると間違えますよ~😅 pic.twitter.com/baocPS4Hhl

                                                        韓国の高校で出された日本語の試験問題が全然わからないんだが「全部一緒じゃん」「日本の英語教育もこれ」
                                                      • 商用でも利用可能なAI音声合成ソフトウェア『VOICEVOX』がオープンソースとして無料でリリース|DTMステーション

                                                        本日8月1日、音声合成技術の世界に、また画期的な動きがありました。「Seiren Voice」や「Yukarinライブラリ」の開発者としても知られるヒロシバ(@hiho_karuta)さんが、ITAコーパスを利用した商用利用も可能なAI音声合成システム、VOICEVOXなるソフトウェアをオープンソースのとして無料でリリースしたのです。具体的には現時点Windowsで動くシステムで、「ずんだもん」および「四国めたん」の声でテキストを読み上げるシステムとなっています。 これがオープンソースとなったことで、一般ユーザーが自由に利用できるというだけでなく、さまざまなシステムに組み込んで喋らせることが可能になったのが画期的なところ。たとえばロボットなどに組み込んで対話型のシステムを作ることや、観光案内システムに導入して喋らせる……といったこともできるほか、クラウド型のシステムを構築し、ブラウザを経由

                                                          商用でも利用可能なAI音声合成ソフトウェア『VOICEVOX』がオープンソースとして無料でリリース|DTMステーション
                                                        • 叫んでも周囲に声が漏れないBluetoothマイク「mutalk」量産版公開

                                                            叫んでも周囲に声が漏れないBluetoothマイク「mutalk」量産版公開
                                                          • AIによるボイスチェンジャーソフト「Voidol」が期間限定で無償配布

                                                              AIによるボイスチェンジャーソフト「Voidol」が期間限定で無償配布
                                                            • Windows 10は好きな文章を合成音声で簡単に喋らせることができる (1/2)

                                                              こんな簡単なコマンドで、Windowsは「しゃべって」くれる。画面キャプチャーでは声をお聞かせすることはできないが、お手元のWindows PowerShellで試してほしい スクリプトを作るとき、ちょっとユーザーの気を引きたくなることがある。たとえば、少し時間のかかる処理をするときに、終わったことを通知したい場合などだ。あるいは、実行後にすこし時間が経過してからエラーを通知するような場合にも、気を引きたくなることがある。 こんなとき昔のコンピューターならベル音やビープ音を鳴らすのが一般的だった。端末装置からコンピューターを使っていた頃、Ctrl+Gを出力するとベル音が鳴った。マイクロプロセッサが使われ始め、パソコンの原型ができあがった頃、BEEPと呼ばれる機能ができた。プログラムでビットをオンオフし、これをスピーカーに接続することで音を出していた。今もマザーボード上には、そのための小さな

                                                                Windows 10は好きな文章を合成音声で簡単に喋らせることができる (1/2)
                                                              • 19歳・東工大2年生が社長。音声合成界に衝撃を与えたCoeFont STUDIOが目指すこれからの世界|DTMステーション

                                                                4月23日、彗星のように現れたネット上のサービス、CoeFont STUDIO(コエ・フォント・スタジオ)は、誰でも無料で使える音声合成サービスということで、瞬く間に広がり、2日で累計ユーザー数が6万人を突破。すでに20万人を超えるところまで来ているようです。日本語でテキストを入力すれば、非常に滑らかな声でしゃべってくれ、その音声をユーザーは商用を含めて自由に利用できるという画期的ともいえるサービスとなっているのです。 このサービスを立ち上げたのは、なんと東京工業大学2年生、19歳の早川尚吾さん。株式会社Yellstonを立ち上げ、その新サービスとして、CoeFont STUDIOをスタートさせたのです。もちろん株式会社ですから、今後ビジネス展開をしていくことを目論んでいるわけですが、それはCoeFont STUDIOの延長線上にあるもので、世の中を大きく変えていく可能性もありそうです。先

                                                                  19歳・東工大2年生が社長。音声合成界に衝撃を与えたCoeFont STUDIOが目指すこれからの世界|DTMステーション
                                                                • わずか10秒の元音声でもリアルな「なりきりボイチェン」できる無料ソフト『Seed-VC』は過去最高レベルの再現度か(CloseBox) | テクノエッジ TechnoEdge

                                                                  筆者はUTAUによる波形接続の時代から「その人の声になりきる」技術を試してきましたが、このほど、その中でも画期的と思える技術に出会いました。『Seed-VC』(Seed Voice Conversion)というオープンソースソフトです。 ■AIボイチェンの進化どこが画期的なポイントかというと、高い音質を維持しながら、ゼロショット、つまりファインチューニングをせずに、1秒から30秒までの短い音源を参照するだけで、短時間でオリジナルに近いボイチェンができるところにあります。 以前紹介したDiff-SVCやRVCは、オリジナル音声に近いボイチェンが可能ですが、学習にはそれなりの長さのオーディオデータと高性能GPUによる処理が必要です。

                                                                    わずか10秒の元音声でもリアルな「なりきりボイチェン」できる無料ソフト『Seed-VC』は過去最高レベルの再現度か(CloseBox) | テクノエッジ TechnoEdge
                                                                  • 全滅したウクライナ軍守備隊とされる音声明るみに、ロシア海軍に「消え失せろ」

                                                                    (CNN) 黒海に浮かぶ島を防衛するウクライナ軍兵士と、ロシア海軍の将校が交わしたものとみられる音声が明るみに出た。 ウクライナのゼレンスキー大統領によると、スネーク島の守備に当たっていた兵士全員が戦死したと報告されているという。 同大統領は、「国境警備隊の全員が英雄的に死亡したが、降伏しなかった。彼らには死後、ウクライナの英雄勲章が授与されることになる」と述べた。 ロシアの戦艦は24日のある時点で同島に接近。 両者のやり取りとされる音声によると、ロシア軍の将校が「こちらは軍艦、ロシア軍の軍艦。流血と不必要な犠牲を回避するため、武器を置くことを提案する。さもなくば、爆撃を受けることになる」と述べた。 ウクライナ兵士からのものとされる応答は、「ロシア軍艦、消え失せろ」という内容だった。

                                                                      全滅したウクライナ軍守備隊とされる音声明るみに、ロシア海軍に「消え失せろ」
                                                                    • AITuber育成完全入門(冴えないAITuberの育て方)|みゆきP

                                                                      はじめにAITuberと書いて、アイチューバーと読みます。VTuberとは違って中の人が存在しないことが特徴です。 AITuber開発は高尚な深層学習のモデル開発ではまったくなく、むしろ、ただの推しの育成ゲームです。 なので、GPUもPythonもいりません。PCさえあれば今すぐはじめられます! この記事でできること以下のようなAITuberが作れます。可愛いですね(親バカ) 妹系AITuber🌸桜井りりか Twitter: https://twitter.com/Ririka_AIsister YouTube: https://www.youtube.com/@ririkasakurai 早い人で週末に2日で作れると思います! 土日に作ったAITuberをみんなに公開しちゃいましょう!!! AITuber作成手順立ち絵の生成 モデル・VAEの選定 Google ColabでStable

                                                                        AITuber育成完全入門(冴えないAITuberの育て方)|みゆきP
                                                                      • ずんだもんが無料で使える、超高性能AIボイスチェンジャー、ParakeetVCが公開。1か月間は全キャラクタ、全機能が無料|DTMステーション

                                                                        自分の声をまったく別のキャラクタの声に変えることを実現するAIボイスチェンジャー。エフェクトを使って自分の声を加工する従来のボイスチェンジャーとは異なり、自分の声は完全に消えて、まったく別人になりきれるのが特徴で、これまでもVoidolやCoeFontボイスチェンジャーといったものを記事でも紹介してきたほか、中国系のフリーウェアでもかなりの精度を持ったものがいろいろ登場してきています。 そうした中、12月25日、まったく新たなAIボイスチェンジャー、Parakeet.VC(パラキート・ブイシー)が、福島県のベンチャー企業、Parakeet株式会社からリリースされました。ここには東北ずん子や東北きりたん、またずんだもんをはじめ、計109種類の声が収録されており、ユーザーはそれらを選んで、マイクで話せばリアルタイムにキャラクタの声に変換することが可能です。既存のAIボイスチェンジャーと比較して

                                                                          ずんだもんが無料で使える、超高性能AIボイスチェンジャー、ParakeetVCが公開。1か月間は全キャラクタ、全機能が無料|DTMステーション
                                                                        • 「ガルパンは騒がしい内容なのに全ての音がはっきり聞こえる」──聴覚障がいのアニメファンが語る岩浪音響監督の丁寧すぎる仕事っぷり

                                                                          「ガルパンは騒がしい内容なのに全ての音がはっきり聞こえる」──聴覚障がいのアニメファンが語る岩浪音響監督の丁寧すぎる仕事っぷり 2020年3月、あるツイートが話題となった。 聴覚障がい者であるくらはしさんが、アニメ音響監督の岩浪美和さんの手掛けた作品がいかに聞きやすいかを記したものだ。 岩浪音響監督は「サイコパス」シリーズ、『ガールズアンドパンツァー』、『ソードアートオンライン』、「ジョジョ」シリーズなど、数多くの人気作を手掛けている。 聴覚障害者としてアニメの声の聞き取りやすさをメモしているんですが、PSYCHO-PASS 3の聞き取りやすさは神レベルで、無線声、ささやき、室内残響の演出でもほとんどすべて聞き取れる。 音響監督は岩浪美和さんという方で、担当作品を調べてみたら「聞き取りにくかったメモ」に該当なしでした。 — くらはし (@TareObjects) March 27, 202

                                                                            「ガルパンは騒がしい内容なのに全ての音がはっきり聞こえる」──聴覚障がいのアニメファンが語る岩浪音響監督の丁寧すぎる仕事っぷり
                                                                          • 声以外が消える!? 無料のノイズ除去「NVIDIA Broadcast」がスゴい【藤本健のDigital Audio Laboratory】

                                                                              声以外が消える!? 無料のノイズ除去「NVIDIA Broadcast」がスゴい【藤本健のDigital Audio Laboratory】
                                                                            • Clubhouse リアルタイム配信の仕組みについて (解説編)

                                                                              Cloubhouse はすでに OSS である Janus Gateway に切り替えており Agora は使用していないようです ライセンス Creative Commons — 表示 - 非営利 - 改変禁止 4.0 国際 — CC BY-NC-ND 4.0 前提 ざっくりと雑に解説。 どんな技術を使っていてこんな感じだろうという妄想は以下をどうぞ。 Clubhouse リアルタイム配信の仕組みについて (妄想編) 著者 商用 WebRTC SFU 開発者 WebRTC プロトコルスタック実装者 End to End Encryption プロトコルスタック実装者 Clubhouse の仕組みはとてもシンプルで配信者が N 人で、それを数千人が聞くという co-streaming と呼ばれる仕組みの一つ。この方式は今までは主に映像ありでパネルディスカッション的な使い方が主だっだ。それを

                                                                                Clubhouse リアルタイム配信の仕組みについて (解説編)
                                                                              • 動画の雑音をほぼ消す技術、米国などのチームが開発 声のみが強調されすぎてアフレコみたいな結果に

                                                                                Innovative Tech: このコーナーでは、テクノロジーの最新研究を紹介するWebメディア「Seamless」を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。 米Dolby LaboratoriesとスペインのUniversitat Pompeu Fabraの研究チームが開発した「Universal Speech Enhancement With Score-based Diffusion」は、収録した映像のバックグラウンドノイズ(背景雑音)を強力に除去する技術だ。動画撮影した雑音を消し去り、話す声だけをくっきり残すことができる。強力すぎるため、映像がアフレコを挿入したみたいな仕上がりになってしまう。 実世界で録音した音声には必然的に背景の雑音や残響が含まれ、不快感や明瞭度の妨げになるためノイズ除去が行われる。最近では深層学習の登場によりノイズ除

                                                                                  動画の雑音をほぼ消す技術、米国などのチームが開発 声のみが強調されすぎてアフレコみたいな結果に
                                                                                • AIが架空の女性やセクシーな写真、ストーリーや音声まで作成する「ハイパーポルノ」

                                                                                  非常に高度なレベルで文章を生成できる対話型AIのChatGPTや、画像生成モデルのDALL・Eなどを始めとした画像生成AIの発達により、誰でもクオリティの高い文章やイラスト、画像を作成できるようになりました。これらの生成AIを用いることで、存在しない女性のセクシーな自撮りやセリフの吹き込みがある官能的なストーリーなどを全てAIで作成した「ハイパーポルノ」に注目が集まっています。 Mindy https://thisgirlnextdoordoesnotexist.net/mindy/ 生成AIはジャンルや種類を問わず文章や画像を作成できますが、ChatGPTに用いられている言語モデル「GPT-4」には不適切な質問をブロックするコンテンツフィルターが設定されていたり、画像生成AIの「Stable Diffusion」には成人向け表現を含む画像を黒塗りするセーフティーフィルターがあったりと、コ

                                                                                    AIが架空の女性やセクシーな写真、ストーリーや音声まで作成する「ハイパーポルノ」

                                                                                  新着記事