Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                

並び順

ブックマーク数

期間指定

  • から
  • まで

1 - 30 件 / 30件

新着順 人気順

TTSの検索結果1 - 30 件 / 30件

タグ検索の該当結果が少ないため、タイトル検索結果を表示しています。

TTSに関するエントリは30件あります。 AIgithub音声 などが関連タグです。 人気エントリには 『文字を入力するだけで「萌え声」を簡単一発生成してくれる「Moe TTS」』などがあります。
  • 文字を入力するだけで「萌え声」を簡単一発生成してくれる「Moe TTS」

    萌(も)え声を出したくても出せない人でも簡単に簡単に萌え声を生成できる「Moe TTS」が公開されていたので利用してみました。Moe TTSは機械学習を用いて実際のゲームソフトの音声等を合成しており、機械学習でアプリケーションを開発するコミュニティ「Hugging Face」内で公開されています。 Moe TTS - a Hugging Face Space by skytnt https://huggingface.co/spaces/skytnt/moe-tts Moe TTSにアクセスするとこんな感じの画面が表示されます。 そのまま上にスクロールすると文字の入力ボックスが現れます。デフォルトで「こんにちは。」と入力されていたので、今回はこれに続けて「今日も寒いですね。」と入力。そして、「Generate」をクリックします。 すると、ページ下部に再生ボタンが現れます。そのまま再生ボタン

      文字を入力するだけで「萌え声」を簡単一発生成してくれる「Moe TTS」
    • Moe TTS - a Hugging Face Space by skytnt

      Discover amazing ML apps made by the community

        Moe TTS - a Hugging Face Space by skytnt
      • yoosee on Twitter: "日本のソフトウェア開発がいまいちパッとしないの、世界は既に「ソフトウェアをどれだけ高速に変更・改良し続けるか」に全力で投資しているのに、日本は未だに「ソフトウェアも最初にドカンと開発投資して後はそのまま使う」発想が(少なくともスー… https://t.co/tts8a1jFJx"

        日本のソフトウェア開発がいまいちパッとしないの、世界は既に「ソフトウェアをどれだけ高速に変更・改良し続けるか」に全力で投資しているのに、日本は未だに「ソフトウェアも最初にドカンと開発投資して後はそのまま使う」発想が(少なくともスー… https://t.co/tts8a1jFJx

          yoosee on Twitter: "日本のソフトウェア開発がいまいちパッとしないの、世界は既に「ソフトウェアをどれだけ高速に変更・改良し続けるか」に全力で投資しているのに、日本は未だに「ソフトウェアも最初にドカンと開発投資して後はそのまま使う」発想が(少なくともスー… https://t.co/tts8a1jFJx"
        • GitHub - Plachtaa/VALL-E-X: An open source implementation of Microsoft's VALL-E X zero-shot TTS model. Demo is available in https://plachtaa.github.io/vallex/

          You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

            GitHub - Plachtaa/VALL-E-X: An open source implementation of Microsoft's VALL-E X zero-shot TTS model. Demo is available in https://plachtaa.github.io/vallex/
          • GitHub - mozilla/TTS: :robot: Deep learning for Text to Speech (Discussion forum: https://discourse.mozilla.org/c/tts)

            You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

              GitHub - mozilla/TTS: :robot: Deep learning for Text to Speech (Discussion forum: https://discourse.mozilla.org/c/tts)
            • TTS on Twitter: "1月15日の16時10分~20時50分までのひまわり8号のバンド8(6.2μm)上層水蒸気の画像から前後フレームの差分(10分間)を取ってみると、日本時間20時40分頃のトンガ諸島の火山噴火によるソニックブーム(?)の到着が可視化… https://t.co/QGvFRSwrzG"

              1月15日の16時10分~20時50分までのひまわり8号のバンド8(6.2μm)上層水蒸気の画像から前後フレームの差分(10分間)を取ってみると、日本時間20時40分頃のトンガ諸島の火山噴火によるソニックブーム(?)の到着が可視化… https://t.co/QGvFRSwrzG

                TTS on Twitter: "1月15日の16時10分~20時50分までのひまわり8号のバンド8(6.2μm)上層水蒸気の画像から前後フレームの差分(10分間)を取ってみると、日本時間20時40分頃のトンガ諸島の火山噴火によるソニックブーム(?)の到着が可視化… https://t.co/QGvFRSwrzG"
              • 1000憶パラメータLLMをシングルCPUでローカル実行できる「bitnet.cpp 1.0」、新テキスト読み上げAI「F5-TTS」など生成AI技術6つを解説(生成AIウィークリー) | テクノエッジ TechnoEdge

                この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する「生成AIウィークリー」(第68回)では、テキストを読み上げるTTSシステム「F5-TTS」や、会話AIモデル「Ichigo」を取り上げます。また、単一CPUでLLMで実行できる、Microsoftの1ビットLLM推論フレームワーク「bitnet.cpp 1.0」などをご紹介します。

                  1000憶パラメータLLMをシングルCPUでローカル実行できる「bitnet.cpp 1.0」、新テキスト読み上げAI「F5-TTS」など生成AI技術6つを解説(生成AIウィークリー) | テクノエッジ TechnoEdge
                • OpenAI TTS(Text to Speech) を Node.js で試してみた

                  先日開催された OpenAI Dev Day で新たに発表された、テキストから音声を生成する OpenAI TTS (Text To Speech) API が面白そうだったので、早速ですが Node.js 環境で簡単に試してみました。 先日開催された OpenAI Dev Day では大幅な機能追加に加え、いくつかの新しい API も発表されました。 その中で、テキストから音声を生成する OpenAI TTS (Text To Speech) API が面白そうだったので、早速ですが簡単に試してみることに。 Text to speech の概要や、API の リファレンスは下記にあります。 Text to speech - OpenAI API Create speech - API Reference - OpenAI API で、ご丁寧に Python や Node.js でのリクエ

                    OpenAI TTS(Text to Speech) を Node.js で試してみた
                  • GitHub - fishaudio/fish-speech: SOTA Open Source TTS

                    Zero-shot & Few-shot TTS: Input a 10 to 30-second vocal sample to generate high-quality TTS output. For detailed guidelines, see Voice Cloning Best Practices. Multilingual & Cross-lingual Support: Simply copy and paste multilingual text into the input box—no need to worry about the language. Currently supports English, Japanese, Korean, Chinese, French, German, Arabic, and Spanish. No Phoneme Depe

                      GitHub - fishaudio/fish-speech: SOTA Open Source TTS
                    • TTSの発展は「誰でもオーディオブック」の世界を開くか 無料で商用利用もできる「VOICEVOX」の実用度

                      TTSの発展は「誰でもオーディオブック」の世界を開くか 無料で商用利用もできる「VOICEVOX」の実用度:小寺信良のIT大作戦(1/3 ページ) オーディオブックは、米国では人気の高いコンテンツだ。 オーディオブックとは、底本となる書籍をプロのナレーターが朗読したもので、小説やビジネス書など数多くのコンテンツがある。とはいえ、丸々本1冊分なので、全部朗読で聞くと10時間を超えるものも少なくない。 本は読みたいが、時間があるのは運転中だけ、みたいな人たちのニーズが高い。米国ではサンフランシスコやロサンジェルスのような大都市でも、通勤は車だったりする。ある意味、「渋滞のお供」だったりもする。 日本では2022年1月27日より、Amazon傘下のオーディオコンテンツサービス「Audible」が、会員向けにオーディオブックの聴き放題サービスを開始した。これまでは月額1500円を払いつつも、聴ける

                        TTSの発展は「誰でもオーディオブック」の世界を開くか 無料で商用利用もできる「VOICEVOX」の実用度
                      • GitHub - neonbjb/tortoise-tts: A multi-voice TTS system trained with an emphasis on quality

                        You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

                          GitHub - neonbjb/tortoise-tts: A multi-voice TTS system trained with an emphasis on quality
                        • AI Voice Generator | Advanced Text-to-Speech (TTS)

                          RESPEECHER IS YOUR RELIABLE AI VOICE PARTNER THAT DELIVERS AMAZING AUTHENTIC VOICES ACROSS INDUSTRIES

                            AI Voice Generator | Advanced Text-to-Speech (TTS)
                          • GitHub - coqui-ai/TTS: 🐸💬 - a deep learning toolkit for Text-to-Speech, battle-tested in research and production

                            You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

                              GitHub - coqui-ai/TTS: 🐸💬 - a deep learning toolkit for Text-to-Speech, battle-tested in research and production
                            • GitHub - NATSpeech/NATSpeech: A Non-Autoregressive Text-to-Speech (NAR-TTS) framework, including official PyTorch implementation of PortaSpeech (NeurIPS 2021) and DiffSpeech (AAAI 2022)

                              You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

                                GitHub - NATSpeech/NATSpeech: A Non-Autoregressive Text-to-Speech (NAR-TTS) framework, including official PyTorch implementation of PortaSpeech (NeurIPS 2021) and DiffSpeech (AAAI 2022)
                              • Processing and narrating a video with GPT's visual capabilities and the TTS API | OpenAI Cookbook

                                Processing and narrating a video with GPT's visual capabilities and the TTS API This notebook demonstrates how to use GPT's visual capabilities with a video. GPT-4o doesn't take videos as input directly, but we can use vision and the 128K context window to describe the static frames of a whole video at once. We'll walk through two examples: Using GPT-4o to get a description of a video Generating a

                                  Processing and narrating a video with GPT's visual capabilities and the TTS API | OpenAI Cookbook
                                • 初心者が一か月でTTSつくってみた - Qiita

                                  概要 進級制作で発表するための作品として、友人の声からTTSを作成したので、作り方や難しかったところ等を記事にしてみました 参考にさせていただいたページは最後に記載しています 目次 1.TTSとは 2.きっかけ 3.製作 4.終わりに 5.参考記事 TTSとは Text-To-Speakつまり音声合成のことで、 ゆっくり実況でおなじみの「棒読みちゃん」やVOICEROIDの「東北ずん子」、VOICEVOX「ずんだもん」等のことである きっかけ 第一に筆者が音声合成読み上げソフトのキャラクターが好きであり、それを利用した動画コンテンツをよくみる ソフト自体も所持しており、購入しているソフトは20本以上になる推しはFEEちゃん また、VOICEVOXの登場でブームが来ているというのもあり、作ってみたいと入学時から思っていたため、進級制作として作成した 製作 実際に制作する作業に入る前に目標を定

                                    初心者が一か月でTTSつくってみた - Qiita
                                  • Japanese Parler-TTS - a 2121-8 Collection

                                    Parler-TTSを基に、日本語でのテキスト読み上げを可能にするよう再学習したモデルです。本モデルは、軽量でありながら高品質な音声生成を提供します。

                                      Japanese Parler-TTS - a 2121-8 Collection
                                    • GitHub - RVC-Boss/GPT-SoVITS: 1 min voice data can also be used to train a good TTS model! (few shot voice cloning)

                                      You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

                                        GitHub - RVC-Boss/GPT-SoVITS: 1 min voice data can also be used to train a good TTS model! (few shot voice cloning)
                                      • GitHub - uezo/dify-voicevox-tts: VOICEVOX text-to-speech custom model for Dify

                                        You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

                                          GitHub - uezo/dify-voicevox-tts: VOICEVOX text-to-speech custom model for Dify
                                        • GitHub - rany2/edge-tts: Use Microsoft Edge's online text-to-speech service from Python WITHOUT needing Microsoft Edge or Windows or an API key

                                          You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

                                            GitHub - rany2/edge-tts: Use Microsoft Edge's online text-to-speech service from Python WITHOUT needing Microsoft Edge or Windows or an API key
                                          • OpenAIのWhisper, TTS, Assistants APIで長期記憶を持った音声会話型ボットを作る

                                            from openai import OpenAI client = OpenAI() assistant_name = "My AI Assistant" model_name = "gpt-4-1106-preview" instructions = """ あなたは優秀な会話型アシスタントです。 あなたはとてもフレンドリーな性格で常にテンションが高いです。 ### 指示 - 関西弁で話してください。 - 200文字以内で回答をしてください。 """ assistant = client.beta.assistants.create( name=assistant_name, model=model_name, instructions=instructions, ) 今回新たに追加されたAssistants APIを使ってAssistantを作成します。 アシスタント識別子の nam

                                              OpenAIのWhisper, TTS, Assistants APIで長期記憶を持った音声会話型ボットを作る
                                            • ラズパイ(Node-RED)でVOICEVOXを使い中品質のTTSを試す - Qiita

                                              はじめに VOICEVOXをkubernetes(arm64)にデプロイしてNode-REDから利用してみました。 ソフトウェアには「中品質」とあるのですが、私には高品質と遜色ないように思えます。 前提環境 いつもの「おうちkubernetesクラスタ」と、arm64コンテナイメージのビルド用としてM1搭載のMac miniを使用しております。 Raspberry Pi 4B kubernetes 1.22.0 Private Registry (http) Mac mini 2020(M1) + Docker Desktop Node-RED v2.2.1 on kubernetes VOICEVOXコンテナの作成 Mac mini 2020(M1)でコンテナをビルドします。(※Raspberry Pi 4Bでは試してません) 【2022/3/23】※COREとENGINEを0.11.4

                                                ラズパイ(Node-RED)でVOICEVOXを使い中品質のTTSを試す - Qiita
                                              • En Ligne Estragest tts. cheter De L’Estragest tts En Ligne. - Forums

                                                Une Place pour Tous ! La Fédération des Maisons de Quartier de Saint-Nazaire est une association qui regroupe et coordonne les Maisons de Quartiers ainsi qu'un Secteur Insertion sur la Ville. Nos actions s'adressent à tous, sans distinction d'âge, de situation sociale, d'appartenance culturelle... Ouvertes et Solidaires Sur chaque structure, une association d'habitants en lien avec une équipe de p

                                                  En Ligne Estragest tts. cheter De L’Estragest tts En Ligne. - Forums
                                                • À Vendre Femiderm tts. Femiderm tts A Vendre En Ligne. - Forums

                                                  Une Place pour Tous ! La Fédération des Maisons de Quartier de Saint-Nazaire est une association qui regroupe et coordonne les Maisons de Quartiers ainsi qu'un Secteur Insertion sur la Ville. Nos actions s'adressent à tous, sans distinction d'âge, de situation sociale, d'appartenance culturelle... Ouvertes et Solidaires Sur chaque structure, une association d'habitants en lien avec une équipe de p

                                                    À Vendre Femiderm tts. Femiderm tts A Vendre En Ligne. - Forums
                                                  • Home AssistantでTTS(Text To Speech)を利用する。google-home-notifierの一歩先へ。 - Qiita

                                                    Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? Home AssistantにはTTS(Text To Speech)機能が標準で用意されています。 任意のテキストをChromecastでGoogle Homeなどに喋らせることができます。 ブラウザでダッシュボード画面を開いてテキストボックスに入力して喋らせたり、REST APIで呼ぶことも可能です。 下記のようなことができます。 Home AssistantのText to Speech(TTS)でGoogle Home系にキャストできるのよさげ。 google-home-notifierはGoogle翻訳TTSを非公式に使ってて

                                                      Home AssistantでTTS(Text To Speech)を利用する。google-home-notifierの一歩先へ。 - Qiita
                                                    • Bert-VITS2による高品質で自然な音声合成(TTS)

                                                      「テキスト音声合成(TTS)をローカルマシンで行いたい」 「テキストから高品質で自然な音声を生成したい」 このような場合には、Bert-VITS2がオススメです。 この記事では、Bert-VITS2について解説しています。 本記事の内容 Bert-VITS2とは?Bert-VITS2のシステム要件Bert-VITS2のインストールBert-VITS2の動作確認 それでは、上記に沿って解説していきます。

                                                        Bert-VITS2による高品質で自然な音声合成(TTS)
                                                      • Gonzalo Espinoza Graham 🏴‍☠️ on X: "GPT-4V + TTS = AI Sports narrator 🪄⚽️ Passed every frame of a football video to gpt-4-vision-preview, and with some simple prompting asked to generate a narration No edits, this is as it came out from the model (aka c

                                                        • GitHub - abus-aikorea/voice-pro: Gradio Web UI for UVR5, YT-DLP, Whisper, TTS, and Translator.

                                                          You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

                                                            GitHub - abus-aikorea/voice-pro: Gradio Web UI for UVR5, YT-DLP, Whisper, TTS, and Translator.
                                                          • tts524のブックマーク - はてなブックマーク

                                                            スイーツ作りにも欠かせない「牛乳」が今、危機的状況に陥っている。生産コストの上昇で離農する酪農家が増えて、全国の酪農家の数が初めて1万戸を下回ったことが明らかになった。酪農家の減少により、この先国産の牛乳が減少すれば、商品の価格にも影響する可能性があるという。 「牛乳」がピンチ…酪農家数が1万戸以下に たっぷりと盛った作りたての生クリームにシャインマスカットを飾り付け。人気のブランドイチゴ「あまおう」をふんだんに使ったクリスマス限定パフェだ。 この記事の画像(31枚) 東京・江戸川区にある「フォーシーズンズカフェ」は、パフェやケーキがオーダーバイキングで思う存分食べられると評判のカフェ。 フォーシーズンズカフェ・村杉淳一店長: 牛乳は欠かせない食材です。牛乳だけでも1箱12本、1ダースですから、それくらいは1日大体使いますね。 スイーツ作りにも欠かせない、その牛乳が今、危機的状況に陥ってい

                                                            • 1000憶パラメータLLMをシングルCPUでローカル実行できる「bitnet.cpp 1.0」、新テキスト読み上げAI「F5-TTS」など生成AI技術6つを解説(生成AIウィークリー)(テクノエッジ) - Yahoo!ニュース

                                                                1000憶パラメータLLMをシングルCPUでローカル実行できる「bitnet.cpp 1.0」、新テキスト読み上げAI「F5-TTS」など生成AI技術6つを解説(生成AIウィークリー)(テクノエッジ) - Yahoo!ニュース
                                                              1

                                                              新着記事