Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                

並び順

ブックマーク数

期間指定

  • から
  • まで

321 - 360 件 / 532件

新着順 人気順

voiceの検索結果321 - 360 件 / 532件

  • Clubhouse

    Huuuge group voice notes with all of your friends

      Clubhouse
    • 「響け!ユーフォニアム」約4年ぶりの新作“アンコン編”は来年夏に上映、PV公開(動画あり)

      アニメ「響け!ユーフォニアム」シリーズの約4年ぶりとなる続編として、「特別編 響け!ユーフォニアム~アンサンブルコンテスト~」が2023年夏に劇場上映されることが決定。同作の第1弾キービジュアルと第1弾PVが公開された。 2023年に「アンサンブルコンテスト編」がBlu-rayで発売されるとともに、劇場で特別上映されることが発表されていたアニメ「響け!ユーフォニアム」。第1弾キービジュアルには部長になった久美子や麗奈、葉月、秀一などおなじみのメンバーを中心に結成された、ともにアンサンブルコンテスト出場を目指すチームのメンバーが描かれている。第1弾PVはこれまでのシリーズで描かれてきた別れや挫折などを経て、北宇治高校吹奏楽部のバトンが久美子の世代に渡ってきたことがわかる映像に仕上げられた。 久美子役は黒沢ともよ、葉月役は朝井彩加、緑輝役は豊田萌絵、麗奈役は安済知佳と、北宇治カルテットのキャス

        「響け!ユーフォニアム」約4年ぶりの新作“アンコン編”は来年夏に上映、PV公開(動画あり)
      • OpenAI、「ChatGPT」と「Whisper」のAPIを公開 料金体系、データの利用ポリシーは?

        AI関連技術を開発する非営利組織OpenAIは2023年3月1日(米国時間)、対話に特化した言語モデル「ChatGPT」と汎用(はんよう)の音声認識モデル「Whisper」をAPIで利用できるようにしたと発表した。APIの公開に合わせて、利用規約を開発者ニーズにより良く対応できるように改訂したことも明らかにした。 ChatGPT APIは1000トークン当たり0.002ドルで提供 関連記事 ChatGPTとは何か そのできること/できないこと OpenAIがリリースした人との対話をターゲットとする大規模な言語モデル「ChatGPT」。その概要について見てみましょう。 サイバー犯罪者も「ChatGPTを使ってコーディング」をしている チェック・ポイント チェック・ポイント・ソフトウェア・テクノロジーズは脅威アクターがOpenAIのChatGPTを悪用して悪質なコードを生成していることを、実例

          OpenAI、「ChatGPT」と「Whisper」のAPIを公開 料金体系、データの利用ポリシーは?
        • Spotify上でネットラジオ「音泉」のコンテンツが利用可能に

            Spotify上でネットラジオ「音泉」のコンテンツが利用可能に
          • 後藤ひとり役・青山吉能が語る、映画館で味わう結束バンドの物語への期待――『劇場総集編ぼっち・ざ・ろっく! Re:』公開記念インタビュー

            後藤ひとり役・青山吉能が語る、映画館で味わう結束バンドの物語への期待――『劇場総集編ぼっち・ざ・ろっく! Re:』公開記念インタビュー 極度の人見知りで陰キャな少女・後藤ひとりと、彼女がメンバーとして加入する4人組バンド・結束バンドの活動と成長を描くTVアニメ『ぼっち・ざ・ろっく!』。2022年に放送されて一躍話題作となった本アニメを再編集した劇場総集編の前編『劇場総集編ぼっち・ざ・ろっく! Re:』が、6月7日より映画館で公開される。そこで今回は主人公の後藤ひとり役を務める声優・青山吉能に直撃。本作の見どころや期待しているポイント、結束バンドとしてのリアルライブをはじめ広がり続ける作品への想いについて話を聞いた。 INTERVIEW & TEXT BY 北野 創 大迫力のスクリーンと音響だからこその『ぼっち・ざ・ろっく!』 続きを読む

              後藤ひとり役・青山吉能が語る、映画館で味わう結束バンドの物語への期待――『劇場総集編ぼっち・ざ・ろっく! Re:』公開記念インタビュー
            • Windows版「OneNote」アプリに文字起こし機能 ~複数話者を識別、ペン入力と同期再生も/まずは「Office Insider」で。段階的に提供範囲を拡大

                Windows版「OneNote」アプリに文字起こし機能 ~複数話者を識別、ペン入力と同期再生も/まずは「Office Insider」で。段階的に提供範囲を拡大
              • Amazon Echoの反応を消極的にする方法 | ライフハッカー・ジャパン

                iPhone 15 Pro Maxが4.7万円OFFの衝撃。型落ちでもいいなら即ポチOKです #Amazon初売り

                  Amazon Echoの反応を消極的にする方法 | ライフハッカー・ジャパン
                • RØDEのスタジオマイクNT1の第5世代は、爆音でも音割れしない32bit float対応。アナログでも使えるハイブリッド構造がスゴイ|DTMステーション

                  すでにご存じの方もいらっしゃると思いますが、3月末にRØDEから同社を代表するマイクであるNT1の第5世代モデル、NT1 5th Generationが発売されています(税込実売価格:41,580円前後)。お馴染みのシルバーモデルに加えブラックモデルの2ラインナップとなっており、これまでの「あたたかくシルキーなサウンド」を継承しつつ、世界初と画期的な機構を取り入れたマイクとなっているんです。 それは従来通り、XLRケーブルを使って利用するコンデンサマイクでありながら、XLRケーブルの変わりにUSB Type-Cケーブルでの接続が可能で、USBを使った場合、爆音でも音割れしない32bit floatに対応したデジタルマイクとして使える仕組みになっているんです。しかもその音をモニターするのは手持ちのオーディオインターフェイスが利用できるというトリッキーなドライバシステムが用意されているなど、非

                    RØDEのスタジオマイクNT1の第5世代は、爆音でも音割れしない32bit float対応。アナログでも使えるハイブリッド構造がスゴイ|DTMステーション
                  • 音声合成してみよう

                    第63回シェル芸勉強会のLTで使った資料です

                      音声合成してみよう
                    • 無償のiOS版「ChatGPT」を早速使ってみた ~ついに来た公式アプリは優秀な音声入力機能がいい!/基本は同じでも直感的かつスムーズな手触りに好印象【やじうまの杜】

                        無償のiOS版「ChatGPT」を早速使ってみた ~ついに来た公式アプリは優秀な音声入力機能がいい!/基本は同じでも直感的かつスムーズな手触りに好印象【やじうまの杜】
                      • NVIDIA RTX Voice: Setup Guide

                        NVIDIA RTX Voice is a new plugin that leverages NVIDIA RTX GPUs and their AI capabilities to remove distracting background noise from your broadcasts, voice chats, and remote video conferencing meetings. This allows users to "go live" or join a meeting without having to worry about unwanted sounds like loud keyboard typing or other ambient noise in noisy environments. RTX Voice also suppresses bac

                          NVIDIA RTX Voice: Setup Guide
                        • ぼっち・ざ・ろっく!:“喜多ちゃん”長谷川育美が語る神回 「あのバンド」「ギターと孤独と蒼い惑星」ライブの緊張感 - MANTANWEB(まんたんウェブ)

                          「ぼっち・ざ・ろっく!」は、2018年から連載中の音楽マンガ。ギターを愛する孤独な少女・後藤ひとり(ぼっちちゃん)が、ひょんなことから伊地知虹夏が率いる結束バンドに加入することになる……というストーリー。 第8話では、結束バンドの4人がライブハウスSTARRYで初のライブに挑んだ。1曲目の「ギターと孤独と蒼い惑星」は、緊張もあって歌、演奏がボロボロで、不穏な空気が流れる。空気を変えたのは、ひとりだった。ひとりは「このままじゃイヤだ!」と突如、ギターを演奏し、メンバーを引っ張る。2曲目の「あのバンド」で素晴らしい歌と演奏を聞かせ、ライブを成功させる。 12月28日に発売される結束バンドのアルバム「結束バンド」には「ギターと孤独と蒼い惑星」「あのバンド」が収録されるが、アニメで流れたバージョンとは違う音源が収録されるという。 「CDに収録される『あのバンド』のフルバージョンとアニメで流れたライ

                            ぼっち・ざ・ろっく!:“喜多ちゃん”長谷川育美が語る神回 「あのバンド」「ギターと孤独と蒼い惑星」ライブの緊張感 - MANTANWEB(まんたんウェブ)
                          • 通話時間1日200分。もうひとつの現実とつながるボイチャアプリ「パラレル」ユーザー急増の理由と、「欲しいかどうか」使ってみないとわからないユーザーヒアリングの罠|アプリマーケティング研究所

                            通話時間1日200分。もうひとつの現実とつながるボイチャアプリ「パラレル」ユーザー急増の理由と、「欲しいかどうか」使ってみないとわからないユーザーヒアリングの罠 ボイスチャットアプリ「パラレル」を運営するReactさんにお話を伺いました。ダイジェスト版は漫画でまとめています。 ・React 青木さん(@Joaoki)、歳原さん(@react_taiki) ・パラレル(App Store、Google Play) 【Reactさんより告知】React社では採用も強化中(エンジニア、マーケターなど)とのことで、ご興味ある方は採用募集ページよりどうぞ。 【取材申請】取材をご希望の会社さまは、取材申請フォームよりオファーいただければと思います。(スマホアプリ以外でもOKです) 以下、note購読者向けに、インタビューの「テキスト+図解版」の詳細記事を配信しています。 ----- ※React 株式

                              通話時間1日200分。もうひとつの現実とつながるボイチャアプリ「パラレル」ユーザー急増の理由と、「欲しいかどうか」使ってみないとわからないユーザーヒアリングの罠|アプリマーケティング研究所
                            • しゃべり方から数秒で2型糖尿病かどうかを見抜けるAIが登場

                              AIと音声技術を組み合わせることで、2型糖尿病を高精度で判別する手法をカナダの医療スタートアップであるKlick Healthの研究所・Klick Labsが開発しました。このモデルによる病気の検出精度は女性で89%、男性で86%だとのことで、論文は「Mayo Clinic Proceedings: Digital Health」に掲載されています。 Acoustic Analysis and Prediction of Type 2 Diabetes Mellitus Using Smartphone-Recorded Voice Segments - Mayo Clinic Proceedings: Digital Health https://www.mcpdigitalhealth.org/article/S2949-7612(23)00073-1/fulltext AI and

                                しゃべり方から数秒で2型糖尿病かどうかを見抜けるAIが登場
                              • オープンソースAI(Whisper、BERT、VOICEVOX)を用いた音声対話ロボットの作成 - Qiita

                                はじめに どうもこんにちは。ヤフー株式会社のkunishouです。気づけば2022年も残り3週間、皆様いかがお過ごしでしょうか? 今年の機械学習のトレンドと言えば、海外のAI企業から次々とオープンソースのAIが発表されたことが非常に印象的でした。画像生成分野ではStability AI社の「Stable Diffusion」、音声認識分野ではOpenAI社の「Whisper」などが発表されました。発表されたこれらのAIは非常に高機能であるにも関わらず、オープンソースのAIとして、自由に利用することができます。 今回、 クリスマスも近いということなのでこれらの高機能なAIを活用して何か面白い物を作ることはできないか と考え、物理的に言葉を投げかけると返事が返ってくるような音声対話ロボットを作ってみることにしました( クリスマスにしゃべる相手がいないからというわけでは決してありません )。 目

                                  オープンソースAI(Whisper、BERT、VOICEVOX)を用いた音声対話ロボットの作成 - Qiita
                                • 無料配布中のAI搭載ボイチェンソフト「Voidol」 生配信などに使用できるかをレビュー

                                  無料配布中のAI搭載ボイチェンソフト「Voidol」 生配信などに使用できるかをレビュー バーチャルの世界で、よく耳にする「ボイスチェンジャー(通称:ボイチェン)」。その言葉通り、ソフトを介して自身の声を加工することを指します。そんなボイチェンには、様々な種類のソフトがありますが、この度クリムゾンテクノロジー社から発売中の音声変換ソフト「Voidol」が3ヶ月限定で無料公開となりました。 本記事では、実際に触ってみたレビューをお届けします。 業界初のAI搭載リアルタイム音声変換 「Voidol」は、2019年にリリースされた、リアルタイムAI音声変換ソフトです。主にVTuberといった配信コンテンツでの運用を想定された設計になっています。 WindowsとMac双方の環境での使用が可能で、発売時にはAmazon.co.jp PCソフト ダウンロードストアにてランキングNo.1を獲得するなど

                                    無料配布中のAI搭載ボイチェンソフト「Voidol」 生配信などに使用できるかをレビュー
                                  • Megpoidの音声合成ソフト、A.I.VOICE GUMIが発売開始。7年ぶりとなる製品発売の背景を探る|DTMステーション

                                    株式会社インターネット 代表取締役 村上昇さんインタビュー --Megpoid製品、だいぶ久しぶりになりますが、どうしてこのタイミングでの登場となったのですか? 村上:昨年の秋ごろから、そろそろ出したいなと検討していました。喋りも、歌唱もどちらも進めたいと考えていました。ただ、昨今の技術進化などからさまざまなメーカーが参入し、エンジンも複数あるから、どれにしようか……と思って考えていたのです。そうした中、今年1月にエーアイさんから具体的な提案をいただいたんです。技術的な背景から、実際の工程なども含め、細かく話を詰めていくなか、これがよさそう、となったのです。 株式会社インターネットの代表取締役、村上昇さんにオンラインミーティングの形でインタビューした --トークもソングもとなると、CeVIO AIやSynthesizer V&voicepeakのほうが、スマートな気もしますが……。 村上:

                                      Megpoidの音声合成ソフト、A.I.VOICE GUMIが発売開始。7年ぶりとなる製品発売の背景を探る|DTMステーション
                                    • Supertone Shift

                                      Real-time Voice Changer

                                      • Metaが低ビットレートで良音質の音声コーデック「MLow」を発表、スマホの通話アプリ向けに開発

                                        WhatsAppやMessengerなどのリアルタイムコミュニケーション(RTC)アプリを開発するMetaが、RTC向けの低ビットレートでありながら高い音質を目指したオーディオコーデック「MLow(Meta Low Bitrate)」を発表しました。 MLow: Meta's low bitrate audio codec - Engineering at Meta https://engineering.fb.com/2024/06/13/web/mlow-metas-low-bitrate-audio-codec/ スマートフォンのRTCアプリで音声通話を行う場合、重要なのがコーデックです。一般的な通話でキャプチャされる音声のビットレートは、モノラル・サンプリングレート48kHz・ビット深度16ビットだとおよそ768kbpsになります。しかし、スマートフォンで快適に通話をするためには、

                                          Metaが低ビットレートで良音質の音声コーデック「MLow」を発表、スマホの通話アプリ向けに開発
                                        • 体の動きや音声入力でアプリケーションをハンズフリー操作したりプログラミングしたり文章を書いたりしてみる

                                          この記事は、体の動きとか音声入力でアプリケーションを操作したり、プログラミングをするにはどうすればいいかということをいろいろ実験してみた記事です。 この記事には、実用性があるものと現実的に使うにはトレーニングが必要なものが混在しています。そのため、そこまで期待してはいけません。 この記事は、TalonとmacOSの音声入力で書いたものを手作業で修正しています。 マイクはBlue Microphones Yeticasterを使いました。 きっかけ t_wadaさんが老眼について書いていたのが、この記事を書いたきっかけの一つです。 プログラマ35歳定年説はとっくに過去のもので、35歳を過ぎても能力も報酬も伸び続けるし、生涯現役プログラマのロールモデルとなる方も増えてきた。ただ諸先輩方から聞いた話をまとめると、ベテランプログラマの前に立ち塞がるのは「老眼」で、こればかりは本当に恐ろしい。何か対

                                            体の動きや音声入力でアプリケーションをハンズフリー操作したりプログラミングしたり文章を書いたりしてみる
                                          • ポッドキャストの市場拡大 独自番組が続々、買収も活発に 奔流eビジネス (スクラムベンチャーズ マーケティングVP 三浦茜氏) - 日本経済新聞

                                            スマートフォンを使い始めて10年以上がたち、すっかり「ながら依存症」になってしまった。テレビを見ながら気になった内容を検索したり、友人にメッセージを送ったり。そんな私が最近、特に重宝しているのが音声コンテンツの「ポッドキャスト」だ。運転しながら、料理しながら、掃除しながら聞き続ける。目を奪われないので、ながら依存症にはもってこい。米アップルの完全ワイヤレスイヤホン「AirPods Pro(エア

                                              ポッドキャストの市場拡大 独自番組が続々、買収も活発に 奔流eビジネス (スクラムベンチャーズ マーケティングVP 三浦茜氏) - 日本経済新聞
                                            • 小学5年生、生成AIを活用したボタン会話アプリを開発

                                              小学5年生、生成AIを活用したボタン会話アプリを開発2023.11.14 17:009,720 福田ミホ ちゃんと使える生成AI。 公開から約1年経った生成AI、ChatGPT。その受け答えの賢さに多くの人が衝撃を受けて爆発的に広がりましたが、素のチャットとして日常的に使う人はそんなに多くはなく、ユーザーが減ってるなんて話もありました。 でも、これならたしかに使えそう!と希望が広がるアプリを見つけましたのでご紹介しますね。 場面緘黙当事者の小学5年生が開発それが、場面緘黙(かんもく)症(特定の状況で声を出して会話ができなくなる)の当事者である上田蒼大氏が開発したアプリ「Be Free」です。 上田氏は人前での会話全般ができないので、普段から筆談やジェスチャーで会話をしていましたが、時間がかかったり、細かいニュアンスが伝わりにくかったりするのが悩みでした。そんなとき、自分の言いたいことをパッ

                                                小学5年生、生成AIを活用したボタン会話アプリを開発
                                              • Clubhouseは“ハラスメント”を助長する場か? 海外で起こっている問題から考える

                                                最近話題になっている、完全招待制の音声SNS『Clubhouse』。サービス開始から10ヶ月経過したいま、日本での電話番号認証が解禁されたことで、爆発的な盛り上がりを記録。App Storeでは無料アプリランキングのトップに上り詰めている。 緊急事態宣言の再発令・延長と、新型コロナウイルスの感染者数が減少しない日本において、気軽にオンラインでソーシャル活動を営むことのできるプラットフォームとして注目されている。好きなチャットルームに自由に出入りすることでルームにいる人たちの会話を聞いたり、はては参加もできる。偶然性に満ちた遭遇や関係性は、リアルな世界で交わす他愛もない会話に似たものがある。 しかし、同アプリはすでにプラットフォーム上で様々な問題を引き起こしており、それらの問題への対応や合法性に関しても、多くの議論がなされていることも認識して欲しい。 無法地帯化するClubhouseーーある

                                                  Clubhouseは“ハラスメント”を助長する場か? 海外で起こっている問題から考える
                                                • スカーレット・ヨハンソンがGPT-4oの新音声が自分と似ていることについて「ショックを受け、怒りを覚えた」と意見表明

                                                  「マーベル・シネマティック・ユニバース」シリーズのブラック・ウィドウ(ナターシャ・ロマノフ)役や実写版「ゴースト・イン・ザ・シェル」の少佐役などで知られる俳優のスカーレット・ヨハンソンさんが、OpenAIが発表したGPT-4oの音声のうち「Sky」が自分の声と酷似していることに「ショックを受け、怒りを覚え、信じられない思いだった」とコメントしました。ヨハンソンさんは事前にオファーを受けたものの断った経緯があるとのこと。一方、OpenAIは「契約した別の俳優の声」と説明しています。 Scarlett Johansson wants answers about ChatGPT voice that sounds like 'Her' : NPR https://www.npr.org/2024/05/20/1252495087/openai-pulls-ai-voice-that-was-co

                                                    スカーレット・ヨハンソンがGPT-4oの新音声が自分と似ていることについて「ショックを受け、怒りを覚えた」と意見表明
                                                  • 【準備編】RVCを用いたリアルタイムボイスチェンジの使い方を1から解説してみる|omiz

                                                    用意するもの①VB-CABLE Virtual Audio Device(仮想オーディオデバイスならなんでも) ②7zip ③Hugging Faceアカウント ④VC Client v.1.5.2.2 ⑤hubert_base.pt ⑥RVC-beta ⑦Audacity どれくらいのスペックが必要かメモリを16GB積んでいてかつ、グラボを積んだゲーミングPCであれば問題ないと思います。 私のパソコンは、 GPU NVIDIA GeForce RTX 2070 SUPER CPU Intel(R) Core(TM) i7-10700 メモリ 32GB です。これくらいのスペックがあれば余裕を持って学習・ボイチェンできます。 追記:強いMacでも動くらしいです ①VB-CABLE Virtual Audio Device DiscordとかゲームのVCでボイチェンを使うのに必要です。 公式

                                                      【準備編】RVCを用いたリアルタイムボイスチェンジの使い方を1から解説してみる|omiz
                                                    • Mozilla Common Voice

                                                        Mozilla Common Voice
                                                      • Fliki - Turn text into videos with AI voices

                                                        Transform your ideas into stunning videos with our AI video generator. Easy to use Text to Video editor featuring lifelike voiceovers, dynamic AI video clips, and a wide range of AI-powered features.

                                                          Fliki - Turn text into videos with AI voices
                                                        • 声優の太田淑子さん死去 「ジャングル大帝」「リボンの騎士」など(朝日新聞デジタル) - Yahoo!ニュース

                                                          テレビアニメ「ジャングル大帝」のレオ、「リボンの騎士」のサファイアなどを演じた声優で俳優の太田淑子(おおた・よしこ、本名阪淑子〈さか・よしこ〉)さんが10月29日、心不全で死去した。89歳だった。葬儀は親族で行った。所属劇団テアトル・エコーが8日発表した。 【写真】漫画「リボンの騎士」に登場する王冠を模した宝飾品。67カラットのスターサファイアなどをあしらい、時価3億円相当。 兵庫県出身。1960年代から数多くのアニメに出演した。主演作はほかに「ひみつのアッコちゃん」「タイムボカン」「ヤッターマン」。63年に入団したテアトル・エコーでも長年、中心俳優として活躍した。

                                                            声優の太田淑子さん死去 「ジャングル大帝」「リボンの騎士」など(朝日新聞デジタル) - Yahoo!ニュース
                                                          • chan on Twitter: "うちの息子がアレクサに「アンパンマンの歌を流して」って言ったら 『Unlimitedに登録すればその歌を流せます、登録しますか?』って聞いてきて息子が「うん」って言ったら有料モードに切り替わったんだけど、ガバガバ過ぎん?" / Twitter

                                                            • 出来栄えはほぼ完璧!ワンクリック起動で手軽な文字起こしアプリ「toruno」【今日のライフハックツール】 | ライフハッカー・ジャパン

                                                              音声認識・文字起こしアプリが人気です。無料・有料含め、すでに多くのアプリがリリースされており、ざっと数えただけでも20を超えます。 筆者の場合、メールや記事を書く際は「Win+H」で立ち上がる、Windows OSに備わっている機能を重宝しています。音声認識の精度が飛躍的に向上したのはつい最近のことですが、おかげでキーボード入力が減らせて便利。 一方、取材で録音したインタビューの書き起こしは、もっぱら「notta」を使用しています。こちらは有料で、月額使用料は2000円。1年分の一括払いでは40%オフとなり、月あたり1200円の金額となります。 ICレコーダーで録った音声ファイルはインポート機能で、オンライン取材では、リアルタイムでテキスト化できます。 ワンクリックで起動する手軽さ「toruno」さて、今回紹介するのは、それらとはやや別のコンセプトで開発された、リコーの「toruno(トル

                                                                出来栄えはほぼ完璧!ワンクリック起動で手軽な文字起こしアプリ「toruno」【今日のライフハックツール】 | ライフハッカー・ジャパン
                                                              • 【図解】超高性能AIボイスチェンジャー「RVC」のしくみ・コツ

                                                                はじめに ↑に貼った動画は話題の高性能ボイスチェンジャー「RVC」の変換例です(Creative Commonsで配布・改変が可能なライセンスの音声データを学習させたものです。BOOTHで無料配布中です)。今回の記事では動画の4つ+1の計5モデルを作成する中で見えてきたRVCの仕組みや使用時・モデル生成時のコツを紹介したいと思います。 BOOTHで学習済みモデル無料配布中(ライセンスはそれぞれ異なり、元データに準拠します) 注意事項 本編に入る前にいくつか前提を明らかにしておきます。私自身、RVCや音声認識についての専門知識はほぼありません。RVCについて初めて知ったのは約2週間前で、そのレベルは初心者の域を出ないと思っていただければと思います。さらに、RVCのモデルであるHuBERTやトランスフォーマーに関する知識もあまりありません(論文もまともに読んでません)。 したがって、この記事の

                                                                  【図解】超高性能AIボイスチェンジャー「RVC」のしくみ・コツ
                                                                • GitHub - alphacep/vosk-api: Offline speech recognition API for Android, iOS, Raspberry Pi and servers with Python, Java, C# and Node

                                                                  Vosk is an offline open source speech recognition toolkit. It enables speech recognition for 20+ languages and dialects - English, Indian English, German, French, Spanish, Portuguese, Chinese, Russian, Turkish, Vietnamese, Italian, Dutch, Catalan, Arabic, Greek, Farsi, Filipino, Ukrainian, Kazakh, Swedish, Japanese, Esperanto, Hindi, Czech, Polish. More to come. Vosk models are small (50 Mb) but p

                                                                    GitHub - alphacep/vosk-api: Offline speech recognition API for Android, iOS, Raspberry Pi and servers with Python, Java, C# and Node
                                                                  • 現場の音を確実に収録する32bit floatの威力。目的ごとに選べるZOOM MicTrakシリーズ、3機種が勢ぞろい|DTMステーション

                                                                    ZOOMから、32bit float対応のレコーダー、MicTrakシリーズが発売されました。ラインナップは、M2(24,000円税込)、M3(24,000円税込)、M4(45,000円税込)となっており、それぞれ特徴を持った機材となっています。M2は、一般的なマイク型のレコーダーで、楽器のレコーディングやボーカルREC、ナレーション録音…などに適したモデル。M3は、ショットガンタイプのMSステレオマイクレコーダーで、一眼レフカメラの上に装着して利用できる、動画撮影向けのモデル。M4は、プロ仕様のレコーダーで、M2と同様にXY方式のステレオマイクを装備。コンボジャックを2つ搭載しており、タイムコードの入出力端子やノーマライズ機能を持った本格派となっています。 このZOOM MicTrakシリーズは、32bit float対応であるため、通常は絶対に必要なレベル調整は必要なく、録音ボタンさえ

                                                                      現場の音を確実に収録する32bit floatの威力。目的ごとに選べるZOOM MicTrakシリーズ、3機種が勢ぞろい|DTMステーション
                                                                    • 誰でも簡単に琴葉茜や結月ゆかりの自然な読み上げ音声を生成できる「A.I.VOICE2」レビュー

                                                                      高品質音声合成エンジン「AITalk」を開発するエーアイが、新世代DNN音声合成エンジン「AITalk6」を活用したNeuralボイスライブラリを搭載した「A.I.VOICE2」を2023年12月22日にリリースしました。A.I.VOICE2は自然で人間らしい声を目指した「Neuralボイスライブラリ」に対応し、アクセント句ごとにスタイル変更をしたり、より直感的で簡単な操作で音声合成ができたりするとのこと。A.I.VOICE2を操作する機会が得られたので、実際に触ってみました。 A.I.VOICE https://aivoice.jp/ A.I.VOICE2の体験版はユーザーサポートサイトでダウンロード可能。今回は「琴葉茜/葵」をクリック。 A.I.VOICE2はWindows版とMac版が用意されています。今回はWindows版をクリックしてインストーラーをダウンロードします。インストー

                                                                        誰でも簡単に琴葉茜や結月ゆかりの自然な読み上げ音声を生成できる「A.I.VOICE2」レビュー
                                                                      • Whisperで文字起こしをした文章をChatGPTでいい感じにする

                                                                        本記事は、あくまで個人的な使用を前提とした文字起こしの方法の紹介です。許可なく、他人のコンテンツを全部文字起こしして公開すると、著作物の改変などの問題になる可能性があると思います タイトル通りです。Whisperで文字起こしをしました。 ただ、以下のように句読点がない文章になってしまい、読みづらいです。 樋口 世界の歴史キュレーションプログラム コテンラジオ樋口 世界の歴史キュレーションプログラム コテンラジオパーソナリティーの株式会社ブック代表樋口清則 です深井 そして株式会社コテンの深井 隆之介です樋口 そして株式会社コテンの楊 英史です樋口 このラジオは歴史を愛し歴史 の面白さを知りすぎてしまった深井さんを代表とする株式会社 コテンのお二人と一緒に学校の授業ではなかなか学べない国内外 の歴史の面白さを学んじゃおうという番組ですよろしくお願いします これを修正するのは結構たいへんそうで

                                                                          Whisperで文字起こしをした文章をChatGPTでいい感じにする
                                                                        • Spotifyに「月刊ムー」「美術手帖」が参入の狙い

                                                                          世界最大の音楽ストリーミングサービス・Spotifyに日本の雑誌カルチャーが参戦する――。 Spotifyは2020年12月、人気雑誌のコンテンツをポッドキャスト(音声コンテンツ配信)で届ける新プログラム「#聴くマガジン」を開始した。各雑誌の編集者などがパーソナリティーとなり、雑誌に関連したテーマについて、ゲストを交えながらトークを繰り広げる。 12月に参加したのは3媒体。1948年創刊の美術専門誌『美術手帖』(美術出版社)、1979年創刊のオカルト誌『月刊ムー』(ワン・パブリッシング)、そして2008年創刊のトラベルカルチャーマガジン『TRANSIT』(ユーフォリアファクトリー)だ。いずれも熱心なファンを持つ雑誌で、紙以外での展開を模索していたところ、Spotifyの提案を受けて参加を決めたという。 音声から若年層などファンの拡大へ #聴くマガジンは、専門性とバラエティーを備えた雑誌が音

                                                                            Spotifyに「月刊ムー」「美術手帖」が参入の狙い
                                                                          • ブルーピリオド:峯田大夢×花守ゆみり “好き”を貫き キャラクターを深く掘り下げる - MANTANWEB(まんたんウェブ)

                                                                            「月刊アフタヌーン」(講談社)で連載中の山口つばささんのマンガが原作のテレビアニメ「ブルーピリオド」がMBS・TBS系の深夜アニメ枠「スーパーアニメイズム」ほかで放送されている。「マンガ大賞2020」に選ばれた話題作で、高校生・矢口八虎(やぐち・やとら)が美術大学を目指す姿を描いている。原作は“美術スポ根マンガ”とも呼ばれているが、それだけが魅力ではない。繊細な心の動きを描き、キャラクターを深く深く掘り下げているのも大きな魅力だ。キャラクターが魅力的なのは、矢口八虎役の峯田大夢さん、八虎と同級生の美術部員の鮎川龍二(ユカ)役の花守ゆみりさんら声優陣の演技によるところも大きい。峯田さん、花守さんはストイックにキャラクターと向き合い、掘り下げていった。峯田さん、花守さんに同作への思い、アフレコの裏側について聞いた。

                                                                              ブルーピリオド:峯田大夢×花守ゆみり “好き”を貫き キャラクターを深く掘り下げる - MANTANWEB(まんたんウェブ)
                                                                            • 無料&登録不要でP2P通信による低遅延なグループ音声通話が可能なアプリ「SonoBus」を使ってみた

                                                                              「SonoBus」は、アカウント登録不要で低遅延なグループ音声通話を楽しめるアプリです。ユーザー間の通信はP2P方式で行われるため、通話内容が開発者のサーバーに保存される心配も無いとのこと。実際に「SonoBus」を使って、複数人での音声通話を試してみました。 SonoBus https://sonobus.net/ SonoBusのインストーラーをダウンロードするために、公式サイト右上の「Download」をクリック。 SonoBusのダウンロードページには、「macOS版」「Windows版」「iOSのベータ版」「ソースコード」の4種類のダウンロードリンクが表示されています。今回は、Windowsで使ってみるので「Download for Windows」をクリックします。 ダウンロードした圧縮ファイルを「Explzh」などの解凍ソフトで解凍したら、SonoBusのインストーラー「So

                                                                                無料&登録不要でP2P通信による低遅延なグループ音声通話が可能なアプリ「SonoBus」を使ってみた
                                                                              • VOSK Offline Speech Recognition API

                                                                                РУС 中文 Vosk is a speech recognition toolkit. The best things in Vosk are: Supports 20+ languages and dialects - English, Indian English, German, French, Spanish, Portuguese, Chinese, Russian, Turkish, Vietnamese, Italian, Dutch, Catalan, Arabic, Greek, Farsi, Filipino, Ukrainian, Kazakh, Swedish, Japanese, Esperanto, Hindi, Czech, Polish, Uzbek, Korean, Breton, Gujarati, Tajik, Telugu. More to com

                                                                                • 「声」も才能! 中森明菜と『のぼる小寺さん』工藤遥の共通点 | FRIDAYデジタル

                                                                                  吉田玲子(『映画けいおん!』『聲の形』)の名脚本 古厩智之監督が『飾りじゃないのよ涙は』を聴かせて工藤遥から引き出した「忘れない声」 傑作の裏側を考察〔人気ライターCDB〕 自分が何者であるかを象徴する代表作に、最初の主演映画でいきなり巡り合ってしまう幸運な俳優が世の中には何人かいる。 広瀬すずが天才スポーツ少女を演じた『ちはやふる』、松岡茉優がこじらせた内向的女子を演じた『勝手にふるえてろ』は、いずれも本人たちの演技の特質、役者としての魅力を最も観客に鮮明にプレゼンテーションできる作品だった。もちろん、紆余曲折や試行錯誤の末にようやく「当たり役」に出会う俳優たちの方が世の中にはずっと多い。 『のぼる小寺さん』が映画初主演作となった工藤遥は、たぶんその幸運な前者のグループに数えられることになるのだろう。 映画『のぼる小寺さん』 映画初主演の工藤遥(左)。共演は『今日から俺は!!』の伊藤健太

                                                                                    「声」も才能! 中森明菜と『のぼる小寺さん』工藤遥の共通点 | FRIDAYデジタル

                                                                                  新着記事