Huuuge group voice notes with all of your friends
アニメ「響け!ユーフォニアム」シリーズの約4年ぶりとなる続編として、「特別編 響け!ユーフォニアム~アンサンブルコンテスト~」が2023年夏に劇場上映されることが決定。同作の第1弾キービジュアルと第1弾PVが公開された。 2023年に「アンサンブルコンテスト編」がBlu-rayで発売されるとともに、劇場で特別上映されることが発表されていたアニメ「響け!ユーフォニアム」。第1弾キービジュアルには部長になった久美子や麗奈、葉月、秀一などおなじみのメンバーを中心に結成された、ともにアンサンブルコンテスト出場を目指すチームのメンバーが描かれている。第1弾PVはこれまでのシリーズで描かれてきた別れや挫折などを経て、北宇治高校吹奏楽部のバトンが久美子の世代に渡ってきたことがわかる映像に仕上げられた。 久美子役は黒沢ともよ、葉月役は朝井彩加、緑輝役は豊田萌絵、麗奈役は安済知佳と、北宇治カルテットのキャス
AI関連技術を開発する非営利組織OpenAIは2023年3月1日(米国時間)、対話に特化した言語モデル「ChatGPT」と汎用(はんよう)の音声認識モデル「Whisper」をAPIで利用できるようにしたと発表した。APIの公開に合わせて、利用規約を開発者ニーズにより良く対応できるように改訂したことも明らかにした。 ChatGPT APIは1000トークン当たり0.002ドルで提供 関連記事 ChatGPTとは何か そのできること/できないこと OpenAIがリリースした人との対話をターゲットとする大規模な言語モデル「ChatGPT」。その概要について見てみましょう。 サイバー犯罪者も「ChatGPTを使ってコーディング」をしている チェック・ポイント チェック・ポイント・ソフトウェア・テクノロジーズは脅威アクターがOpenAIのChatGPTを悪用して悪質なコードを生成していることを、実例
後藤ひとり役・青山吉能が語る、映画館で味わう結束バンドの物語への期待――『劇場総集編ぼっち・ざ・ろっく! Re:』公開記念インタビュー 極度の人見知りで陰キャな少女・後藤ひとりと、彼女がメンバーとして加入する4人組バンド・結束バンドの活動と成長を描くTVアニメ『ぼっち・ざ・ろっく!』。2022年に放送されて一躍話題作となった本アニメを再編集した劇場総集編の前編『劇場総集編ぼっち・ざ・ろっく! Re:』が、6月7日より映画館で公開される。そこで今回は主人公の後藤ひとり役を務める声優・青山吉能に直撃。本作の見どころや期待しているポイント、結束バンドとしてのリアルライブをはじめ広がり続ける作品への想いについて話を聞いた。 INTERVIEW & TEXT BY 北野 創 大迫力のスクリーンと音響だからこその『ぼっち・ざ・ろっく!』 続きを読む
すでにご存じの方もいらっしゃると思いますが、3月末にRØDEから同社を代表するマイクであるNT1の第5世代モデル、NT1 5th Generationが発売されています(税込実売価格:41,580円前後)。お馴染みのシルバーモデルに加えブラックモデルの2ラインナップとなっており、これまでの「あたたかくシルキーなサウンド」を継承しつつ、世界初と画期的な機構を取り入れたマイクとなっているんです。 それは従来通り、XLRケーブルを使って利用するコンデンサマイクでありながら、XLRケーブルの変わりにUSB Type-Cケーブルでの接続が可能で、USBを使った場合、爆音でも音割れしない32bit floatに対応したデジタルマイクとして使える仕組みになっているんです。しかもその音をモニターするのは手持ちのオーディオインターフェイスが利用できるというトリッキーなドライバシステムが用意されているなど、非
NVIDIA RTX Voice is a new plugin that leverages NVIDIA RTX GPUs and their AI capabilities to remove distracting background noise from your broadcasts, voice chats, and remote video conferencing meetings. This allows users to "go live" or join a meeting without having to worry about unwanted sounds like loud keyboard typing or other ambient noise in noisy environments. RTX Voice also suppresses bac
「ぼっち・ざ・ろっく!」は、2018年から連載中の音楽マンガ。ギターを愛する孤独な少女・後藤ひとり(ぼっちちゃん)が、ひょんなことから伊地知虹夏が率いる結束バンドに加入することになる……というストーリー。 第8話では、結束バンドの4人がライブハウスSTARRYで初のライブに挑んだ。1曲目の「ギターと孤独と蒼い惑星」は、緊張もあって歌、演奏がボロボロで、不穏な空気が流れる。空気を変えたのは、ひとりだった。ひとりは「このままじゃイヤだ!」と突如、ギターを演奏し、メンバーを引っ張る。2曲目の「あのバンド」で素晴らしい歌と演奏を聞かせ、ライブを成功させる。 12月28日に発売される結束バンドのアルバム「結束バンド」には「ギターと孤独と蒼い惑星」「あのバンド」が収録されるが、アニメで流れたバージョンとは違う音源が収録されるという。 「CDに収録される『あのバンド』のフルバージョンとアニメで流れたライ
通話時間1日200分。もうひとつの現実とつながるボイチャアプリ「パラレル」ユーザー急増の理由と、「欲しいかどうか」使ってみないとわからないユーザーヒアリングの罠 ボイスチャットアプリ「パラレル」を運営するReactさんにお話を伺いました。ダイジェスト版は漫画でまとめています。 ・React 青木さん(@Joaoki)、歳原さん(@react_taiki) ・パラレル(App Store、Google Play) 【Reactさんより告知】React社では採用も強化中(エンジニア、マーケターなど)とのことで、ご興味ある方は採用募集ページよりどうぞ。 【取材申請】取材をご希望の会社さまは、取材申請フォームよりオファーいただければと思います。(スマホアプリ以外でもOKです) 以下、note購読者向けに、インタビューの「テキスト+図解版」の詳細記事を配信しています。 ----- ※React 株式
AIと音声技術を組み合わせることで、2型糖尿病を高精度で判別する手法をカナダの医療スタートアップであるKlick Healthの研究所・Klick Labsが開発しました。このモデルによる病気の検出精度は女性で89%、男性で86%だとのことで、論文は「Mayo Clinic Proceedings: Digital Health」に掲載されています。 Acoustic Analysis and Prediction of Type 2 Diabetes Mellitus Using Smartphone-Recorded Voice Segments - Mayo Clinic Proceedings: Digital Health https://www.mcpdigitalhealth.org/article/S2949-7612(23)00073-1/fulltext AI and
はじめに どうもこんにちは。ヤフー株式会社のkunishouです。気づけば2022年も残り3週間、皆様いかがお過ごしでしょうか? 今年の機械学習のトレンドと言えば、海外のAI企業から次々とオープンソースのAIが発表されたことが非常に印象的でした。画像生成分野ではStability AI社の「Stable Diffusion」、音声認識分野ではOpenAI社の「Whisper」などが発表されました。発表されたこれらのAIは非常に高機能であるにも関わらず、オープンソースのAIとして、自由に利用することができます。 今回、 クリスマスも近いということなのでこれらの高機能なAIを活用して何か面白い物を作ることはできないか と考え、物理的に言葉を投げかけると返事が返ってくるような音声対話ロボットを作ってみることにしました( クリスマスにしゃべる相手がいないからというわけでは決してありません )。 目
無料配布中のAI搭載ボイチェンソフト「Voidol」 生配信などに使用できるかをレビュー バーチャルの世界で、よく耳にする「ボイスチェンジャー(通称:ボイチェン)」。その言葉通り、ソフトを介して自身の声を加工することを指します。そんなボイチェンには、様々な種類のソフトがありますが、この度クリムゾンテクノロジー社から発売中の音声変換ソフト「Voidol」が3ヶ月限定で無料公開となりました。 本記事では、実際に触ってみたレビューをお届けします。 業界初のAI搭載リアルタイム音声変換 「Voidol」は、2019年にリリースされた、リアルタイムAI音声変換ソフトです。主にVTuberといった配信コンテンツでの運用を想定された設計になっています。 WindowsとMac双方の環境での使用が可能で、発売時にはAmazon.co.jp PCソフト ダウンロードストアにてランキングNo.1を獲得するなど
株式会社インターネット 代表取締役 村上昇さんインタビュー --Megpoid製品、だいぶ久しぶりになりますが、どうしてこのタイミングでの登場となったのですか? 村上:昨年の秋ごろから、そろそろ出したいなと検討していました。喋りも、歌唱もどちらも進めたいと考えていました。ただ、昨今の技術進化などからさまざまなメーカーが参入し、エンジンも複数あるから、どれにしようか……と思って考えていたのです。そうした中、今年1月にエーアイさんから具体的な提案をいただいたんです。技術的な背景から、実際の工程なども含め、細かく話を詰めていくなか、これがよさそう、となったのです。 株式会社インターネットの代表取締役、村上昇さんにオンラインミーティングの形でインタビューした --トークもソングもとなると、CeVIO AIやSynthesizer V&voicepeakのほうが、スマートな気もしますが……。 村上:
Real-time Voice Changer
WhatsAppやMessengerなどのリアルタイムコミュニケーション(RTC)アプリを開発するMetaが、RTC向けの低ビットレートでありながら高い音質を目指したオーディオコーデック「MLow(Meta Low Bitrate)」を発表しました。 MLow: Meta's low bitrate audio codec - Engineering at Meta https://engineering.fb.com/2024/06/13/web/mlow-metas-low-bitrate-audio-codec/ スマートフォンのRTCアプリで音声通話を行う場合、重要なのがコーデックです。一般的な通話でキャプチャされる音声のビットレートは、モノラル・サンプリングレート48kHz・ビット深度16ビットだとおよそ768kbpsになります。しかし、スマートフォンで快適に通話をするためには、
この記事は、体の動きとか音声入力でアプリケーションを操作したり、プログラミングをするにはどうすればいいかということをいろいろ実験してみた記事です。 この記事には、実用性があるものと現実的に使うにはトレーニングが必要なものが混在しています。そのため、そこまで期待してはいけません。 この記事は、TalonとmacOSの音声入力で書いたものを手作業で修正しています。 マイクはBlue Microphones Yeticasterを使いました。 きっかけ t_wadaさんが老眼について書いていたのが、この記事を書いたきっかけの一つです。 プログラマ35歳定年説はとっくに過去のもので、35歳を過ぎても能力も報酬も伸び続けるし、生涯現役プログラマのロールモデルとなる方も増えてきた。ただ諸先輩方から聞いた話をまとめると、ベテランプログラマの前に立ち塞がるのは「老眼」で、こればかりは本当に恐ろしい。何か対
小学5年生、生成AIを活用したボタン会話アプリを開発2023.11.14 17:009,720 福田ミホ ちゃんと使える生成AI。 公開から約1年経った生成AI、ChatGPT。その受け答えの賢さに多くの人が衝撃を受けて爆発的に広がりましたが、素のチャットとして日常的に使う人はそんなに多くはなく、ユーザーが減ってるなんて話もありました。 でも、これならたしかに使えそう!と希望が広がるアプリを見つけましたのでご紹介しますね。 場面緘黙当事者の小学5年生が開発それが、場面緘黙(かんもく)症(特定の状況で声を出して会話ができなくなる)の当事者である上田蒼大氏が開発したアプリ「Be Free」です。 上田氏は人前での会話全般ができないので、普段から筆談やジェスチャーで会話をしていましたが、時間がかかったり、細かいニュアンスが伝わりにくかったりするのが悩みでした。そんなとき、自分の言いたいことをパッ
最近話題になっている、完全招待制の音声SNS『Clubhouse』。サービス開始から10ヶ月経過したいま、日本での電話番号認証が解禁されたことで、爆発的な盛り上がりを記録。App Storeでは無料アプリランキングのトップに上り詰めている。 緊急事態宣言の再発令・延長と、新型コロナウイルスの感染者数が減少しない日本において、気軽にオンラインでソーシャル活動を営むことのできるプラットフォームとして注目されている。好きなチャットルームに自由に出入りすることでルームにいる人たちの会話を聞いたり、はては参加もできる。偶然性に満ちた遭遇や関係性は、リアルな世界で交わす他愛もない会話に似たものがある。 しかし、同アプリはすでにプラットフォーム上で様々な問題を引き起こしており、それらの問題への対応や合法性に関しても、多くの議論がなされていることも認識して欲しい。 無法地帯化するClubhouseーーある
「マーベル・シネマティック・ユニバース」シリーズのブラック・ウィドウ(ナターシャ・ロマノフ)役や実写版「ゴースト・イン・ザ・シェル」の少佐役などで知られる俳優のスカーレット・ヨハンソンさんが、OpenAIが発表したGPT-4oの音声のうち「Sky」が自分の声と酷似していることに「ショックを受け、怒りを覚え、信じられない思いだった」とコメントしました。ヨハンソンさんは事前にオファーを受けたものの断った経緯があるとのこと。一方、OpenAIは「契約した別の俳優の声」と説明しています。 Scarlett Johansson wants answers about ChatGPT voice that sounds like 'Her' : NPR https://www.npr.org/2024/05/20/1252495087/openai-pulls-ai-voice-that-was-co
用意するもの①VB-CABLE Virtual Audio Device(仮想オーディオデバイスならなんでも) ②7zip ③Hugging Faceアカウント ④VC Client v.1.5.2.2 ⑤hubert_base.pt ⑥RVC-beta ⑦Audacity どれくらいのスペックが必要かメモリを16GB積んでいてかつ、グラボを積んだゲーミングPCであれば問題ないと思います。 私のパソコンは、 GPU NVIDIA GeForce RTX 2070 SUPER CPU Intel(R) Core(TM) i7-10700 メモリ 32GB です。これくらいのスペックがあれば余裕を持って学習・ボイチェンできます。 追記:強いMacでも動くらしいです ①VB-CABLE Virtual Audio Device DiscordとかゲームのVCでボイチェンを使うのに必要です。 公式
音声認識・文字起こしアプリが人気です。無料・有料含め、すでに多くのアプリがリリースされており、ざっと数えただけでも20を超えます。 筆者の場合、メールや記事を書く際は「Win+H」で立ち上がる、Windows OSに備わっている機能を重宝しています。音声認識の精度が飛躍的に向上したのはつい最近のことですが、おかげでキーボード入力が減らせて便利。 一方、取材で録音したインタビューの書き起こしは、もっぱら「notta」を使用しています。こちらは有料で、月額使用料は2000円。1年分の一括払いでは40%オフとなり、月あたり1200円の金額となります。 ICレコーダーで録った音声ファイルはインポート機能で、オンライン取材では、リアルタイムでテキスト化できます。 ワンクリックで起動する手軽さ「toruno」さて、今回紹介するのは、それらとはやや別のコンセプトで開発された、リコーの「toruno(トル
はじめに ↑に貼った動画は話題の高性能ボイスチェンジャー「RVC」の変換例です(Creative Commonsで配布・改変が可能なライセンスの音声データを学習させたものです。BOOTHで無料配布中です)。今回の記事では動画の4つ+1の計5モデルを作成する中で見えてきたRVCの仕組みや使用時・モデル生成時のコツを紹介したいと思います。 BOOTHで学習済みモデル無料配布中(ライセンスはそれぞれ異なり、元データに準拠します) 注意事項 本編に入る前にいくつか前提を明らかにしておきます。私自身、RVCや音声認識についての専門知識はほぼありません。RVCについて初めて知ったのは約2週間前で、そのレベルは初心者の域を出ないと思っていただければと思います。さらに、RVCのモデルであるHuBERTやトランスフォーマーに関する知識もあまりありません(論文もまともに読んでません)。 したがって、この記事の
Vosk is an offline open source speech recognition toolkit. It enables speech recognition for 20+ languages and dialects - English, Indian English, German, French, Spanish, Portuguese, Chinese, Russian, Turkish, Vietnamese, Italian, Dutch, Catalan, Arabic, Greek, Farsi, Filipino, Ukrainian, Kazakh, Swedish, Japanese, Esperanto, Hindi, Czech, Polish. More to come. Vosk models are small (50 Mb) but p
ZOOMから、32bit float対応のレコーダー、MicTrakシリーズが発売されました。ラインナップは、M2(24,000円税込)、M3(24,000円税込)、M4(45,000円税込)となっており、それぞれ特徴を持った機材となっています。M2は、一般的なマイク型のレコーダーで、楽器のレコーディングやボーカルREC、ナレーション録音…などに適したモデル。M3は、ショットガンタイプのMSステレオマイクレコーダーで、一眼レフカメラの上に装着して利用できる、動画撮影向けのモデル。M4は、プロ仕様のレコーダーで、M2と同様にXY方式のステレオマイクを装備。コンボジャックを2つ搭載しており、タイムコードの入出力端子やノーマライズ機能を持った本格派となっています。 このZOOM MicTrakシリーズは、32bit float対応であるため、通常は絶対に必要なレベル調整は必要なく、録音ボタンさえ
高品質音声合成エンジン「AITalk」を開発するエーアイが、新世代DNN音声合成エンジン「AITalk6」を活用したNeuralボイスライブラリを搭載した「A.I.VOICE2」を2023年12月22日にリリースしました。A.I.VOICE2は自然で人間らしい声を目指した「Neuralボイスライブラリ」に対応し、アクセント句ごとにスタイル変更をしたり、より直感的で簡単な操作で音声合成ができたりするとのこと。A.I.VOICE2を操作する機会が得られたので、実際に触ってみました。 A.I.VOICE https://aivoice.jp/ A.I.VOICE2の体験版はユーザーサポートサイトでダウンロード可能。今回は「琴葉茜/葵」をクリック。 A.I.VOICE2はWindows版とMac版が用意されています。今回はWindows版をクリックしてインストーラーをダウンロードします。インストー
本記事は、あくまで個人的な使用を前提とした文字起こしの方法の紹介です。許可なく、他人のコンテンツを全部文字起こしして公開すると、著作物の改変などの問題になる可能性があると思います タイトル通りです。Whisperで文字起こしをしました。 ただ、以下のように句読点がない文章になってしまい、読みづらいです。 樋口 世界の歴史キュレーションプログラム コテンラジオ樋口 世界の歴史キュレーションプログラム コテンラジオパーソナリティーの株式会社ブック代表樋口清則 です深井 そして株式会社コテンの深井 隆之介です樋口 そして株式会社コテンの楊 英史です樋口 このラジオは歴史を愛し歴史 の面白さを知りすぎてしまった深井さんを代表とする株式会社 コテンのお二人と一緒に学校の授業ではなかなか学べない国内外 の歴史の面白さを学んじゃおうという番組ですよろしくお願いします これを修正するのは結構たいへんそうで
世界最大の音楽ストリーミングサービス・Spotifyに日本の雑誌カルチャーが参戦する――。 Spotifyは2020年12月、人気雑誌のコンテンツをポッドキャスト(音声コンテンツ配信)で届ける新プログラム「#聴くマガジン」を開始した。各雑誌の編集者などがパーソナリティーとなり、雑誌に関連したテーマについて、ゲストを交えながらトークを繰り広げる。 12月に参加したのは3媒体。1948年創刊の美術専門誌『美術手帖』(美術出版社)、1979年創刊のオカルト誌『月刊ムー』(ワン・パブリッシング)、そして2008年創刊のトラベルカルチャーマガジン『TRANSIT』(ユーフォリアファクトリー)だ。いずれも熱心なファンを持つ雑誌で、紙以外での展開を模索していたところ、Spotifyの提案を受けて参加を決めたという。 音声から若年層などファンの拡大へ #聴くマガジンは、専門性とバラエティーを備えた雑誌が音
「月刊アフタヌーン」(講談社)で連載中の山口つばささんのマンガが原作のテレビアニメ「ブルーピリオド」がMBS・TBS系の深夜アニメ枠「スーパーアニメイズム」ほかで放送されている。「マンガ大賞2020」に選ばれた話題作で、高校生・矢口八虎(やぐち・やとら)が美術大学を目指す姿を描いている。原作は“美術スポ根マンガ”とも呼ばれているが、それだけが魅力ではない。繊細な心の動きを描き、キャラクターを深く深く掘り下げているのも大きな魅力だ。キャラクターが魅力的なのは、矢口八虎役の峯田大夢さん、八虎と同級生の美術部員の鮎川龍二(ユカ)役の花守ゆみりさんら声優陣の演技によるところも大きい。峯田さん、花守さんはストイックにキャラクターと向き合い、掘り下げていった。峯田さん、花守さんに同作への思い、アフレコの裏側について聞いた。
「SonoBus」は、アカウント登録不要で低遅延なグループ音声通話を楽しめるアプリです。ユーザー間の通信はP2P方式で行われるため、通話内容が開発者のサーバーに保存される心配も無いとのこと。実際に「SonoBus」を使って、複数人での音声通話を試してみました。 SonoBus https://sonobus.net/ SonoBusのインストーラーをダウンロードするために、公式サイト右上の「Download」をクリック。 SonoBusのダウンロードページには、「macOS版」「Windows版」「iOSのベータ版」「ソースコード」の4種類のダウンロードリンクが表示されています。今回は、Windowsで使ってみるので「Download for Windows」をクリックします。 ダウンロードした圧縮ファイルを「Explzh」などの解凍ソフトで解凍したら、SonoBusのインストーラー「So
РУС 中文 Vosk is a speech recognition toolkit. The best things in Vosk are: Supports 20+ languages and dialects - English, Indian English, German, French, Spanish, Portuguese, Chinese, Russian, Turkish, Vietnamese, Italian, Dutch, Catalan, Arabic, Greek, Farsi, Filipino, Ukrainian, Kazakh, Swedish, Japanese, Esperanto, Hindi, Czech, Polish, Uzbek, Korean, Breton, Gujarati, Tajik, Telugu. More to com
吉田玲子(『映画けいおん!』『聲の形』)の名脚本 古厩智之監督が『飾りじゃないのよ涙は』を聴かせて工藤遥から引き出した「忘れない声」 傑作の裏側を考察〔人気ライターCDB〕 自分が何者であるかを象徴する代表作に、最初の主演映画でいきなり巡り合ってしまう幸運な俳優が世の中には何人かいる。 広瀬すずが天才スポーツ少女を演じた『ちはやふる』、松岡茉優がこじらせた内向的女子を演じた『勝手にふるえてろ』は、いずれも本人たちの演技の特質、役者としての魅力を最も観客に鮮明にプレゼンテーションできる作品だった。もちろん、紆余曲折や試行錯誤の末にようやく「当たり役」に出会う俳優たちの方が世の中にはずっと多い。 『のぼる小寺さん』が映画初主演作となった工藤遥は、たぶんその幸運な前者のグループに数えられることになるのだろう。 映画『のぼる小寺さん』 映画初主演の工藤遥(左)。共演は『今日から俺は!!』の伊藤健太
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く