オープンソースVOICEVOX は OSS(オープンソース・ソフトウェア)版 VOICEVOX をもとに構築されています。 製品版と OSS 版の違いやモジュール構成は VOICEVOX の全体構成 をご参照ください。 ソフトウェア部分は Electron + Vue 、音声合成エンジン部分は Python + FastAPI です。 追加したい・改善したい機能があれば、ぜひ開発にご参加ください。
オープンソースVOICEVOX は OSS(オープンソース・ソフトウェア)版 VOICEVOX をもとに構築されています。 製品版と OSS 版の違いやモジュール構成は VOICEVOX の全体構成 をご参照ください。 ソフトウェア部分は Electron + Vue 、音声合成エンジン部分は Python + FastAPI です。 追加したい・改善したい機能があれば、ぜひ開発にご参加ください。
弊社主催のオンラインイベント、Developers.IO 2020 CONNECT! みなさんはもう参加されましたでしょうか。 今回ぼくもこちらに参加し、2本の動画をあげました。 その動画編集につかったのが、標題にも書きました Blackmagic Design 社製の「DaVinci Resolve 16」です。 こちらはプロユースの本格的な機能が備わっている一方で無償でも使え1、今回のようなセッション動画向けの編集程度であれば、3年落ちのMacBook Pro 13inch2でもそこそこの速度で動きます。 むしろZoomやQuickTime Playerで撮ったままの720p・1080pサイズのMP4ビデオ・AACオーディオ、つまり不可逆圧縮された素材をそのままタイムラインに配置してストレスなく動いてくれるので、サブスクリプションなし・登録のみで使えることを考えれば、今回の用途において
当サイトでは、Photoshopの新しい機能テクニックをつかった最新チュートリアル、作り方を定期的にまとめて紹介しています。 この記事では、2020年のあいだに公開された、特に確認しておきたいPhotoshopのデザインチュートリアル、つくり方をまとめてご紹介します。 これまで以上に便利になった新しくアップデートされたPhotoshop 2021の新機能はもちろん、ボタンひとつで完成のお手軽写真やアクション、合成テクニックなど、デザイナーが覚えておくと便利な人気のデザインスタイルのつくり方がずらり揃います。 これからPhotoshopを始めてみよう、というひとにもぴったりなテクニックを揃えています。年末の連休をつかって、新しいテクニックを習得してみてはいかがでしょう。 2020年公開のIllustratorチュートリアル、つくり方も以下の記事でまとめています。 【総まとめ】2020年公開の
ビジュアルクリエイティブディレクターのMuRo氏が発表した「Shoost」はユニークなツールだ。「いい感じの雰囲気の絵を簡単に作りたい! キャラクターをきれいに魅せたい!」という思いから生まれた本ツールは、3つのレイヤーを重ね合わせ、その上から撮影効果を付与することで、画面・映像を作るという今までにない立ち位置のツールと言える。しかしながら、独特なツールゆえに、どのようなものかイメージがわかない人も多いかもしれない。 本記事では、「Shoost」を実際に動かし、簡単な作品を作りながら、機能や優れている点を紹介していく。 人物画像+背景画像 まず、公式にも紹介されている、人物画像と背景画像を組み合わせた使い方を試す。 「Layer 2」 に人物画像を配置 まずは、主役となる人物画像から配置する。「Layer 2」を「Import Item」に設定し、画像アイコンをクリック。今回は「いらすとや
GoogleのAI研究チームであるGoogle AIが、低解像度画像にあえてノイズを追加して「純粋なノイズ」になるまで加工し、そこから高解像度画像を生成する「diffusion model(拡散モデル)」という手法を改善する新たなアプローチを発表しました。「画質の悪い低解像度画像から高解像度画像を生成する技術」には、古い写真の復元から医療用画像の改善まで幅広い用途が想定され、機械学習の活躍が期待されているタスクの1つです。 Google AI Blog: High Fidelity Image Generation Using Diffusion Models https://ai.googleblog.com/2021/07/high-fidelity-image-generation-using.html Enhance! Google researchers detail new m
おき@COYOTE 3DCG STUDIO @yoru_3dcg もうみんな知ってたら恥ずかしいんですが、 Windowsの純正の切り抜き機能、めっちゃ便利😭✨ 写真選択⇒ペイント3Dで開いて動画の通りにするだけ 整ってる画像だと1分かからないし精度も悪くないので ちょっとした画像編集ならこれで事足りてしまう…! こういう便利情報もっと欲しい…🤔 pic.twitter.com/EkqKfyasHI おき@COYOTE 3DCG STUDIO @yoru_3dcg 3DCG・ゲーム業界の人です。 クリエイターさんと関わるお仕事をしてます。 趣味:Blender/VR VRCHATにたまにいます。 ※ツイートは個人の見解であり、所属組織とは関係ありません。 https://t.co/G7MkqcciMX
Photoshopなどのデザインソフトにある「乗算」「スクリーン」「焼き込みカラー」「覆い焼きカラー」など、各描画モードがどのように機能するかを解説します。 それぞれの違いがよく分からない、どんな効果があるのか分からないという人に、これを読めば描画モードでどれを使うか迷うことはなくなります。 Blending Modes by Dan Hollick (@DanHollick) 下記は各ポイントを意訳したものです。 ※当ブログでの翻訳記事は、元サイト様にライセンスを得て翻訳しています。 はじめに 描画(ブレンディング)モードとは 各描画(ブレンディング)モードについて解説 はじめに 見た目が思い通りになるまで、描画モードをいろいろ試していませんか? 描画モードの種類 この記事を読んでもあまり変わらないかもしれませんが、少なくとも「比較(明)」や「比較(暗)」を使用することはなくなるでしょう
4月23日、彗星のように現れたネット上のサービス、CoeFont STUDIO(コエ・フォント・スタジオ)は、誰でも無料で使える音声合成サービスということで、瞬く間に広がり、2日で累計ユーザー数が6万人を突破。すでに20万人を超えるところまで来ているようです。日本語でテキストを入力すれば、非常に滑らかな声でしゃべってくれ、その音声をユーザーは商用を含めて自由に利用できるという画期的ともいえるサービスとなっているのです。 このサービスを立ち上げたのは、なんと東京工業大学2年生、19歳の早川尚吾さん。株式会社Yellstonを立ち上げ、その新サービスとして、CoeFont STUDIOをスタートさせたのです。もちろん株式会社ですから、今後ビジネス展開をしていくことを目論んでいるわけですが、それはCoeFont STUDIOの延長線上にあるもので、世の中を大きく変えていく可能性もありそうです。先
こんにちは、Exploratoryの白戸です。 Appleは新型コロナウイルスの対策支援として、Appleマップでの経路検索をもとにした移動傾向のデータを公開しています。ところが、残念ながらこのデータはそのままでは簡単に可視化できるようなフォーマットになっておらず、ちょっとした加工を行う必要があります。 しかし逆に、加工の仕方さえわかってしまえばそれぞれの都市や地域の移動データを可視化することで、恐怖を煽るばかりのマスコミからは見えてこない現状を理解することができるようになります。 今回はこのAppleの移動傾向データを簡単に可視化できるようにするための基本的な加工方法を、みなさんと共有させていただければと思います。 データはこちらからダウンロードすることができます。 以下は「モダンでシンプルなUIを使ってデータサイエンスができる」Exploratoryを使って、「日本で最も自粛している都
ITジャーリストAyanoさんという人がいて、彼女はすごい人なのである。 何がすごいかというと、ものすごいダイエットに成功した人なのだ。 【大会まで1週間】 秀子先生の緻密な指導と仲間の理解と応援のおかげでここまで来ることが出来ました❗️ のこり1週間悔いのないよう最後まで全力でやり抜きます💪 みなさん応援よろしくお願いします‼️#フィットネスビキニ https://t.co/7lmPdxWeHs pic.twitter.com/2ICgNdXnOK — ITジャーナリスト富永彩乃 Ayano Tominaga (@AyanoTDO) July 23, 2017 そんなAyanoさんと初めて会った時、せっかくだから一緒に写真を撮りましょう、ということになったのだが、Ayanoさんは「だったらこのカメラで撮って下さい」と、中国製の自撮りに特化したスマホが出てきた。プリクラのように、少し目が
「眠らない星」(高知県仁淀川町)。撮影後のコンポジット合成ではない、現場でのいわゆる「一発撮り」の長時間露光による作品。全紙に引き伸ばしてもまったく問題ない画質が得られた。長時間露光でのノイズの発生は十分少なく、デジタルカメラによるバルブ撮影でもここまで写ることを知ってほしい。撮影:米美知子■キヤノンEOS 5D MarkIII・EF8-15mm F4L フィッシュアイ USM・ISO200・絞りf4・40分 この記事の写真をすべて見る 「インスタ映え」写真、見飽きました。この言葉が2017年の流行語大賞に選ばれてから2年。どこかで見たことがあるような写真ばかりが並び、写真家の方々からも、必ずと言っていいほど「レタッチしすぎ」という声があがります。「自然」を撮っているのに「不自然」に見える。 そこで『アサヒカメラ2019年9月号』では「風景写真があぶない!『レタッチしすぎ」の罠』と題し、氾
Innovative Tech: このコーナーでは、テクノロジーの最新研究を紹介するWebメディア「Seamless」を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。 武漢大学と湖北工業大学からなる中国の研究チームが開発した「AnimeGAN: A Novel Lightweight GAN for Photo Animation」は、現実世界で撮影した写真をアニメ風の画像に高速変換する技術だ。深層学習を用いた軽量なフレームワークで、宮崎駿監督や新海誠監督の作品のようなアニメ風の高品質画像に仕上げることができる。 高品質なアニメ作品を制作するためには、線や質感、色、影などを入念に考慮する必要があり、制作に手間と時間がかかる。現実世界の写真を自動的に高品質なアニメ画像に変換できる技術があれば、効率化の観点から重要視されるだろう。 今回の手法では、実写からア
Photoshopであらゆる被写体、画像全体を数クリックで金ピカのゴールドにする無料アクションを紹介します。 数クリックとしたのは被写体の選択操作で、金ピカにするのはわずか1クリック。 簡単に、目映いばかりの黄金エフェクトを楽しめます。 Free Photoshop Action to Turn Anything into Gold in Photoshop ダウンロードボタンをクリックすると、オーバーレイが表示され、それを閉じて、再度ダウンロードボタンをクリックすると、ダウンロードできます。 インストール方法は、Photoshopのアクションパネルで「アクションを読み込み」から、ダウンロードした「Spoon Graphics Gold Effect.atn」を指定するだけです。
「Excelデータをプログラムで扱うのなら、VBA(Visual Basic for Applications)を使うべし」。多くの人はそう思っているでしょう。もちろんVBAはMicrosoft Officeのソフトを操るのにとても便利なプログラミング言語ですが、弱点もあります。 その1つが、Officeにしばられてしまうこと。業務に必要なデータ量がExcelや「Access」のカバーする範囲で収まらなくなったら、もう扱えません。 また互換性の問題から、Windows上で書かれたVBAのソースコードは基本的に、macOSやLinuxでは動かせません。VBAはプログラミング初心者にとって理解しやすい一方で、コードが冗長になりがちという側面もあります。 今からプログラミングを学んで業務を自動化したいなら、筆者はPythonをお薦めします。Pythonはシンプルで勉強しやすく、ライブラリーが豊富
シロワニさん氏が趣味で開発したというWindows向けのAIトークソフト「COEIROINK(コエイロインク)」が無料で公開されています。COEIROINKは連絡不要で商用利用もOKなフリー素材キャラクター・つくよみちゃんに好きなテキストを誰でも簡単に読み上げてもらうことが可能なので、自作アニメやボイスドラマのキャラクターボイス、実況動画や解説動画のナレーションなどの作成にお役立ちです。 COEIROINK https://coeiroink.com/ ✨COEIROINKリリース✨ 無料の音声合成エンジン「#COEIROINK」が登場! 文章を読み上げます! ■公式サイト⇒https://t.co/66YStrCYu0 ■COEIROINK開発:シロワニさん様 @shirowanisan ■VOICEVOX開発:ヒホ様 @hiho_karuta 第1弾は「#つくよみちゃん」! 商用利用O
写真をアニメっぽい画像に変換する「AnimeGAN」に改良を加えたオープンソースプロジェクト「AnimeGANv2」を手軽に試せるデモサイトが公開されています。 AnimeGANv2 - a Hugging Face Space by akhaliq https://huggingface.co/spaces/akhaliq/AnimeGANv2 これは、「AnimeGANv2」のPython向け機械学習フレームワークである「PyTorch」版をもとに、機会学習体験UIを作成するGradioで作られたデモで、基本的には人の顔が写ったポートレート写真の変換を行います。 サイト上部にある「Drop Image Here - or - Click to Upload」と書かれたエリアに変換したい写真をドラッグ&ドロップするか、エリアをクリックしてエクスプローラーから変換したい写真をアップロードし
当サイトでは、Photoshopの新しい機能テクニックをつかった最新チュートリアル、作り方を定期的にまとめて紹介しています。 この記事では、2021年のあいだに公開された、特に確認しておきたいPhotoshopのデザインチュートリアル、つくり方をまとめてご紹介します。 10月のアップデートで機能が大幅強化されるなど、進化が止まらないフォトショップ。 人気のレトロエフェクトにはじまり、ボタンひとつで完成のお手軽写真アクション、写真合成テクニックなど、デザイナーが覚えておくと便利なテクニックなどが多く公開された年となりました。 2021年公開のIllustratorチュートリアル、つくり方と一緒にいかがでしょう。 【総まとめ】2021年公開のすごいIllustratorチュートリアル、作り方厳選まとめ まずはAdobe公式サイトより、Photoshopを無料でダウンロードし、7日間のお試し期間
はじめに 以下のツイートが500いいねを超えましたので解説記事を書きます。 デモ&ソースコード CodePen に完成品のデモとソースコードを置いてあります。 グリッチとは 元々は「一過性の障害」という意味ですが、映像の世界ではしばしば「映像の乱れ」という意味で用いられます。ホラーやサイバーなどでよく見られる演出の一つ。 https://www.google.com/search?q=glitch&tbm=isch RGB ずらしとは 色収差、RGB シフト、RGB split (RGB 分割) など、さまざまな言い方がありますが、要するに本来光の三原色である Red、Green、Blue がズレることなく重なって映像を映し出すところ、それがズレた状態で表示されることです。 グリッチエフェクトと一緒に用いたり、場合によっては色ズレも含めてグリッチと言ったりしますので、今回も合わせて実装する
こんにちは ハタ です。 今回は以前iOSのクライアントサイドで実装していた通知ぼかし機能をサーバサイド(配信サーバ)上に再実装した事を書きたいなと思います 今回はかなり内容を絞りに絞ったのですが、長くなってしまいました、、 目次機能があったのでつけてみました、読み飛ばして読みやすくなった(?)かもしれません 目次 目次 通知ぼかし機能とは サーバサイド通知ぼかし プロトタイプの実装 苦労の始まり その1 画像処理速度 苦労の始まり その2 データ量 さらなる計算量の削減を求めて さらなる最適化へ Halide の世界へ 簡単な halide の紹介 苦労の始まり その3 いざ リリース リリースその後 We are hiring! 通知ぼかし機能とは 通知ぼかし機能は、ミラティブ上での配信中に写り込んでしまったiOSの通知ダイアログをダイアログの中身を見えないようにぼかし処理をしてあげる
AIベンチャーのラディウス・ファイブ(東京都新宿区)は7月29日、AIを使って写真からアニメ用の美術背景を生成するサービス「Anime Art Painter」を始めた。写真をアップロードするだけでアニメ風の背景に変換できる。1枚の画像から4種類の背景を30秒程度で生成する。背景の生成は無料だが、画像のダウンロードは有料で料金は480円から。 大まかには、ディープラーニングを使い、写真のテクスチャ(質感)を簡略化。アニメやイラストに使われるような画風に変換する仕組みという。建物や夜景、山などの自然物、近距離で撮影した物体、屋内の背景など、物体に応じてテクスチャの変換や色合いを調整するという。生成される4種類の画像は、アニメでよく使われるような水彩風の絵を2種類と、べた塗りに近いアニメ風の絵が2種類。 同社は現在のアニメ業界について「制作が2年待ちといわれるほど行き詰まっている」と指摘する。
ゲームやアニメに声を吹き込む声優が、「AIで自分の声を再現する合成音声を生成することを認める」という条項を含む契約書にサインを求められるケースが増えていると、アメリカの声優や組合がIT系ニュースサイトのMotherboardで訴えています。声優たちは、こうした契約がまん延することで声優業界全体が大きなダメージを受ける可能性を危惧しています。 ‘Disrespectful to the Craft:’ Actors Say They’re Being Asked to Sign Away Their Voice to AI https://www.vice.com/en/article/5d37za/voice-actors-sign-away-rights-to-artificial-intelligence AIで声を再現する技術は急速に進歩しており、個人でも本人の音声データを学習させた
誰かの「やめた」ことに焦点を当てるシリーズ企画「わたしがやめたこと」。今回は、タレントのぱいぱいでか美さんに寄稿いただきました。 でか美さんがやめたのは、誰かを見返すためにコンプレックスを解消しようとすること。そして、その後コンプレックスと向き合う上で過度な「写真の加工をやめた」こと。 自分の中でコンプレックスを解消するためにやっていたことが、気付けば「コンプレックスを浮き彫りにさせていた」というでか美さん。 体験を経て気付いたことは「コンプレックスがあってもいい」「無理に完璧になろうとしなくてもいい」ということだったそうですーー。 *** くっそー!見返してやる! ドラマや漫画なんかでよく聞く台詞のようで、実は現実でも使われがちなのではないでしょうか。信じてた人から裏切られた時、好きな人に振られた時、ライバルに負けた時、理不尽な目に遭った時、などなど。わざわざ口に出す人はいないけど心の中
個人で発注できる、さまざまな加工を試してみるシリーズ企画を始めます。1~数個、お小遣いの範囲でどんなことができるのか? 国内、国外問わず、メジャーなものからニッチなものまで、個人のものづくりの幅を広げてくれる加工サービスを使ってみます。 今回は金属3Dプリントを使ってキーキャップの金型を作ってみました。金属加工の発注はお高いイメージがありますが、価格は? 使える精度なのか? など実際に依頼して確かめてみました。 金型を金属3Dプリントで作ってみたい パーツ設計時、強度を持たせたい、耐熱性がほしい、質感を出したいなどの理由で金属を使いたいことがあります。ただ、金属加工の発注は、個人でやるにはかなりお高いイメージ。ところが「最近は金属3Dプリントを中国に発注すると結構安くできる」と聞いて、気になっていました。 その時は作りたいものがなく保留していたのですが、できました、作りたいもの。キーキャッ
この世界には電磁波(Electromagnetic waves)という、空間を伝わるある種のエネルギーの波があることが知られています。 電磁波には波長(Wavelength)というものがあります。文字通り、「波の長さ」です。これは波が一回振動したときの距離で、山から山、または谷から谷までの長さということになります。 さまざまな波長の電磁波があります。電磁波の波長の単位はm(メートル)ですが、波長が数千km(キロメートル)に及ぶものから、十億分の1mm(ミリメートル)以下のものまで、さまざまな種類があります。 ひょっとすると電磁波という呼び方をしないので、気づいていないかもしれませんが、電磁波はとても身近なものです。たとえば……。 ・ラジオやテレビ、Wi-Fi、Bluetooth、レーダーなどの「電波」も電磁波 ・電子レンジで食べ物を温める「マイクロ波」も電磁波 ・病院でレントゲン写真を撮る
もしも、フォトショップをつかって、写真から不要な人やものを消したいとき、あなたならどうしますか。 さまざまな方法がありますが、もっとも手軽なのが「コンテンツに応じた塗りつぶし」でしょう。 シンプルな写真では問題ないのですが、特に複雑な写真では、フォトショップにあまり良い結果を期待することができません。 今回は、フォトショップと無料のAIツールをつかって、どんな写真でも不要な人やものを消す新しい写真加工テクニックをご紹介します。 フォトショップ「コンテンツに応じた塗りつぶし」の現状 まずは、フォトショップの「コンテンツに応じた塗りつぶし」をつかって、どこまで消せるか試してみます。 こちらの写真の手前に立っている男性を、消してみましょう。 加工をはじめる前に、もとの写真をコピーして保存しておくと、もしものときのバックアップになります。 ここでは、「被写体の選択」ツールを使い、人物のみを切り抜き
[NAFNet] 機械学習で画像のノイズ除去、ブラー除去、超解像 [Denoise, Deblur, Super Resolution] 2022年5月7日土曜日 Artificial Intelligence NAFNet 概要 近年、画像復元(Image Resolution)技術は様々な進歩がみられていますが、システムの複雑さも増加しています。 NAFNetは、SOTAを達成しつつ、計算効率の高い単純なベースラインで構成される画像復元技術です。 NAFNetは、Sigmoid, ReLU, GELU, Softmaxなどの非線形活性化関数を使用せず、乗算で置き換えるか、削除することでベースラインを単純化しています。 このため、非線形活性化関数フリーなネットワークであることから、Nonlinear Activation Free NetworkでNAFNetと呼ばれています。 NAFN
地図情報の調査・制作・販売を行うゼンリンが2021年11月11日、社のツイッターで投稿した写真が誤解を招くものだったとして、「心よりお詫び申しあげます」と謝罪した。 同社は10日のツイッターで、北海道函館市の五稜郭の写真を投稿。「秋の五稜郭がこんなにも美しいとは」と伝えていたが、実際は色合いを加工したものだったという。 「誤解と過度な期待が生まれるからやめてほしい」 ゼンリンが投稿した五稜郭の写真は、紅葉によって木々が橙や赤に染まった、幻想的な雰囲気だ。この投稿には、絶景に感動したとのコメントが相次ぎ、10万件近くの「いいね!」がつくほどの注目を集めた。 ゼンリンは続くツイートで「こちらは4日前の五稜郭ですが、昨日の雨と風で、少し葉が落ちてしまったそうです」とも伝えていたが、投稿を見たユーザーの一部から、紅葉の色を強調する加工が写真に施されているのではないか、という指摘が寄せられた。 「極
無料で提供されているオープンソースの音声編集ソフトウェア「Audacity」をフォークし、ブラウザ上で動作するようにした「Wavacity」が公開されています。 Wavacity https://wavacity.com/ 上記のリンクにアクセスすると、以下のような画面が表示されます。本家のAudacityは表示言語を日本語に設定する必要がありますが、Wavacityは最初から日本語で表示されるので、日本語ネイティブユーザーにとってかなり取っ付きやすくなっています。 記事作成時点で最新バージョンとなる本家Audacity(v3.3.3)の画面が以下。 比較するとこんな感じ。スライダーを右に動かすとWavacityが、左に動かすとAudacityが表示されます。 楽曲ファイルをインポートするには「ファイル」から「開く」をクリックし、ファイルを選択します。 タイムライン上でドラッグすると、編集
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く