2024-09-11

ARM版macで、UTMのUbuntu22.04でWineを使ってみられなかった

技術日常

お久しぶりです。

今回は、Windows向けのアプリを動かせるWineを仮想環境で動かそうという試みです。

そもそもホストマシンにWineを入れればいいのでは。

単純にWineをインストールしてみる
UTMをemulateモードで動かして、Ubuntuをx64版で動かしてみようとした（失敗）
感想

単純にWineをインストールしてみる

環境

ホスト側のアーキテクチャと合わせて、aarch64版のubuntuを利用して進めます。

$ uname -a
Linux shikairo 5.15.0-118-generic #128-Ubuntu SMP Fri Jul 5 09:30:28 UTC 2024 aarch64 aarch64 aarch64 GNU/Linux

インストール（失敗）

arm版は書いてある通り、素直にUbuntu公式が提供しているパッケージをインストールしましょう。

The WineHQ repository only offers packages for AMD64 and i386. If you need the ARM version, you can use the Ubuntu packages.

公式パッケージは以下のものになります。

sudo apt install wine

インストールが完了して、wineを起動しようとすると以下のようなエラーメッセージが出ます。

it looks like wine32 is missing, you should install it.

wiki.winehq.org

エラーメッセージに従って、wine32をインストールしようにもパッケージが提供されていないようで、うまくいきません。

Package wine32 is not available, but is referred to by another package.

困りました…

qemuを利用して仮想環境の中でさらにx86環境をエミュレーションする

qemuを利用してエミュレーションする方法もあるようなので試してみます。

$ sudo apt-get install qemu qemu-user qemu-user-static binfmt-support debootstrap binutils

$ qemu-i386-static --version
qemu-i386 version 6.2.0 (Debian 1:6.2+dfsg-2ubuntu6.22)
Copyright (c) 2003-2021 Fabrice Bellard and the QEMU Project developers

が、wineがarm用のバイナリなのでうまくいかず…

$ qemu-i386-static /usr/bin/wine-stable
Error while loading /usr/bin/wine-stable: Exec format error

いずれにせよ、仮想環境の中でもう一段階仮想化するのは効率が悪いので避けたいですね。

UTMをemulateモードで動かして、Ubuntuをx64版で動かしてみようとした（失敗）

と言っておきながら、環境そのものを仮想化するという手段を検討してみます。

国内のミラー（Ubuntu Releases）からx64版のisoをダウンロードして、同じく公式の手順で進めてみます。

と思ったのですがGUIで動かすには重すぎて、全く進められませんでした。

コマンドは以下のものを実行すれば良いと思っています。

sudo wget -NP /etc/apt/sources.list.d/ https://dl.winehq.org/wine-builds/ubuntu/dists/jammy/winehq-jammy.sources

sudo apt update

sudo apt install --install-recommends winehq-stable

感想

時間がかかった割に実りが少ない作業になってしまいました…

趣味でなければシンプルにホストマシンにWineを入れるか、Windowsを仮想化して動かす方が良さそうです。

2024-08-21

OSS版のVOICEVOXで遊んでみた

技術

皆様は、Youtubeの動画は見られますでしょうか？

僕は良くずんだもんがゲーム実況したり、何かしらを解説してくれる動画を観ているのですが、自分でも喋らせてみようと思い、触ってみることにしました。

単純に動画を作るだけなら、以前触れたNoLangを使うのが近道だと思いますが、今回は自力で色々と試すことを目的としてやってみます。

動画作成を検討されている方は、以下の記事も併せて参照してください。

shikairo.hatenablog.com

VOICEVOXとは？
何をして遊ぶ？
OSS版のVOICEVOXを使う
- 環境構築
  - コアのインストール（失敗）
  - エンジンのインストール
感想

VOICEVOXとは？

VOICEVOXとは、「無料」で使える音声合成ソフトウェアです。

詳細は以下の公式ページを参照してください。

voicevox.hiroshiba.jp

何をして遊ぶ？

VOICEVOXには公式サイトで公開されているパッケージ版に加えて、Githubで公開されているOSS版があるようです。

今回は、こちらのOSS版を利用して環境を構築し、APIを利用して音声を合成してみようと思います。

github.com

OSS版のVOICEVOXを使う

環境構築

OSS版からの引用ですが、以下の3つのモジュールで構成されているようです。

VOICEVOX は役割に応じた 3 つのモジュール「エディター」「エンジン」「コア」で構成されています。VOICEVOX ソフトウェアはこの 3 つのモジュールを組み合わせて構成されていて、エディターはエンジンを参照し、エンジンはコアを参照しています。

今回は、このモジュールのうち、コアとエンジンを利用してみようと思います。

コアのインストール（失敗）

コアは音声合成をするために必要な部分のようです。

記事執筆時点では、mainブランチ(0.15系？)が工事中と書いてありますが、Readmeには最新のリリースを利用せよとの記載があるので、0.15.4を利用して進めていきます。

GitHub - VOICEVOX/voicevox_core: 無料で使える中品質なテキスト読み上げソフトウェア、VOICEVOXのコア

まずは、以下のコマンドを利用してダウンローダーをダウンロードし、実行します。

arm版Macを利用しているので、binaryはdownload-osx-arm64としています。

binary=download-osx-arm64 curl -sSfL https://github.com/VOICEVOX/voicevox_core/releases/latest/download/${binary} -o download
chmod +x download
./download

が、ダウンロード時に以下のようなエラーが発生してしまったため、ダウンローダーの実行がタイムアウトしているような気もするのですが、ファイルを都度ダウンロードしに行くように見えるので、今回は0.14.6にバージョンを下げて実行してみます。

Error: HTTP Error: request or response body error: error reading a body from connection: stream error received: unspecific protocol error detected

0.14.6のダウンローダを利用しても結局、最新版を取得しに行くようですね。

INFO 対象OS: osx
INFO 対象CPUアーキテクチャ: arm64
INFO ダウンロードデバイスタイプ: cpu
INFO ダウンロードvoicevox_coreバージョン: 0.15.4

この場合も同様にうまく動かなかったので、「Downloader を使わない場合」の手順で進めます。

以下のファイルをダウンロードしようとしました。

が、coreのダウンロードが中断してしまうようです…

ダウンロードがうまくいかないので、諦めてエンジンの方に進めていきます。

エンジンのインストール

先ほどはコアでダウンロードに失敗したので、諦めてDockerイメージが提供されているエンジンを利用します。

以下のリポジトリにアクセスして、書いてある通り実行するだけです。

読み上げのテキスト部分だけ変更して実行してみました。

このくらいの文字数ならおおよそ1秒程度で出力されるので、実用的ですね。

docker pull voicevox/voicevox_engine:cpu-ubuntu20.04-latest
docker run --rm -p '127.0.0.1:50021:50021' voicevox/voicevox_engine:cpu-ubuntu20.04-latest

echo -n "しかいろのブログへようこそ" >text.txt

curl -s \
-X POST \
"127.0.0.1:50021/audio_query?speaker=1"\
--get --data-urlencode text@text.txt \
> query.json

curl -s \
-H "Content-Type: application/json" \
-X POST \
-d @query.json \
"127.0.0.1:50021/synthesis?speaker=1" \
> audio.wav

github.com

感想

コアを使う合成はどこかでリベンジできればと思います。

Docker越しでも、それなりの速度で音声合成はできるので、ひとまず準備としてはOKかなと思います。

パッケージ版でもエンジンは起動するようなので、ややこしいことは抜きにしてやるならパッケージ版を入れるのが手っ取り早いですね。

2024-08-17

LINEのトークフォルダ機能がとても便利

日常

皆さんはLINEを使っていますか？

色々とありましたがなんだかんだ便利ですよね。

そんなLINEでとても便利な機能を見つけたのでシェアします。

LINEラボとは
トークフォルダ機能を使ってみる

LINEラボとは

今回の機能はこのLINEラボで提供されています。

LINEラボは、リリース前のLINEの機能を試用できるものになります。

特に利用申請などは不要で、設定を変更するだけです。

詳細は以下の公式ページを参照ください。

guide.line.me

トークフォルダ機能を使ってみる

さて、今回の本題となるトークフォルダ機能についてです。

トークフォルダ機能は「友だち」「グループ」「公式アカウント」「オープンチャット」の4つのカテゴリーにトークが整理されるものです。

設定方法は以下のリンクを参照してください。

guide.line.me

公式アカウントからのメッセージなどがかなり鬱陶しかったのですが、友達からのメッセージに絞ることができてかなり見やすくなりました。

この機能はラボに留めず、ぜひリリースしてほしいですね！

2024-08-14

天秤AIを触ってみた

AI 技術

色々と自然災害が多くなっていて、恐ろしいですね。

我が家も備蓄を見直しているところです。

日々の備えの大切さを改めて感じますね。

消防庁地震防災マニュアルによると3日分の水や食料が必要ということですが、具体的にどんなものが良いのだろうというのを考えるために、AIを活用してみようと思います。

中でも、少し前にXでも見かけていて試せていなかったAI自体の出力を比較できる天秤AIを使って、いろいろな角度から出力してもらおうと思っています。

※あくまで個人的な備蓄品の検討目的です。万人が備蓄すべきものとは限りませんのでご注意ください。

天秤AIとは？
早速使ってみる
- 利用に際しての注意事項
- 画像は生成できる？
まとめ

天秤AIとは？

GMOが提供するChatGPTやGeminiなどの生成AIに送るプロンプト（指示文）の日本語ポータルサイトのようです。

oshiete.ai

GMOといえば、レンタルサーバを提供していたり、あおぞら銀行をやっていたりと、手広くやっているイメージですが、AIのサービスも始めたんですね。

天秤AIは、教えてAI byGMOのアカウントを登録することで無料で利用できるようです。

Googleアカウントなどのソーシャルアカウントでのアカウント登録も可能で、ワンクリックで簡単にアカウント登録できます。

この記事の執筆時点では、ChatGPTだとGPT4oまで利用できるようです。

天秤AIにGPT4o Miniを実装しました｜Gemini 1.5 pro、Claude3.5 Sonnetも使えるAI同時実行サービス – 教えてAI byGMO サポートページ

早速使ってみる

ログインするとプロンプトの入力画面が表示されるので、左側のタブからいくつかプロンプトを入力したいAIを選択して、下側の入力欄にプロンプトを入力することで一括で表示してくれるようです。

入力例は以下のようになります。

あなたは防災に関するプロフェッショナルです。
注意深く考え、以下の質問に回答してください。

大人1人分の災害の備蓄にはどのようなものを用意すれば良いでしょうか？
箇条書きでリストアップしてください。

これは便利ですね！

出力内容をコピーすることができるし、入力も1万文字までできるようなので、この3つのAIの出力結果をさらに3つのAIに要約してもらいましょう。

まとめの入力例です。

ありがとうございます。

専門家3名から、それぞれ以下のような箇条書きの意見があるのですが、これらをまとめて、必要なものを再度箇条書きしてください。
3名からの意見は、それぞれ```で囲んでいます。

```

GPT4-oの出力結果

```

```

Gemini1.5Proの出力結果

```

```

Claude 3.5 Sonnet

```

おおよそ似たような出力結果になっているような感じがします。

擬似的にブレインストーミングしてもらって、最終的に集約するという使い方は意外とうまくいくのかもしれませんね。

利用に際しての注意事項

注意事項の記載があるため、確認しておきましょう。

AIは間違いを犯すことがあります。出力結果はよく確認してご利用ください。

多くのお客様にご利用いただくため、入力トークン数を制限しています。

ご利用状況により、1日あたりの実行数を制限する場合があります。

入力されたプロンプトは学習には利用されませんが、天秤AI byGMOのサービスの品質維持のためモニタリングをしています。

画像生成やファイルの入力が必要な場合は，各種AI提供元のサービスをご利用ください。

古い履歴は自動的に非表示になります。

また、プライバシーポリシーについては、

Googleプライバシーポリシーと利用規約が適用されます。

とのことですので、気になる方は確認の後、ご利用を検討してください。

もしかしたら、Googleアカウント連携している場合に表示されるものかもしれませんので、適宜読み換えて確認してください。

画像は生成できる？

注意事項によると、画像の生成はAI提供元のサービスを利用する必要があるようです。

が、天秤AIからリンクされている、教えてAIのプロンプトの検索カテゴリに「画像生成」があるので、ここからMidJourneyなどを利用できるようです。

検索結果 | 教えてAI byGMO

一例として、こちらのプロンプトをお借りして、鹿のアイコンを出力してもらいました。

🦜超絶オシャレな折り紙アイコン🦜 ～SNSやプレゼンをかっこよく魅せよう～ | 教えてAI byGMO

おしゃれでいい感じですね！

元のプロンプトは見られないようなので、プロンプトを作って公開してもマネされなさそうなのもいいですね（マネして作ってみようと思いましたがアテが外れました笑）。

まとめ

無料でこれだけの種類のAIを利用できるのはすごく便利ですね。

クレジットカードの登録なども不要なので、かなり気軽に始められると思います。

個人的には思いつきでやってみた、複数のAIに投げた結果を集約する使い方はなかなか便利なやり方なのではないかと思っています。

みんな思いつきそうな気はしますが…

また、公開されている他のユーザのプロンプトからAIとの対話を始めることもできるようで、プロンプトが思いつかない時には使ってみるのもいいかもしれません。

2024-07-17

NoLangに最近のAIの動向についてまとめ動画作ってもらった

AI 技術

最近はAIの動向が早くて恐ろしいですね。

その中でも、動画などのエンタメ領域はスピード感が早いのかなと思っています。

というわけで、話題になったのも少し前ですが、NoLangを使って、動画を作ってもらいました。

NoLangとは？
どんな動画が出来上がるの？
どんな感じで作れるの？
- 作り方
  - 出力した内容を改善してほしい場合
  - アバターを追加する場合
- 制限
感想

NoLangとは？

東京大学・東京大学大学院を卒業した創業メンバー５人で構成されている、Marvericks社が開発したサービスです。

Nolang は、テキストで質問を入力すると、回答内容を自動で読み上げる動画を生成するサービスです。

画像生成はもちろん、text2video, text2speechなど様々なAIを同時に体感できる新感覚の高速生成体験を提供します。

というもののようです。

Products | Mavericks, Inc.

どんな動画が出来上がるの？

百聞は一見にしかずということで、動画を見てください。

https://no-lang.com/video/be2ea1be-b34d-40ba-9904-34ea8d447c5f?type=vod

ずんだもんがいい感じに読み上げてくれていますね！

レイアウトも綺麗ですし、面白いかどうかは置いておいて、オチもちゃんとつけてくれるので、解説動画をサクッと作るのには向いていそうですね。

人間が必要な部分がどんどんと減っていきますね…

どんな感じで作れるの？

作り方

簡単にテキストを入力するだけで動画が生成されます。

出力した内容を改善してほしい場合

上記の動画に追加で対話形式で入力することで、以下のような動画が生成されます。

https://no-lang.com/video/c7d61f92-1105-4401-87ee-359197c71840?type=vod

なお、追加で実施する場合もコストがかかるので注意してください。

アバターを追加する場合

公式の説明通りに実施していただければ良いのですが、設定画面からPSDをアップロードすることで、アバター付きの動画を生成することができます。

アバターを追加することで、コストが10倍にはなりますが、解説動画っぽくするにはこれが近道ですね。

さて、実際どのような動画になるのかは、以下を参照してください。

https://no-lang.com/video/42c29474-dbb1-4b4b-a376-3d4bbc237cf5?type=vod

制限

2024/07/15時点では、無料プランでもデフォルト設定なら毎月20本の動画を作成することができるようです。

30秒の動画であればコストは5なので、アバターなしなら、40本の短い動画が作れると思えば、無料でも十分かもしれませんね。

右上にNoLangのロゴはつきますが、広告料としては安いと思います。

ただし、縦型動画を作るためには、月額2,980円の有料プランを契約する必要があるため、ShortsやTikTokを主戦場にする場合は、有料プランへの加入が必要そうですね。

感想

本当にエンタメ領域は人間がやることが少なくなるんだなぁと。

おそらく、今時点では粗製濫造になりそうですが、もう少し発展したら人間が作るコンテンツよりも精度が高く、興味深い内容で溢れそうです。

君たちはどう生きるか。という問いかけがありましたが、本当にどう生きるか考えて生きていないと、価値を生み出すことが難しい時代になっていきますね。

2024-06-09

GoogleアシスタントからSwitchBotのシーンを選択できるようになっていた

日常トラブルシューティング

以前、以下のような記事を書いたと思うのですが、その際は、カスタムアクションにテキスト入力で実行してもらうような方法を記載していました。

shikairo.hatenablog.com

SwitchBotのサポートもGoogle Assistantにてシーンを音声操作する(シーン3.0編)にあるように、カスタムアクションにテキストを入力する方法で記載されています。

Google アシスタントで日々のルーティンやタスクを自動化する - Android - Google アシスタントヘルプにも詳細は書いていないのですが、「スマートホームデバイスを調整する」項目の中に、シーンが追加されており、そのシーンにSwitchBotのシーンが連携されているので、それを選択するだけで簡単に設定することができるようです！

これに気づく前は、デバイス名がうまく認識されずにアクションが実行できないこともあってストレスだったのですが、かなり気軽に設定できるようになって嬉しいです。

2024-05-12

SunoAIにブログのテーマソングを作ってもらった

AI 技術

GWも終わって、ぼうっと動画を見ていたら、Youtuberが面白そうなことをしていたので、今更ながら触ってみました。

SunoAIとは？
- Suno凄い
どうやってテーマソングを作っていく？
- Bingに歌詞を作ってもらおう
- SunoAIに歌ってもらおう
感想

SunoAIとは？

誰でも凄い楽曲を作れる生成AIとのことです。

suno.com

Googleアカウントなどで無料のアカウントを登録することで、毎日50クレジットが付与されます。

歌詞ひとつに対して、10クレジットで2曲生成されるので、無料アカウントだと実質5つの歌詞に対して10曲生成できる形になります。

ただし、制限があるようで、曲の長さは2分までになるようです。

Suno AI - Wikipediaによると、Microsoftと提携していて、CopilotにもSunoが提供されているようです。

もしかしたら、Bingから直接楽曲を生成できるようになるかもしれませんね！

Suno凄い

さらにWikiを見ていて気づいたのですが、文章から発話を生成するAIもOSSとして公開しているようです。

GitHub - suno-ai/bark: 🔊 Text-Prompted Generative Audio Model

Usage in Pythonにpizza.webmというサンプル音声があるのですが、めちゃくちゃ自然な発話ですね…

歌わせることができるのだから、当然発話は普通にこなせるということだとは思うのですが、いやはや、感動しています。

どうやってテーマソングを作っていく？

Bingに歌詞を作ってもらおう

自分で作るのも大変なので、以下のようなプロンプトをBingに投げ込んで、歌詞を生成してもらいました。

ブログのイメージにあった歌詞を生成してください。

このブログでは、エンジニアの鹿色がIT技術を追いかけていく内容を書いています。
主なカテゴリは、技術・日常・トラブルシューティングです。

以下のような形式で出力してください。

[Verse]
イントロの歌詞

[Chorus]
サビの歌詞

[Verse]や[Chorus]は配下の歌詞がどの部分に当たるかをSunoAIが解釈して、いい感じにしてくれる命令となります。

他にもいろいろな命令があるようですが、Verse and Chorus – Suno.wikiのリンクを参考に組み合わせてみてください。

なお、[Sad Verse]などでイメージを変更したり、[Gospel Choir]のようなメタタグを指定することで、ボーカルのイメージを変更することもできるようです。

BingはGPT-4を無料で使わせてくれるので、ちゃんと構造を解釈していい感じの歌詞を作ってくれますね。

[Verse]
コードの海を泳ぎ続け
バグと戦う日々の中で
キーボードは剣、知識は盾
鹿色のエンジニア、未来を切り開く

[Chorus]
リファクタリングの風に乗せ
最適化の光を追いかけて
日常も技術もトラブルも
すべてを乗り越えて、新しい世界へ

ちなみに、タイトルは「デジタルの海を越えて」ということでした。

Style of Musicに好きなスタイルを入れれば、そのスタイルで生成されます。

今回は、animeを指定しました。

SunoAIに歌ってもらおう

まずは聴いていただければと思います。

デジタルの海を越えて by @fashionforwardcompression122 | Suno

いい感じだと思いませんか？

気をつける点としては、漢字はうまく読めないものがあるので、そこはひらがなに直してあげる必要があるくらいです。

鹿色はもちろん読めなかったのでひらがなに直して再生成しました笑

感想

めちゃくちゃいい感じの曲ができてびっくりしています。

インストだけならまだしも、ボーカルもしっかりと歌ってくれて、進歩すごすぎない？という感じです。

無料でここまでできると、自分は何を作ればいいんだろうなぁと、作曲家でもないのになんだか悩んでしまいますね笑

ちなみに、もっと曲を作るぞ！となった場合に、有料プランでも月額10$で月に500曲、30$で月に2000曲と、円安で少し高い感じはしますが、こんな曲を作ってくれるなら、課金して遊ぶのも楽しそうですね。

SunoAIだけでなく、UdioやStable Audioなど、他にも音楽の生成AIがあるようなので、自身の気にいる分野が得意なものを探すのも楽しいかもしれませんね。